Как оценить доверительный интервал площади
Оценка доверительного интервала площади — это задача статистического анализа, возникающая, например, при измерении физической площади (земельного участка, сечения органа на снимке, площади под кривой и др.), когда измерения подвержены случайной ошибке. Под "площадью" может пониматься как геометрическая площадь, так и метрика вроде площади под ROC-кривой (AUC). В любом случае цель — оценить диапазон значений, в который с заданной вероятностью (например, 95%) попадёт истинная площадь.
🔹 Общая формулировка
Пусть:
-
Есть выборка оценок площади: A₁, A₂, ..., Aₙ;
-
Или есть способ сэмплирования площади (например, с бутстрапом, измерениями, моделированием).
Задача: построить доверительный интервал (CI) для неизвестного истинного значения площади μ.
🔹 Подходы к оценке доверительного интервала
1. Аналитический метод (если выборка и распределение известны)
Если у нас есть независимая выборка оценок площади {A₁, ..., Aₙ} и можно предположить, что эти значения приблизительно нормально распределены, используем классическую формулу CI:
CI=Aˉ±zα/2⋅sn\\text{CI} = \\bar{A} \\pm z_{\\alpha/2} \\cdot \\frac{s}{\\sqrt{n}}
Где:
-
\bar{A} — средняя площадь;
-
s — выборочная стандартная ошибка;
-
n — размер выборки;
-
z_{\alpha/2} — квантиль стандартного нормального распределения (например, 1.96 для 95%).
Пример:
-
Измерения площади участка по 30 повторным наблюдениям;
-
Средняя = 100 м², стандартное отклонение = 5 м²;
-
Тогда 95% CI ≈ [100 - 1.96·(5/√30), 100 + 1.96·(5/√30)].
2. Доверительный интервал для AUC (площади под ROC)
Если задача касается метрики AUC (Area Under Curve) в машинном обучении:
📌 Метод Делонга (DeLong)
-
Это непараметрический метод, использующий ковариации между оценками предсказаний.
-
Применим, когда есть предсказания для двух классов (положительного и отрицательного).
-
Вычисляет стандартную ошибку AUC, далее строится CI:
CI=AUC±zα/2⋅SE\\text{CI} = \\text{AUC} \\pm z_{\\alpha/2} \\cdot SE
Этот метод реализован в sklearn (через sklearn.metrics.roc_auc_score) + в scipy, R и др.
3. Бутстрап-метод
Это наиболее универсальный метод, подходящий при неизвестном распределении, сложных функциях площади или малой выборке.
📌 Шаги бутстрапа:
-
Имеется набор данных или способ вычисления площади: например, модель выдаёт AUC по предсказаниям.
-
Повторяем B раз (обычно B = 1000–10000):
-
Ресемплируем исходные данные с возвращением;
-
Пересчитываем площадь (геометрическую или AUC);
-
Сохраняем результат.
-
-
Получаем распределение оценок площади: A₁*, A₂*, ..., A_B*.
-
Из них строим доверительный интервал:
- Перцентильный подход (обычный):
CI95%=[2.5-й перцентиль, 97.5-й перцентиль]\text{CI}_{95\%} = [\text{2.5-й перцентиль},\ \text{97.5-й перцентиль}] - BCa-интервал — улучшенная версия с коррекцией смещения (bias) и ускорения (acceleration), особенно важна при асимметричном распределении бутстрап-оценок.
- Перцентильный подход (обычный):
Применяется и для AUC, и для физической площади, полученной из изображений, траекторий, сетки и т.д.
4. Байесовский подход
Если имеется вероятностная модель измерения площади, можно использовать априорное распределение + байесовскую апостериорную оценку:
-
Задать априорное распределение площади (например, μ ~ N(100, 20²)).
-
На основе данных получить апостериорное распределение.
-
Взять 2.5% и 97.5% квантили из этого распределения — они и будут доверительным интервалом.
Применяется в задачах с нечеткими или вероятностными источниками измерения (например, в медицине, астрофизике, геоинформатике).
🔹 Как измеряют площадь в практических задачах
📌 Геометрические измерения (например, площадь поля или здания)
-
Вход: координаты вершин многоугольника, изображения (например, спутниковые снимки), lidar-данные;
-
Измерения могут быть с шумом (датчики, картографическая погрешность);
-
Повторное измерение или бутстрап по точкам или изображениям → получение распределения площади → доверительный интервал.
📌 В медицине (например, площадь опухоли)
-
Площадь извлекается из сегментированных изображений;
-
Существует погрешность ручной разметки;
-
Можно бутстрапировать по пикселям, маскам, сегментаторам, чтобы оценить интервал для площади.
📌 AUC / AUROC в ML
-
Расчёт AUC даёт точку;
-
Для CI используют бутстрап, метод Делонга или кластерные бутстрапы при зависимостях между наблюдениями.
🔹 Варианты в Python (на примере AUC)
from sklearn.utils import resample
from sklearn.metrics import roc_auc_score
import numpy as np
\# Исходные данные
y_true = ...
y_score = ...
\# Бутстрап
n_iterations = 1000
auc_scores = \[\]
for i in range(n_iterations):
indices = np.random.choice(len(y_true), len(y_true), replace=True)
if len(np.unique(y_true\[indices\])) < 2:
continue # AUC невозможно рассчитать, если нет обоих классов
auc = roc_auc_score(y_true\[indices\], y_score\[indices\])
auc_scores.append(auc)
\# Доверительный интервал
lower = np.percentile(auc_scores, 2.5)
upper = np.percentile(auc_scores, 97.5)
🔹 Когда использовать какой метод?
Метод | Подходит для | Условия |
---|---|---|
z-интервал (аналитический) | Простые случаи с нормальностью | Известно или предполагается нормальное распределение, достаточно большой n |
--- | --- | --- |
Бутстрап | Любые случаи | Универсален, особенно при малом n или нестандартных функциях |
--- | --- | --- |
Метод Делонга | AUC | Предсказания по классам, не зависит от бутстрапа |
--- | --- | --- |
Байесовский подход | Нечёткие/вероятностные задачи | Наличие априорной информации и байесовская модель |
--- | --- | --- |
Таким образом, способ оценки доверительного интервала площади выбирается исходя из источника данных, характера погрешности, цели анализа и доступных вычислительных ресурсов.