Как оценить доверительный интервал площади


Оценка доверительного интервала площади — это задача статистического анализа, возникающая, например, при измерении физической площади (земельного участка, сечения органа на снимке, площади под кривой и др.), когда измерения подвержены случайной ошибке. Под "площадью" может пониматься как геометрическая площадь, так и метрика вроде площади под ROC-кривой (AUC). В любом случае цель — оценить диапазон значений, в который с заданной вероятностью (например, 95%) попадёт истинная площадь.

🔹 Общая формулировка

Пусть:

  • Есть выборка оценок площади: A₁, A₂, ..., Aₙ;

  • Или есть способ сэмплирования площади (например, с бутстрапом, измерениями, моделированием).

Задача: построить доверительный интервал (CI) для неизвестного истинного значения площади μ.

🔹 Подходы к оценке доверительного интервала

1. Аналитический метод (если выборка и распределение известны)

Если у нас есть независимая выборка оценок площади {A₁, ..., Aₙ} и можно предположить, что эти значения приблизительно нормально распределены, используем классическую формулу CI:

CI=±/2sn\\text{CI} = \\bar{A} \\pm z_{\\alpha/2} \\cdot \\frac{s}{\\sqrt{n}}

Где:

  • \bar{A} — средняя площадь;

  • s — выборочная стандартная ошибка;

  • n — размер выборки;

  • z_{\alpha/2} — квантиль стандартного нормального распределения (например, 1.96 для 95%).

Пример:

  • Измерения площади участка по 30 повторным наблюдениям;

  • Средняя = 100 м², стандартное отклонение = 5 м²;

  • Тогда 95% CI ≈ [100 - 1.96·(5/√30), 100 + 1.96·(5/√30)].

2. Доверительный интервал для AUC (площади под ROC)

Если задача касается метрики AUC (Area Under Curve) в машинном обучении:

📌 Метод Делонга (DeLong)

  • Это непараметрический метод, использующий ковариации между оценками предсказаний.

  • Применим, когда есть предсказания для двух классов (положительного и отрицательного).

  • Вычисляет стандартную ошибку AUC, далее строится CI:

CI=AUC±/2SE\\text{CI} = \\text{AUC} \\pm z_{\\alpha/2} \\cdot SE

Этот метод реализован в sklearn (через sklearn.metrics.roc_auc_score) + в scipy, R и др.

3. Бутстрап-метод

Это наиболее универсальный метод, подходящий при неизвестном распределении, сложных функциях площади или малой выборке.

📌 Шаги бутстрапа:

  1. Имеется набор данных или способ вычисления площади: например, модель выдаёт AUC по предсказаниям.

  2. Повторяем B раз (обычно B = 1000–10000):

    • Ресемплируем исходные данные с возвращением;

    • Пересчитываем площадь (геометрическую или AUC);

    • Сохраняем результат.

  3. Получаем распределение оценок площади: A₁*, A₂*, ..., A_B*.

  4. Из них строим доверительный интервал:

    • Перцентильный подход (обычный):
      CI95%=[2.5-й перцентиль, 97.5-й перцентиль]\text{CI}_{95\%} = [\text{2.5-й перцентиль},\ \text{97.5-й перцентиль}]
    • BCa-интервал — улучшенная версия с коррекцией смещения (bias) и ускорения (acceleration), особенно важна при асимметричном распределении бутстрап-оценок.

Применяется и для AUC, и для физической площади, полученной из изображений, траекторий, сетки и т.д.

4. Байесовский подход

Если имеется вероятностная модель измерения площади, можно использовать априорное распределение + байесовскую апостериорную оценку:

  1. Задать априорное распределение площади (например, μ ~ N(100, 20²)).

  2. На основе данных получить апостериорное распределение.

  3. Взять 2.5% и 97.5% квантили из этого распределения — они и будут доверительным интервалом.

Применяется в задачах с нечеткими или вероятностными источниками измерения (например, в медицине, астрофизике, геоинформатике).

🔹 Как измеряют площадь в практических задачах

📌 Геометрические измерения (например, площадь поля или здания)

  • Вход: координаты вершин многоугольника, изображения (например, спутниковые снимки), lidar-данные;

  • Измерения могут быть с шумом (датчики, картографическая погрешность);

  • Повторное измерение или бутстрап по точкам или изображениям → получение распределения площади → доверительный интервал.

📌 В медицине (например, площадь опухоли)

  • Площадь извлекается из сегментированных изображений;

  • Существует погрешность ручной разметки;

  • Можно бутстрапировать по пикселям, маскам, сегментаторам, чтобы оценить интервал для площади.

📌 AUC / AUROC в ML

  • Расчёт AUC даёт точку;

  • Для CI используют бутстрап, метод Делонга или кластерные бутстрапы при зависимостях между наблюдениями.

🔹 Варианты в Python (на примере AUC)

from sklearn.utils import resample
from sklearn.metrics import roc_auc_score
import numpy as np
\# Исходные данные
y_true = ...
y_score = ...
\# Бутстрап
n_iterations = 1000
auc_scores = \[\]
for i in range(n_iterations):
indices = np.random.choice(len(y_true), len(y_true), replace=True)
if len(np.unique(y_true\[indices\])) < 2:
continue # AUC невозможно рассчитать, если нет обоих классов
auc = roc_auc_score(y_true\[indices\], y_score\[indices\])
auc_scores.append(auc)
\# Доверительный интервал
lower = np.percentile(auc_scores, 2.5)
upper = np.percentile(auc_scores, 97.5)

🔹 Когда использовать какой метод?

Метод Подходит для Условия
z-интервал (аналитический) Простые случаи с нормальностью Известно или предполагается нормальное распределение, достаточно большой n
--- --- ---
Бутстрап Любые случаи Универсален, особенно при малом n или нестандартных функциях
--- --- ---
Метод Делонга AUC Предсказания по классам, не зависит от бутстрапа
--- --- ---
Байесовский подход Нечёткие/вероятностные задачи Наличие априорной информации и байесовская модель
--- --- ---

Таким образом, способ оценки доверительного интервала площади выбирается исходя из источника данных, характера погрешности, цели анализа и доступных вычислительных ресурсов.