Доверительный интервал

Автор: Leandro Alegsa

18-01-2022 18:30

В статистике доверительный интервал - это особая форма оценки определенного параметра. При этом методе вместо одного значения параметра дается целый интервал допустимых значений, а также вероятность того, что реальное (неизвестное) значение параметра будет находиться в этом интервале. Доверительный интервал основан на наблюдениях из выборки и, следовательно, отличается от выборки к выборке. Вероятность того, что параметр окажется в интервале, называется уровнем доверия. Очень часто он указывается в процентах. Доверительный интервал всегда указывается вместе с уровнем доверия. Люди могут говорить о "95% доверительном интервале". Конечные точки доверительного интервала называются доверительными границами. Для данной процедуры оценки в данной ситуации, чем выше уровень доверия, тем шире будет доверительный интервал.

Расчет доверительного интервала обычно требует предположений о характере процесса оценки - это в первую очередь параметрический метод. Одно из распространенных предположений заключается в том, что распределение совокупности, из которой взята выборка, является нормальным. Поэтому доверительные интервалы, рассмотренные ниже, не являются надежной статистикой, хотя в них можно внести изменения для повышения надежности.

Значение термина "уверенность"

Термин "уверенность" имеет аналогичное значение в статистике, как и в обычном употреблении. В обыденном употреблении утверждение о 95% уверенности в чем-либо обычно воспринимается как указание на фактическую уверенность. В статистике утверждение о 95% уверенности просто означает, что исследователь увидел один возможный интервал из большого числа возможных, из которых девятнадцать из двадцати интервалов содержат истинное значение параметра.

Практический пример

A factory assembly line fills margarine cups to a desired 250g +/- 5g

Машина наполняет чашки маргарином. В данном примере машина настроена таким образом, что содержимое чашек составляет 250 г маргарина. Поскольку машина не может наполнить каждую чашку ровно 250 г, содержимое отдельных чашек имеет некоторый разброс и считается случайной переменной X. Предполагается, что этот разброс нормально распределен вокруг желаемого среднего значения 250 г со стандартным отклонением 2,5 г. Чтобы определить, достаточно ли откалибрована машина, случайным образом выбирается выборка из n = 25 стаканчиков с маргарином, и стаканчики взвешиваются. Вес маргарина составляет X₁, ..., X₂₅, случайная выборка из X.

Чтобы получить представление об ожидании μ, достаточно дать оценку. Подходящей оценкой является выборочное среднее:

μ ^ = X ¯ = n1 ∑ i = n 1X i . {\displaystyle {\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}. } ${\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}.$

В выборке представлены фактические веса x₁, ...,x₂₅, со средним значением:

x ¯ = ∑125 i = x125 i = грамм250.2 . {\displaystyle {\bar {x}}={\frac {1}{25}}\sum _{i=1}^{25}x_{i}=250.2\,{\text{грамм}}. } ${\bar {x}}={\frac {1}{25}}\sum _{i=1}^{25}x_{i}=250.2\,{\text{grams}}.$

Если мы возьмем другую выборку из 25 чашек, мы легко можем ожидать, что получим значения 250,4 или 251,1 грамма. Однако среднее значение выборки в 280 грамм будет крайне редким, если среднее содержание в чашках на самом деле близко к 250 граммам. Существует целый интервал вокруг наблюдаемого значения 250,2 среднего выборочного значения, в пределах которого, если среднее значение всей популяции действительно принимает значение в этом диапазоне, наблюдаемые данные не будут считаться особенно необычными. Такой интервал называется доверительным интервалом для параметра μ. Как рассчитать такой интервал? Конечные точки интервала должны быть вычислены по выборке, поэтому они являются статистическими данными, функциями выборки X₁, ..., X₂₅ и, следовательно, случайными величинами.

В нашем случае мы можем определить конечные точки, учитывая, что выборочное среднее X из нормально распределенной выборки также нормально распределено, с тем же ожиданием μ, но со стандартной ошибкой σ/√n = 0,5 (грамм). При стандартизации мы получаем случайную величину

Z = X ¯ - μ σ / n = X ¯ - μ {\displaystyle0.5 Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}} } $Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}$

зависит от оцениваемого параметра μ, но имеет стандартное нормальное распределение, не зависящее от параметра μ. Следовательно, можно найти числа -z и z, не зависящие от μ, где Z лежит между ними с вероятностью 1 - α, мерой того, насколько мы хотим быть уверенными. Мы принимаем 1 - α = 0,95. Таким образом, имеем:

P ( - z ≤ Z ≤ z ) =1 - α = 0.95. {\displaystyle P(-z\leq Z\leq z)=1-\alpha =0.95.\,} $P(-z\leq Z\leq z)=1-\alpha =0.95.\,$

Число z следует из кумулятивной функции распределения:

Φ ( z ) = P ( Z ≤ z ) = 1- α = 2,0.975 z = Φ -1 ( Φ ( z ) ) = Φ - 1( )0.975 = , 1.96{\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0.975,\\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}} ${\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0.975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}$

и мы получаем:

0.95 = 1- α = P ( - z ≤ Z ≤ z ) = P ( -1.96 ≤ X ¯ - μ σ / n ≤ )1.96 = P ( X ¯ -1.96 σ n ≤ μ ≤ X ¯ + σ1.96 n ) = P ( X ¯ - 1.96× ≤0.5 μ ≤ X ¯ + ×1.96 )0.5 = P ( X ¯ -0.98 ≤ μ ≤ X ¯ + ) 0.98. {\displaystyle {\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}\right)\\\[6pt]&=P\left({\bar {X}}-1.96\times 0.5\leq \mu \leq {\bar {X}}+1.96\times 0.5\right)\\\[6pt]&=P\left({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98\right)\end{aligned}}}. ${\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}\right)\\[6pt]&=P\left({\bar {X}}-1.96\times 0.5\leq \mu \leq {\bar {X}}+1.96\times 0.5\right)\\[6pt]&=P\left({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98\right).\end{aligned}}$

Это можно интерпретировать так: с вероятностью 0,95 мы найдем доверительный интервал, в котором будет встречаться параметр μ между стохастическими конечными точками

X ¯ - 0. 98 {\displaystyle {\bar {X}}-0{.}98\,} ${\bar {X}}-0{.}98\,$

X¯ + 0.98. {\displaystyle {\bar {X}}+0.98.\,} ${\bar {X}}+0.98.\,$

Это не означает, что существует 0,95 вероятность встретить параметр μ в рассчитанном интервале. При каждом повторном измерении будет получено другое значение среднего значения X выборки. В 95% случаев μ будет находиться между конечными точками, рассчитанными по этому среднему, но в 5% случаев не будет. Фактический доверительный интервал рассчитывается путем введения измеренных весов в формулу. Наш доверительный интервал 0,95 становится:

( x¯ - 0.98; x¯ + ) 0.98= ( 250.2-0.98 ; + 250.2)0.98 = ( ;249.22 ) 251.18. {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,} $({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,$

Поскольку искомое значение 250 μ находится в пределах приведенного доверительного интервала, нет оснований полагать, что машина откалибрована неправильно.

Вычисленный интервал имеет фиксированные конечные точки, где μ может находиться между ними (или нет). Таким образом, это событие имеет вероятность либо 0, либо 1. Мы не можем сказать: "с вероятностью (1 - α) параметр μ лежит в доверительном интервале". Мы знаем только, что при повторении в 100(1 - α) % случаев μ будет находиться в вычисленном интервале. Однако в 100α % случаев это не так. И, к сожалению, мы не знаем, в каком из случаев это произойдет. Поэтому мы говорим: "с уровнем доверия 100(1 - α) %, μ лежит в доверительном интервале. "

На рисунке справа показаны 50 реализаций доверительного интервала для заданного среднего значения популяции μ. Если мы случайно выберем одну реализацию, то с вероятностью 95% мы выберем интервал, содержащий параметр; однако нам может не повезти, и мы выберем не тот интервал. Мы никогда этого не узнаем; мы застряли с нашим интервалом.

Вертикальные отрезки представляют собой 50 реализаций доверительного интервала для μ.

Вопросы и ответы

В: Что такое доверительный интервал в статистике?

О: Доверительный интервал - это специальный интервал, используемый для оценки параметра, например, среднего значения популяции, дающий диапазон допустимых значений параметра вместо одного значения.

В: Почему вместо одного значения используется доверительный интервал?

О: Доверительный интервал используется вместо единственного значения для учета неопределенности оценки параметра на основе выборки и для того, чтобы дать вероятность того, что реальное значение параметра находится в пределах интервала.

В: Что такое уровень доверия?

О: Уровень доверия - это вероятность того, что оцениваемый параметр находится в пределах доверительного интервала, и часто дается в процентах (например, 95% доверительный интервал).

В: Что такое доверительные границы?

О: Доверительные границы - это конечные точки доверительного интервала, которые определяют диапазон допустимых значений для оцениваемого параметра.

В: Как уровень доверия влияет на доверительный интервал?

О: В данной процедуре оценки, чем выше уровень доверия, тем шире будет доверительный интервал.

В: Какие допущения необходимы для расчета доверительного интервала?

О: Расчет доверительного интервала обычно требует предположений о характере процесса оценки, например, предположение о том, что распределение совокупности, из которой взята выборка, является нормальным.

В: Являются ли доверительные интервалы надежной статистикой?

О: Доверительные интервалы, как обсуждается ниже, не являются надежной статистикой, хотя можно внести коррективы, чтобы добавить надежности.

искать