Машина наполняет чашки маргарином. В данном примере машина настроена таким образом, что содержимое чашек составляет 250 г маргарина. Поскольку машина не может наполнить каждую чашку ровно 250 г, содержимое отдельных чашек имеет некоторый разброс и считается случайной переменной X. Предполагается, что этот разброс нормально распределен вокруг желаемого среднего значения 250 г со стандартным отклонением 2,5 г. Чтобы определить, достаточно ли откалибрована машина, случайным образом выбирается выборка из n = 25 стаканчиков с маргарином, и стаканчики взвешиваются. Вес маргарина составляет X1, ..., X25, случайная выборка из X.
Чтобы получить представление об ожидании μ, достаточно дать оценку. Подходящей оценкой является выборочное среднее:
μ ^ = X ¯ = n1 ∑ i = n 1X i . {\displaystyle {\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}. } 
В выборке представлены фактические веса x1, ...,x25, со средним значением:
x ¯ = ∑125 i = x125 i = грамм250.2 . {\displaystyle {\bar {x}}={\frac {1}{25}}\sum _{i=1}^{25}x_{i}=250.2\,{\text{грамм}}. } 
Если мы возьмем другую выборку из 25 чашек, мы легко можем ожидать, что получим значения 250,4 или 251,1 грамма. Однако среднее значение выборки в 280 грамм будет крайне редким, если среднее содержание в чашках на самом деле близко к 250 граммам. Существует целый интервал вокруг наблюдаемого значения 250,2 среднего выборочного значения, в пределах которого, если среднее значение всей популяции действительно принимает значение в этом диапазоне, наблюдаемые данные не будут считаться особенно необычными. Такой интервал называется доверительным интервалом для параметра μ. Как рассчитать такой интервал? Конечные точки интервала должны быть вычислены по выборке, поэтому они являются статистическими данными, функциями выборки X1, ..., X25 и, следовательно, случайными величинами.
В нашем случае мы можем определить конечные точки, учитывая, что выборочное среднее X из нормально распределенной выборки также нормально распределено, с тем же ожиданием μ, но со стандартной ошибкой σ/√n = 0,5 (грамм). При стандартизации мы получаем случайную величину
Z = X ¯ - μ σ / n = X ¯ - μ {\displaystyle0.5 Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}} } 
зависит от оцениваемого параметра μ, но имеет стандартное нормальное распределение, не зависящее от параметра μ. Следовательно, можно найти числа -z и z, не зависящие от μ, где Z лежит между ними с вероятностью 1 - α, мерой того, насколько мы хотим быть уверенными. Мы принимаем 1 - α = 0,95. Таким образом, имеем:
P ( - z ≤ Z ≤ z ) =1 - α = 0.95. {\displaystyle P(-z\leq Z\leq z)=1-\alpha =0.95.\,} 
Число z следует из кумулятивной функции распределения:
Φ ( z ) = P ( Z ≤ z ) = 1- α = 2,0.975 z = Φ -1 ( Φ ( z ) ) = Φ - 1( )0.975 = , 1.96{\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0.975,\\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}} ![{\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0.975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}}](https://www.alegsaonline.com/image/0e80e68d525d87d1b722d1150abda18cecb8f684.svg)
и мы получаем:
0.95 = 1- α = P ( - z ≤ Z ≤ z ) = P ( -1.96 ≤ X ¯ - μ σ / n ≤ )1.96 = P ( X ¯ -1.96 σ n ≤ μ ≤ X ¯ + σ1.96 n ) = P ( X ¯ - 1.96× ≤0.5 μ ≤ X ¯ + ×1.96 )0.5 = P ( X ¯ -0.98 ≤ μ ≤ X ¯ + ) 0.98. {\displaystyle {\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}\right)\\\[6pt]&=P\left({\bar {X}}-1.96\times 0.5\leq \mu \leq {\bar {X}}+1.96\times 0.5\right)\\\[6pt]&=P\left({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98\right)\end{aligned}}}. ![{\displaystyle {\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}\right)\\[6pt]&=P\left({\bar {X}}-1.96\times 0.5\leq \mu \leq {\bar {X}}+1.96\times 0.5\right)\\[6pt]&=P\left({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98\right).\end{aligned}}}](https://www.alegsaonline.com/image/2437ee6c7c0320fa30cec1de64773a6e7cc3a095.svg)
Это можно интерпретировать так: с вероятностью 0,95 мы найдем доверительный интервал, в котором будет встречаться параметр μ между стохастическими конечными точками
X ¯ - 0. 98 {\displaystyle {\bar {X}}-0{.}98\,} 
и
X¯ + 0.98. {\displaystyle {\bar {X}}+0.98.\,} 
Это не означает, что существует 0,95 вероятность встретить параметр μ в рассчитанном интервале. При каждом повторном измерении будет получено другое значение среднего значения X выборки. В 95% случаев μ будет находиться между конечными точками, рассчитанными по этому среднему, но в 5% случаев не будет. Фактический доверительный интервал рассчитывается путем введения измеренных весов в формулу. Наш доверительный интервал 0,95 становится:
( x¯ - 0.98; x¯ + ) 0.98= ( 250.2-0.98 ; + 250.2)0.98 = ( ;249.22 ) 251.18. {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,} 
Поскольку искомое значение 250 μ находится в пределах приведенного доверительного интервала, нет оснований полагать, что машина откалибрована неправильно.
Вычисленный интервал имеет фиксированные конечные точки, где μ может находиться между ними (или нет). Таким образом, это событие имеет вероятность либо 0, либо 1. Мы не можем сказать: "с вероятностью (1 - α) параметр μ лежит в доверительном интервале". Мы знаем только, что при повторении в 100(1 - α) % случаев μ будет находиться в вычисленном интервале. Однако в 100α % случаев это не так. И, к сожалению, мы не знаем, в каком из случаев это произойдет. Поэтому мы говорим: "с уровнем доверия 100(1 - α) %, μ лежит в доверительном интервале. "
На рисунке справа показаны 50 реализаций доверительного интервала для заданного среднего значения популяции μ. Если мы случайно выберем одну реализацию, то с вероятностью 95% мы выберем интервал, содержащий параметр; однако нам может не повезти, и мы выберем не тот интервал. Мы никогда этого не узнаем; мы застряли с нашим интервалом.