Среднеквадратическое отклонение

Стандартное отклонение - это число, используемое для определения того, насколько измерения для группы отличаются от среднего (среднего) или ожидаемого значения. Низкое стандартное отклонение означает, что большинство чисел близко к среднему значению. Высокое стандартное отклонение означает, что числа более разбросаны.

Сообщаемая погрешность обычно в два раза больше стандартного отклонения. Ученые обычно сообщают стандартное отклонение чисел от среднего числа в экспериментах. Они часто решают, что важны только различия, превышающие стандартное отклонение в два или три раза. Стандартное отклонение также полезно в деньгах, где стандартное отклонение по полученным процентам показывает, насколько полученный одним человеком процент может отличаться от среднего.

Во многих случаях можно измерить только выборку или часть группы. Тогда число, близкое к стандартному отклонению для всей группы, можно найти с помощью несколько иного уравнения, называемого стандартным отклонением выборки, которое объясняется ниже.

График нормального распределения (или колоколообразной кривой). Ширина каждой цветной полосы равна одному стандартному отклонению.Zoom
График нормального распределения (или колоколообразной кривой). Ширина каждой цветной полосы равна одному стандартному отклонению.

Набор данных со средним значением 50 (показано синим цветом) и стандартным отклонением (σ) 20.Zoom
Набор данных со средним значением 50 (показано синим цветом) и стандартным отклонением (σ) 20.

Пример двух выборочных совокупностей с одинаковыми средними и разными стандартными отклонениями. Красная совокупность имеет среднее 100 и SD 10; синяя совокупность имеет среднее 100 и SD 50.Zoom
Пример двух выборочных совокупностей с одинаковыми средними и разными стандартными отклонениями. Красная совокупность имеет среднее 100 и SD 10; синяя совокупность имеет среднее 100 и SD 50.

Основной пример

Рассмотрим группу, состоящую из следующих восьми номеров:

2 , ,4 , 44, 5, , 5, 7{\displaystyle9 2,\ 4,\ 4,\ 4,\ 4,\ 5,\ 5,\ 7,\ 9} {\displaystyle 2,\ 4,\ 4,\ 4,\ 5,\ 5,\ 7,\ 9}

Эти восемь чисел имеют среднее значение (mean), равное 5:

2 + 4+4 +4 + 5+ 5+ 7= 98{\displaystyle5 {\frac {2+4+4+4+4+5+5+7+9}{8}}}=5} {\displaystyle {\frac {2+4+4+4+5+5+7+9}{8}}=5}

Чтобы рассчитать стандартное отклонение популяции, сначала найдите разницу каждого числа в списке от среднего значения. Затем возведите в квадрат результат каждой разницы:

( 2-5 ) =2 ( - 3) =2 (95 - 5) = 202( 04-5 ) = 2( - 1) =2 (15 - 5) = 2=02 ( 04-5 ) =2 ( - ) = (17 - 15) =2 ( - ) = = 2= 22( 44-5 ) =2 ( - 1) =2 (19 - 5) =2 = 42{\displaystyle16 {\begin{array}{lll}(2-5)^{2}=(-3)^{2}=9&&(5-5)^{2}=0^{2}=0\\(4-5)^{2}=(-1)^{2}=1&&(5-5)^{2}=0^{2}=0\\(4-5)^{2}=(-1)^{2}=1&&(7-5)^{2}=2^{2}=4\\(4-5)^{2}=(-1)^{2}=1&&(9-5)^{2}=4^{2}=16\\\end{array}}} {\displaystyle {\begin{array}{lll}(2-5)^{2}=(-3)^{2}=9&&(5-5)^{2}=0^{2}=0\\(4-5)^{2}=(-1)^{2}=1&&(5-5)^{2}=0^{2}=0\\(4-5)^{2}=(-1)^{2}=1&&(7-5)^{2}=2^{2}=4\\(4-5)^{2}=(-1)^{2}=1&&(9-5)^{2}=4^{2}=16\\\end{array}}}

Затем найдите среднее значение этих величин (сумма, деленная на количество чисел). И последнее, возьмите квадратный корень:

( +9 +1 +1 +1 + 0+ + 0+ 4)16 = 8{\displaystyle2 {\sqrt {\frac {(9+1+1+1+1+0+0+4+16)}{8}}}=2} {\displaystyle {\sqrt {\frac {(9+1+1+1+0+0+4+16)}{8}}}=2}

Ответ - стандартное отклонение популяции. Формула верна только в том случае, если восемь чисел, с которых мы начали, составляют всю группу. Если это только часть группы, выбранная случайным образом, то в нижней части (знаменателе) предпоследнего шага мы должны использовать 7 (что равно n - 1), а не 8 (что равно n). Тогда ответом будет выборочное стандартное отклонение. Это называется поправкой Бесселя.

Другие примеры

Несколько более сложный пример из реальной жизни: Средний рост взрослых мужчин в США составляет 70 дюймов со стандартным отклонением в 3 дюйма. Стандартное отклонение в 3" означает, что большинство мужчин (около 68%, при условии нормального распределения) имеют рост от 3" выше до 3" ниже среднего (67-73") - одно стандартное отклонение. Почти все мужчины (около 95%) имеют рост от 6" выше до 6" ниже среднего (64-76") - два стандартных отклонения. Три стандартных отклонения включают все числа для 99,7% изучаемой выборочной совокупности. Это верно, если распределение нормальное (колоколообразное).

Если бы стандартное отклонение было равно нулю, то все мужчины имели бы рост ровно 70 дюймов. Если бы стандартное отклонение составляло 20", то некоторые мужчины были бы намного выше или намного ниже среднего, с типичным диапазоном от 50 до 90".

Для другого примера, каждая из трех групп {0, 0, 14, 14}, {0, 6, 8, 14} и {6, 6, 8, 8} имеет среднее значение (mean) 7. Но их стандартные отклонения равны 7, 5 и 1. Третья группа имеет гораздо меньшее стандартное отклонение, чем две другие, потому что все ее числа близки к 7. Основная идея заключается в том, что стандартное отклонение говорит нам, насколько далеко от среднего находятся остальные числа. Оно будет иметь те же единицы измерения, что и сами числа. Если, например, группа {0, 6, 8, 14} - это возраст группы из четырех братьев в годах, то среднее значение равно 7 годам, а стандартное отклонение - 5 годам.

Стандартное отклонение может служить мерой неопределенности. В науке, например, стандартное отклонение группы повторных измерений помогает ученым узнать, насколько они уверены в среднем числе. При решении вопроса о том, согласуются ли результаты эксперимента с предсказанием, стандартное отклонение этих измерений очень важно. Если среднее число, полученное в результате экспериментов, слишком далеко от предсказанного числа (причем расстояние измеряется в стандартных отклонениях), то проверяемая теория может оказаться неверной. См. интервал предсказания.

Примеры применения

Польза от понимания стандартного отклонения набора значений заключается в том, чтобы знать, насколько большим ожидается отличие от "среднего" (mean).

Погода

В качестве простого примера рассмотрим среднесуточные высокие температуры для двух городов - одного на материке, а другого у океана. Полезно понимать, что диапазон дневных высоких температур для городов, расположенных вблизи океана, меньше, чем для городов, расположенных на суше. Эти два города могут иметь одинаковую среднесуточную высокую температуру. Однако стандартное отклонение дневной высокой температуры в прибрежном городе будет меньше, чем в городе на материке.

Спорт

Другой способ увидеть это - рассмотреть спортивные команды. В любом виде спорта есть команды, которые в чем-то хороши, а в чем-то нет. Команды, занимающие самые высокие места, не демонстрируют больших различий в способностях. Они показывают хорошие результаты в большинстве категорий. Чем ниже стандартное отклонение их способностей в каждой категории, тем более сбалансированными и последовательными они являются. Однако команды с более высоким стандартным отклонением будут менее предсказуемы. Команда, которая обычно плоха в большинстве категорий, будет иметь низкое стандартное отклонение. Команда, которая обычно хороша в большинстве категорий, также будет иметь низкое стандартное отклонение. Однако команда с высоким стандартным отклонением может быть командой, которая набирает много очков (сильное нападение), но при этом позволяет другой команде набирать много очков (слабая защита).

Пытаясь узнать заранее, какие команды победят, можно посмотреть на стандартные отклонения "статистики" различных команд. Числа, которые отличаются от ожидаемых, могут сопоставить сильные и слабые стороны, чтобы показать, какие причины могут быть наиболее важными для определения того, какая команда победит.

В гонках измеряется время, затрачиваемое гонщиком на завершение каждого круга по трассе. Водитель с низким стандартным отклонением времени прохождения круга более последователен, чем водитель с более высоким стандартным отклонением. Эта информация может быть использована для того, чтобы понять, как водитель может сократить время прохождения круга.

Деньги

В денежной сфере стандартное отклонение может означать риск того, что цена будет расти или падать (акции, облигации, недвижимость и т.д.). Оно также может означать риск того, что группа цен будет расти или падать (активно управляемые взаимные фонды, индексные взаимные фонды или ETF). Риск - это одна из причин для принятия решения о том, что покупать. Риск - это число, которое люди могут использовать, чтобы узнать, сколько денег они могут заработать или потерять. Когда риск становится больше, доходность инвестиций может быть больше ожидаемой ("плюсовое" стандартное отклонение). Однако инвестиции также могут потерять больше денег, чем ожидалось ("минусовое" стандартное отклонение).

Например, человеку нужно выбрать между двумя акциями. Акции А за последние 20 лет имели среднюю доходность 10 процентов при стандартном отклонении 20 процентных пунктов (пп). Акции B за последние 20 лет имели среднюю доходность 12 процентов, но более высокое стандартное отклонение - 30 процентных пунктов. Подумав о риске, человек может решить, что акции А - более безопасный выбор. Даже если они не заработают столько денег, они, вероятно, не потеряют много денег. Человек может решить, что более высокий средний показатель акции B на 2 пункта не стоит дополнительного стандартного отклонения в 10 п. п. (больший риск или неопределенность ожидаемого дохода).

Правила для нормально распределенных чисел

Большинство математических уравнений для стандартного отклонения предполагают, что числа распределены нормально. Это означает, что числа распределены определенным образом по обе стороны от среднего значения. Нормальное распределение также называют гауссовым, поскольку оно было открыто Карлом Фридрихом Гауссом. Его часто называют кривой колокола, потому что на графике числа распределяются таким образом, что имеют форму колокола.

Числа не являются нормально распределенными, если они сгруппированы по одну или другую сторону от среднего значения. Числа могут быть разбросаны и при этом оставаться нормально распределенными. Стандартное отклонение показывает, насколько сильно разбросаны числа.

Темно-синий цвет меньше одного стандартного отклонения от среднего. Для нормального распределения это 68,27 процента чисел; в то время как два стандартных отклонения от среднего (средний и темно-синий) включают 95,45 процента; три стандартных отклонения (светлый, средний и темно-синий) включают 99,73 процента; и четыре стандартных отклонения составляют 99,994 процента.Zoom
Темно-синий цвет меньше одного стандартного отклонения от среднего. Для нормального распределения это 68,27 процента чисел; в то время как два стандартных отклонения от среднего (средний и темно-синий) включают 95,45 процента; три стандартных отклонения (светлый, средний и темно-синий) включают 99,73 процента; и четыре стандартных отклонения составляют 99,994 процента.

Взаимосвязь между средним (средним) и стандартным отклонением

Среднее значение (mean) и стандартное отклонение набора данных обычно пишутся вместе. Тогда человек может понять, каково среднее число и насколько широко разбросаны другие числа в группе.

То, как распределена группа чисел, можно также определить с помощью коэффициента вариации, который представляет собой стандартное отклонение, деленное на среднее значение. Это безразмерное число. Коэффициент вариации часто умножают на 100% и записывают в процентах.

История

Термин стандартное отклонение впервые был использован в письменном виде Карлом Пирсоном в 1894 году, после того как он использовал его в лекциях. Он был использован в качестве замены более ранних названий для той же идеи: например, Гаусс использовал среднюю ошибку.

Похожие страницы

Вопросы и ответы

В: Что такое стандартное отклонение?


О: Стандартное отклонение - это число, используемое для определения того, насколько измерения для группы отличаются от среднего (среднего или ожидаемого значения).

В: Что означает низкое стандартное отклонение?


О: Низкое стандартное отклонение означает, что большинство чисел близки к среднему значению.

В: Что означает высокое стандартное отклонение?


О: Высокое стандартное отклонение означает, что числа более разбросаны.

В: Как стандартное отклонение используется в деньгах?


О: В деньгах стандартное отклонение по заработанным процентам показывает, насколько заработанный процент одного человека может отличаться от среднего.

В: Когда можно измерить только часть группы?


О: Во многих случаях можно измерить только выборку или часть группы.

В: Как представлено стандартное отклонение всей группы?


О: Стандартное отклонение всей группы представлено греческой буквой َ {\displaystyle \sigma }. .

В: Как представлено стандартное отклонение выборки?


О: Стандартное отклонение выборки представлено буквой s {\displaystyle s} .

AlegsaOnline.com - 2020 / 2023 - License CC3