Несколько более сложный пример из реальной жизни: Средний рост взрослых мужчин в США составляет 70 дюймов со стандартным отклонением в 3 дюйма. Стандартное отклонение в 3" означает, что большинство мужчин (около 68%, при условии нормального распределения) имеют рост от 3" выше до 3" ниже среднего (67-73") - одно стандартное отклонение. Почти все мужчины (около 95%) имеют рост от 6" выше до 6" ниже среднего (64-76") - два стандартных отклонения. Три стандартных отклонения включают все числа для 99,7% изучаемой выборочной совокупности. Это верно, если распределение нормальное (колоколообразное).
Если бы стандартное отклонение было равно нулю, то все мужчины имели бы рост ровно 70 дюймов. Если бы стандартное отклонение составляло 20", то некоторые мужчины были бы намного выше или намного ниже среднего, с типичным диапазоном от 50 до 90".
Для другого примера, каждая из трех групп {0, 0, 14, 14}, {0, 6, 8, 14} и {6, 6, 8, 8} имеет среднее значение (mean) 7. Но их стандартные отклонения равны 7, 5 и 1. Третья группа имеет гораздо меньшее стандартное отклонение, чем две другие, потому что все ее числа близки к 7. Основная идея заключается в том, что стандартное отклонение говорит нам, насколько далеко от среднего находятся остальные числа. Оно будет иметь те же единицы измерения, что и сами числа. Если, например, группа {0, 6, 8, 14} - это возраст группы из четырех братьев в годах, то среднее значение равно 7 годам, а стандартное отклонение - 5 годам.
Стандартное отклонение может служить мерой неопределенности. В науке, например, стандартное отклонение группы повторных измерений помогает ученым узнать, насколько они уверены в среднем числе. При решении вопроса о том, согласуются ли результаты эксперимента с предсказанием, стандартное отклонение этих измерений очень важно. Если среднее число, полученное в результате экспериментов, слишком далеко от предсказанного числа (причем расстояние измеряется в стандартных отклонениях), то проверяемая теория может оказаться неверной. См. интервал предсказания.
Примеры применения
Польза от понимания стандартного отклонения набора значений заключается в том, чтобы знать, насколько большим ожидается отличие от "среднего" (mean).
Погода
В качестве простого примера рассмотрим среднесуточные высокие температуры для двух городов - одного на материке, а другого у океана. Полезно понимать, что диапазон дневных высоких температур для городов, расположенных вблизи океана, меньше, чем для городов, расположенных на суше. Эти два города могут иметь одинаковую среднесуточную высокую температуру. Однако стандартное отклонение дневной высокой температуры в прибрежном городе будет меньше, чем в городе на материке.
Спорт
Другой способ увидеть это - рассмотреть спортивные команды. В любом виде спорта есть команды, которые в чем-то хороши, а в чем-то нет. Команды, занимающие самые высокие места, не демонстрируют больших различий в способностях. Они показывают хорошие результаты в большинстве категорий. Чем ниже стандартное отклонение их способностей в каждой категории, тем более сбалансированными и последовательными они являются. Однако команды с более высоким стандартным отклонением будут менее предсказуемы. Команда, которая обычно плоха в большинстве категорий, будет иметь низкое стандартное отклонение. Команда, которая обычно хороша в большинстве категорий, также будет иметь низкое стандартное отклонение. Однако команда с высоким стандартным отклонением может быть командой, которая набирает много очков (сильное нападение), но при этом позволяет другой команде набирать много очков (слабая защита).
Пытаясь узнать заранее, какие команды победят, можно посмотреть на стандартные отклонения "статистики" различных команд. Числа, которые отличаются от ожидаемых, могут сопоставить сильные и слабые стороны, чтобы показать, какие причины могут быть наиболее важными для определения того, какая команда победит.
В гонках измеряется время, затрачиваемое гонщиком на завершение каждого круга по трассе. Водитель с низким стандартным отклонением времени прохождения круга более последователен, чем водитель с более высоким стандартным отклонением. Эта информация может быть использована для того, чтобы понять, как водитель может сократить время прохождения круга.
Деньги
В денежной сфере стандартное отклонение может означать риск того, что цена будет расти или падать (акции, облигации, недвижимость и т.д.). Оно также может означать риск того, что группа цен будет расти или падать (активно управляемые взаимные фонды, индексные взаимные фонды или ETF). Риск - это одна из причин для принятия решения о том, что покупать. Риск - это число, которое люди могут использовать, чтобы узнать, сколько денег они могут заработать или потерять. Когда риск становится больше, доходность инвестиций может быть больше ожидаемой ("плюсовое" стандартное отклонение). Однако инвестиции также могут потерять больше денег, чем ожидалось ("минусовое" стандартное отклонение).
Например, человеку нужно выбрать между двумя акциями. Акции А за последние 20 лет имели среднюю доходность 10 процентов при стандартном отклонении 20 процентных пунктов (пп). Акции B за последние 20 лет имели среднюю доходность 12 процентов, но более высокое стандартное отклонение - 30 процентных пунктов. Подумав о риске, человек может решить, что акции А - более безопасный выбор. Даже если они не заработают столько денег, они, вероятно, не потеряют много денег. Человек может решить, что более высокий средний показатель акции B на 2 пункта не стоит дополнительного стандартного отклонения в 10 п. п. (больший риск или неопределенность ожидаемого дохода).
Правила для нормально распределенных чисел
Большинство математических уравнений для стандартного отклонения предполагают, что числа распределены нормально. Это означает, что числа распределены определенным образом по обе стороны от среднего значения. Нормальное распределение также называют гауссовым, поскольку оно было открыто Карлом Фридрихом Гауссом. Его часто называют кривой колокола, потому что на графике числа распределяются таким образом, что имеют форму колокола.
Числа не являются нормально распределенными, если они сгруппированы по одну или другую сторону от среднего значения. Числа могут быть разбросаны и при этом оставаться нормально распределенными. Стандартное отклонение показывает, насколько сильно разбросаны числа.