Студенческое t-распределение - это вероятностное распределение, разработанное Уильямом Сили Госсе в 1908 году. Student - это псевдоним, который он использовал, когда опубликовал работу, описывающую распределение. Госсе работал на пивоваренном заводе и интересовался проблемами небольших образцов, например, химическими свойствами ячменя. В анализируемых им проблемах размер пробы мог достигать трех. Одна из версий происхождения псевдонима заключается в том, что работодатель Госсе предпочитал, чтобы сотрудники использовали псевдонимы при публикации научных работ вместо своего настоящего имени, поэтому он использовал имя "Студент", чтобы скрыть свою личность. Другая версия заключается в том, что пивоварня не хотела, чтобы ее конкуренты знали, что они используют т-тест для проверки качества сырья.
Из-за малого размера выборки оценка стандартного отклонения невозможна. Также во многих случаях, с которыми столкнулся Госсет, распределение вероятностей по выборкам было неизвестно.
Нормальное распределение описывает полную совокупность, t-распределения описывают выборки, взятые из полной совокупности; соответственно, t-распределение для каждого размера выборки различно, и чем больше выборка, тем больше это распределение похоже на нормальное распределение.
Распределение t играет роль во многих широко используемых статистических анализах, включая t-тестСтудента для оценки статистической значимости разницы между двумя средствами выборки, построение доверительных интервалов для разницы между двумя средствами популяции, а также в анализе линейной регрессии. Распределение t студента также возникает при байесовском анализе данных из нормального семейства.
Если взять выборку из n наблюдений из нормального распределения, то t-распределение с ν = n-1 степени свободы можно определить как распределение местоположения истинного среднего относительно выборки и поделить на выборку стандартное отклонение, умножив на нормализующий член n {\displaystyle {\sqrt {n}}}. . Таким образом, t-распределение может быть использовано для оценки того, насколько вероятно, что истинное среднее лежит в любом заданном диапазоне.
Т-образное распределение симметрично и колоколообразно, как и нормальное распределение, но имеет более тяжелые хвосты, что означает, что оно более склонно давать значения, которые далеки от его среднего значения. Это делает его полезным для понимания статистического поведения некоторых типов соотношений случайных величин, в которых вариация знаменателя усиливается и может давать отдаленные значения, когда знаменатель соотношения падает близко к нулю. Студенческое t-распределение является частным случаем обобщенного гиперболического распределения.