Выборка

В статистике выборка является частью совокупности. Выборка тщательно отбирается. Она должна представлять всю совокупность справедливо, без предвзятости. Необходимость в выборках объясняется тем, что популяции могут быть настолько большими, что подсчет всех индивидуумов может оказаться невозможным или нецелесообразным.

Поэтому решение проблемы в статистике обычно начинается с выборки. Выборка - это выбор данных для последующего анализа. В качестве примера предположим, что для исследования следует проанализировать загрязнение озера. В зависимости от того, где были взяты пробы воды, результаты исследований могут быть разными. Как правило, пробы должны быть случайными. Это означает, что шанс или вероятность выбора одного человека такая же, как и шанс выбора любого другого.

На практике случайные выборки всегда отбираются с помощью четко определенной процедуры. Процедура - это набор правил, последовательность шагов, записанная на бумаге и следующая за буквой. Несмотря на это, в выборке может остаться некоторая погрешность. Рассмотрим проблему построения выборки для предсказания результата опроса избирателей. Все известные методы имеют свои проблемы, и результаты выборов часто отличаются от прогнозов на основе выборки. Если вы собираете мнения по телефону или встречаетесь с людьми на улице, выборка всегда имеет предвзятость. Поэтому в таких случаях полностью нейтральная выборка никогда не возможна. В таких случаях специалист по статистике подумает о том, как измерить степень предвзятости, и есть способы ее оценить.

Аналогичная ситуация возникает, когда ученые измеряют физическое свойство, скажем, вес куска металла или скорость света. Если мы взвесим предмет с помощью чувствительного оборудования, то получим результаты, незначительно отличающиеся от тех, что были раньше. Ни одна система измерения никогда не бывает идеальной. Мы получаем ряд оценок, каждая из которых является измерением. Это образцы, с определенной степенью погрешности. Статистика предназначена для описания погрешности, и проведения анализа по этому виду данных.

Существуют различные виды образцов:

Пограничная полиция ищет нелегальные наркотики со специально обученной собакой: Если они проверяют каждую десятую машину, то берут беспристрастный образец.Zoom
Пограничная полиция ищет нелегальные наркотики со специально обученной собакой: Если они проверяют каждую десятую машину, то берут беспристрастный образец.

Стратифицированная выборка

Если популяция имеет очевидные субпопуляции, то необходимо отбирать пробы у каждой из субпопуляций. Это называется стратифицированной выборкой. Стратифицированную выборку также называют стратифицированной случайной выборкой. Стратифицированная выборка часто представлена в процентном отношении, например, в процентах (%).

Предположим, что будет проведен эксперимент по выборочной оценке доходов взрослых. Очевидно, что доходы выпускников колледжей могут отличаться от доходов не выпускников. Теперь предположим, что число выпускников мужского пола составило 30% от общего числа взрослых мужчин (воображаемые цифры). Тогда 30% от общей выборки будут случайным образом выбраны выпускниками мужского пола, а 70% - не выпускниками мужского пола. Повторите этот процесс для женщин, так как процент выпускников-женщин отличается от процента выпускников-мужчин. Это дает выборку взрослого населения, стратифицированную по полу и высшему образованию. Следующим шагом будет разделение каждой из ваших подгрупп по возрастным группам, потому что (например) выпускники могут получить больший доход по сравнению с не выпускниками в среднем возрасте.

Другой тип стратифицированной выборки связан с вариациями. Здесь большие выборки берутся из более переменных подпопуляций, чтобы сводная статистика, такая как средства и стандартные отклонения, была более надежной.

Вопросы и ответы

В: Что такое выборка в статистике?


О: В статистике выборка - это часть популяции, которая была тщательно отобрана, чтобы справедливо и непредвзято представлять всю популяцию.

В: Зачем нужны выборки?


О: Выборки нужны потому, что популяции могут быть настолько большими, что подсчет всех людей может быть невозможен или нецелесообразен. Поэтому решение проблемы в статистике обычно начинается с выборки.

В: Как представлена выборка?


О: Когда выборка рассматривается как набор данных, она часто представляется заглавными буквами, такими как X и Y, ее элементы представляются в нижнем регистре (например, x3), а размер выборки - буквой n.

В: Какими должны быть образцы?


О: Как правило, выборки должны быть случайными, что означает, что шанс или вероятность выбора одного индивидуума такой же, как и шанс выбора любого другого индивидуума. На практике случайные выборки всегда берутся с помощью четко определенной процедуры.

В: Может ли в выборках сохраняться предвзятость?


О: Даже при использовании четко определенных процедур для выборки в выборке может оставаться некоторая предвзятость из-за таких факторов, как, например, кто отвечает на телефонные звонки или кто ходит по определенным улицам при сборе мнений для прогноза избирательного опроса. В таких случаях бывает трудно получить полностью нейтральные выборки, но статистики могут измерить, насколько сильно сохраняется предвзятость.

В: Существуют ли различные виды выборок?


О: Да, существуют различные виды выборок, включая полные выборки, которые включают все элементы, обладающие заданными свойствами, и несмещенные/репрезентативные выборки, которые предполагают выбор элементов из полных выборок без учета их свойств. Способ получения выборки, а также ее размер влияют на то, как рассматривать данные.

AlegsaOnline.com - 2020 / 2023 - License CC3