В статистике выборка является частью совокупности. Выборка тщательно отбирается. Она должна представлять всю совокупность справедливо, без предвзятости. Необходимость в выборках объясняется тем, что популяции могут быть настолько большими, что подсчет всех индивидуумов может оказаться невозможным или нецелесообразным.

Поэтому решение проблемы в статистике обычно начинается с выборки. Выборка - это выбор данных для последующего анализа. В качестве примера предположим, что для исследования следует проанализировать загрязнение озера. В зависимости от того, где были взяты пробы воды, результаты исследований могут быть разными. Как правило, пробы должны быть случайными. Это означает, что шанс или вероятность выбора одного человека такая же, как и шанс выбора любого другого.

На практике случайные выборки всегда отбираются с помощью четко определенной процедуры. Процедура - это набор правил, последовательность шагов, записанная на бумаге и следующая за буквой. Несмотря на это, в выборке может остаться некоторая погрешность. Рассмотрим проблему построения выборки для предсказания результата опроса избирателей. Все известные методы имеют свои проблемы, и результаты выборов часто отличаются от прогнозов на основе выборки. Если вы собираете мнения по телефону или встречаетесь с людьми на улице, выборка всегда имеет предвзятость. Поэтому в таких случаях полностью нейтральная выборка никогда не возможна. В таких случаях специалист по статистике подумает о том, как измерить степень предвзятости, и есть способы ее оценить.

Аналогичная ситуация возникает, когда ученые измеряют физическое свойство, скажем, вес куска металла или скорость света. Если мы взвесим предмет с помощью чувствительного оборудования, то получим результаты, незначительно отличающиеся от тех, что были раньше. Ни одна система измерения никогда не бывает идеальной. Мы получаем ряд оценок, каждая из которых является измерением. Это образцы, с определенной степенью погрешности. Статистика предназначена для описания погрешности, и проведения анализа по этому виду данных.

Существуют различные виды образцов: