Парадокс Симпсона

Парадокс Симпсона - это парадокс из статистики. Он назван в честь Эдварда Х. Симпсона, британского статистика, который впервые описал его в 1951 году. Статистик Карл Пирсон описал очень похожий эффект в 1899 году. Описание Удни Юла датируется 1903 годом. Иногда его называют эффектом Юла-Симпсона. При рассмотрении статистических оценок групп эти оценки могут меняться в зависимости от того, рассматриваются ли группы по одной или они объединены в большую группу. Этот случай часто встречается в социальных науках и медицинской статистике. Он может сбить людей с толку, если частотные данные используются для объяснения причинно-следственных связей. Другие названия парадокса: парадокс обратного хода и парадокс слияния.

Пример: Лечение камней в почках

Это реальный пример из медицинского исследования, в котором сравнивались показатели успешности двух методов лечения камней в почках.

В таблице приведены показатели успешности и количество процедур для лечения мелких и крупных камней в почках, где лечение А включает все открытые процедуры, а лечение Б - чрескожную нефролитотомию:

Лечение A

Лечение B

успех

отказ

успех

отказ

Мелкие камни

Группа 1

Группа 2

количество пациентов

81

6

234

36

93%

7%

87%

13%

Крупные камни

Группа 3

Группа 4

количество пациентов

192

71

55

25

73%

27%

69%

31%

Оба

Группа 1+3

Группа 2+4

количество пациентов

273

77

289

61

78%

22%

83%

17%

Парадоксальный вывод: лечение А более эффективно при использовании на мелких камнях, а также при использовании на крупных камнях, однако лечение В более эффективно при одновременном рассмотрении обоих размеров. В этом примере не было известно, что размер камня в почке влияет на результат. В статистике это называется скрытой переменной (или скрывающейся переменной).

Какое лечение считается лучшим, определяется неравенством между двумя соотношениями (успехи/всего). Обратное неравенство между соотношениями, которое создает парадокс Симпсона, происходит потому, что два эффекта проявляются вместе:

  1. Размеры групп, которые объединяются при игнорировании скрытой переменной, сильно отличаются. Врачи склонны давать тяжелым случаям (большие камни) лучшее лечение (А), а более легким случаям (маленькие камни) - худшее лечение (В). Поэтому в итоговых данных преобладают группы три и два, а не две гораздо меньшие группы один и четыре.
  2. Скрытая переменная оказывает большое влияние на коэффициенты, т.е. на процент успеха сильнее влияет тяжесть случая, чем выбор лечения. Поэтому группа пациентов с большими камнями, использующая лечение А (третья группа), справляется хуже, чем группа с маленькими камнями, даже если последние использовали менее эффективное лечение В (вторая группа).

AlegsaOnline.com - 2020 / 2023 - License CC3