Парадокс Симпсона
Парадокс Симпсона - это парадокс из статистики. Он назван в честь Эдварда Х. Симпсона, британского статистика, который впервые описал его в 1951 году. Статистик Карл Пирсон описал очень похожий эффект в 1899 году. Описание Удни Юла датируется 1903 годом. Иногда его называют эффектом Юла-Симпсона. При рассмотрении статистических оценок групп эти оценки могут меняться в зависимости от того, рассматриваются ли группы по одной или они объединены в большую группу. Этот случай часто встречается в социальных науках и медицинской статистике. Он может сбить людей с толку, если частотные данные используются для объяснения причинно-следственных связей. Другие названия парадокса: парадокс обратного хода и парадокс слияния.
Пример: Лечение камней в почках
Это реальный пример из медицинского исследования, в котором сравнивались показатели успешности двух методов лечения камней в почках.
В таблице приведены показатели успешности и количество процедур для лечения мелких и крупных камней в почках, где лечение А включает все открытые процедуры, а лечение Б - чрескожную нефролитотомию:
Лечение A | Лечение B | |||
успех | отказ | успех | отказ | |
Мелкие камни | Группа 1 | Группа 2 | ||
количество пациентов | 81 | 6 | 234 | 36 |
93% | 7% | 87% | 13% | |
Крупные камни | Группа 3 | Группа 4 | ||
количество пациентов | 192 | 71 | 55 | 25 |
73% | 27% | 69% | 31% | |
Оба | Группа 1+3 | Группа 2+4 | ||
количество пациентов | 273 | 77 | 289 | 61 |
78% | 22% | 83% | 17% |
Парадоксальный вывод: лечение А более эффективно при использовании на мелких камнях, а также при использовании на крупных камнях, однако лечение В более эффективно при одновременном рассмотрении обоих размеров. В этом примере не было известно, что размер камня в почке влияет на результат. В статистике это называется скрытой переменной (или скрывающейся переменной).
Какое лечение считается лучшим, определяется неравенством между двумя соотношениями (успехи/всего). Обратное неравенство между соотношениями, которое создает парадокс Симпсона, происходит потому, что два эффекта проявляются вместе:
- Размеры групп, которые объединяются при игнорировании скрытой переменной, сильно отличаются. Врачи склонны давать тяжелым случаям (большие камни) лучшее лечение (А), а более легким случаям (маленькие камни) - худшее лечение (В). Поэтому в итоговых данных преобладают группы три и два, а не две гораздо меньшие группы один и четыре.
- Скрытая переменная оказывает большое влияние на коэффициенты, т.е. на процент успеха сильнее влияет тяжесть случая, чем выбор лечения. Поэтому группа пациентов с большими камнями, использующая лечение А (третья группа), справляется хуже, чем группа с маленькими камнями, даже если последние использовали менее эффективное лечение В (вторая группа).