С помощью парадокса Симпсона можно доказать, что курение полезно для здоровья. Суть парадокса в том, что крупное группирование данных может значить намного меньше, чем сумма его частей.
В начале 1970-х годов в Великобритании было проведено исследование, целью которого было выяснить, каким образом ряд различных факторов вредит человеческому здоровью. Среди прочих факторов изучалось и воздействие курения. В частности, объектом исследования были женщины и их продолжительность жизни в течение последующих 20-ти лет. Удивительно, но за это время умерло 43% некурящих и только 38% курильщиков. Очевидно, сигареты спасли им жизнь?
Или, возможно, это был парадокс Симпсона. Иногда наблюдаются явные тенденции в отдельных группах данных, которые исчезают, если эти группы объединить в одну. В случае если женщин разбить по возрастам, то каждая отдельная группа покажет, что в целом у курильщиков был более высокий уровень смертности, чем у некурящих.
Тем не менее, молодые женщины курят чаще, чем женщины в возрасте, и, хотя курение увеличивает риск смерти в любом возрасте, молодые курильщики имеют больше шансов прожить «контрольные» 20 лет, чем пожилые некурящие люди.
Если же объединить все группы людей в одну, то, хотя табак и вреден для здоровья, почти никто из испытуемых не курил в течение 40-ка лет своей жизни, поэтому в совокупности может показаться, что табак полезен.
Парадокс Симпсона работает для всех случаев, в которых есть неучтённый третий фактор — иногда это всего лишь количественная разница между группами, в частности, возрастная. Примеры парадокса Симпсона можно найти среди многочисленных медицинских исследований, анализов производительности, а также в случаях дискриминации по половому признаку. Иногда то, что справедливо для целого, не подходит для его частей. Это идеальный статистический способ не позволить людям за деревьями увидеть лес.
Не забудьте проголосовать за пост. Нам важно Ваше мнение: