Simpson Paradoksuyla İstatistik Yanılsamalarına Bir Bakış

TVC-mall WW

Simpson Paradoksu örneklerle açıklanabilir. Ama ne zaman ortaya çıkacağını tahmin etmek zor …

“İstatistikler yalan söylemez, insanlar yalan söyler.” Anonim

paradoks

Paradoks, Yunanca ‘ileri’ kelimelerinden türetilmiş bir ifadedir. ve Türkçe’de ‘muhalefet / çelişki’ olarak ifade edilen doxa ‘düşünce, inanç’ ve sözlük anlamı ‘yaşamak, şey ya da durumdur’. görünüşte yanıltıcı.

Paradoks, kişinin zihninde var olan ve şüphesi doğru olmayan bilginin çelişkili olduğu ve zihnin algılarıyla çeliştiği gerçeği olarak tanımlanabilir.

Paradoksların tarihi, eski zamanlara, Batı Felsefesinin ilk zamanlarına kadar uzanır. Tarihte bilinen ilk paradoks örneği Epimenid’in “Girit Paradoksu (tüm Giritlerin teklifi yalancıdır”).

Mantık hatası olan bu önermenin paradoks olarak kabul edilmesinin nedeni, birçok yalanın temelini oluşturmasıdır. ondan sonra paradokslar.

Paradokslar 20. yüzyılda matematikte tartışılmaya başlandı. Genellikle paradokslar aşağıdaki gibi gruplanır:

  • Zeno paradoksları
  • Russell paradoksları (küme teorileri ile ilgili)
  • Mantık paradoksları
  • Epimenid paradoksları (Yanlış paradokslar)
  • Sonsuzluk paradoksları

İstatistik; Veri toplama, analiz etme ve yorumlamada etiğin ön planda olması bilimdir. Homer Simpson’ın dediği gibi, “İstediğiniz her şeyi kanıtlamak için istatistikleri kullanabilirsiniz.”

Önyargılı seçimler, bilimden ziyade amaca yönelik istatistiksel uygulamalar ve farklı türde bilgilerin önyargılı olarak tahmin edilmesi mümkündür. Bu nedenle, istatistiksel etiğin ihmali ile, ‘taraflı’ üç yalan türünden biri olan istatistikler, gerçek istatistikler yerine ortaya çıkar. Başka bir deyişle, istatistiklerin kullanılması bir sorun oluşturmaz. Sorun amaçlanan kullanımı içindir.

Edward H. Simpson, İngiliz İstatistikçi, şifre kırıcı ve sözde Simpson Paradox’un yaratıcısıdır. 10 Aralık 1922’de doğdu. Akademik kimliğinin yanı sıra memur olarak da çalışıyor.

II. II.Dünya Savaşı sırasında dünyanın Alan Turing ile ilk modern bilgisayarını geliştirirken kod kırıcı olarak çalışır. 1946’dan ölümüne kadar Kraliyet İstatistik Derneği üyeliğine devam etti.

Cambridge’de doktora yapmıştır. Simpson Paradoksunu 1951’de yayınlanan bir makalede kendi adıyla sunar. 1947’den sonra çalışma hayatının çoğunu kamu hizmetinde geçirdi. Milli Eğitim Bakanlığı, Hazine Özel Konseyi, Eğitim ve Bilim Bölümü’nde çalışıyor.

Bizi 5 Şubat 2019’da terk ediyor.

Simpson Paradoksu, Yule-Simpson Etkisi de denir. Çünkü Yule 1903’te kategorik değişkenler arasındaki birleşme paradokslarının varlığını açıklar (cinsiyeti 0 veya 1 olarak kodlamak kategorik değişkenin bir örneğidir).

Aslında, bu alanda paradoksların varlığı ünlü İstatistikçi Karl Pearson (1899) tarafından incelenmiştir. Spor, sağlık, eğitim ve sosyal bilimler gibi birçok alanda bu paradoksla karşılaşmak mümkündür.

Simpson, bu çelişkiyi “Acil Durum Tablolarında Etkileşimin Yorumlanması” – 1951’de yayınlanan Acil Durum Tablolarında Etkileşimin Yorumlanması başlıklı makalesinde şöyle açıklamaktadır: Kabaca paradoks şu şekilde tanımlanabilir: “Farklı grupların ortalaması yok grupların ortalama ortalamasına eşit olmak. ”

Bu cümlede neyin açıklanmasının amaçlandığını tarihe ait bir örnekle açıklayalım.

Berkeley Üniversitesi örneği

Berkeley Üniversitesi, üniversiteye girişte cinsiyet ayrımcılığı yaptığı gerekçesiyle 1973 yılında dava açıldı. Üniversite kabul başvurularında toplanan istatistiksel veriler dikkate alındığında, üniversiteye başvuran erkeklerin% 44’ü kadınların% 35’ine kabul edilmiştir. Üniversiteye başvuran kadın sayısı 4321 iken, erkek sayısı 8442’dir. Kabul edilen toplam kız öğrenci sayısı 1512 iken erkek öğrenci sayısı 3714’tür.

Rakamlar incelendiğinde, cinsiyet ayrımcılığı suçunun doğru olduğu sonucuna varılabilir. Ancak durum farklı. Veriler gruplandırılmaz, yani ham veriler. Mahkemenin verileri bölümlere göre gruplandırıldığında, aşağıdaki gibi bir tablo görüntülenir:

Masaya bakıldığında, üniversitenin en büyük 6 bölümünden 4’ünde kız öğrenciler erkek öğrencilere göre daha fazla kabul gördü. Başka bir deyişle, A, B, D ve F bölümlerine kabul edilen erkeklerin sayısı kadın sayısından daha azdır.

Yani, erkekler en çok öğrenciyi kabul eden bölüme daha çok başvururken, kız öğrenciler en az öğrenciyi kabul eden bölüme başvurmuşlardır. Bu nedenle grup yüzdeleri ile toplam yüzdeler birbirinden farklıdır. Buna Simpson Paradoksu denir.

Sorunu güçlendirmek için başka bir örnekle devam edelim.

Böbrek taşı tedavisi için A ve B gibi 2 farklı yöntem vardır. A tedavisi tüm açık cerrahi prosedürleri içerirken, B tedavisi küçük veya büyük böbrek taşları ile ilgili tedavileri içerir. Aşağıdaki tabloda, yöntemlerin başarı yüzdesi ile birlikte her iki tedavinin ortak başarı oranları yer almaktadır.

Her iki küçük ve büyük taş grubunda (% 93 -% 87) – (% 73 -% 69) A yönteminin başarı oranı, A yöntemine göre toplam başarı oranı B yönteminden (% 83) daha iyidir (% 78). Doktor hastayı tedavi ederken hangi yöntemi seçeceğine karar verdiğinde, nedensel sorun ve Simpson Paradoksu devreye girer.

(Nedensellik sorunu korelasyon kavramı ile incelenmeli ve bu kavramın açıklaması makalenin dışında bırakılmalıdır.)

Simpson Paradoksu örneklerle açıklanabilir. Ancak ne zaman görüneceğini tahmin etmek zordur. Rasgelelikli deneysel randomize çalışmalarda paradoksun ortaya çıkışı, diğer deneysel olmayan ve rastgele çalışmalardan daha zordur.

(Rasgeleleştirilmiş rasgele seçim anlamına gelir.)

İstatistiksel çıkarımları, özellikle tıp alanındaki çalışmaları etkileyecek paradokslardan kaçınmak için randomizasyon önemli olmakla birlikte, Simpson Paradox örneklerinde olduğu gibi günlük yaşamımızda karşılaştığımız paradoksları çözme becerisi kazanmak için algılarımızı genişletmemiz gerekiyor. .

Olgun Duran

Bir Önceki Yazımız Olan Karmaşık sayılar neden karşılaştırılamaz Başlıklı Makalemizde Hakkında Bilgiler Verilmektedir.

Bu Haberi Sosyal Ağlarda Paylaşın!

İlgili Mesajlar

Leave a Comment