Site icon Malta Haber

Türkiye’nin koronavirüs verileri ne kadar güvenilir?

7 Aralık 2020 / Malta

Sağlık Bakanlığı’nın açıkladığı verilere göre, Türkiye’de son 24 saat içinde 176 bin 656 test yapıldı, 31 bin 219 vakatespit edildi ve 188 kişi de koronavirüs sebebiyle hayatını kaybetti. Salgının başlangıcından bu yana hayatını kaybedenlerin sayısı 13 bin 746’ya ulaşırken, başta Türk Tabipleri Birliği (TTB) olmak üzere sağlık alanında görev yapan meslek birlikleri, muhalefet partileri ve aralarında İstanbul Büyükşehir Belediye Başkanı Ekrem İmamoğlu’nun da bulunduğu bazı yerel yöneticiler gerçek rakamın açıklanandan çok daha yüksek olduğunu savunuyor.

İspanya’nın Mallorca adasında yaşayan veri analisti Nick Brown’ın ise Sağlık Bakanlığı verilerine dair söyleyeceği başka bir şey var.

Bakanlığın salgının başlangıcından bu yana açıkladığı verilerde ‘tutarsızlıklar’ olduğunu savunan Brown, nisan ayından beri devam tutarsızlıkların sebebine ilişkin ikna edici bir açıklama olmaması halinde bu rakamların doğal bir süreç sonucu ortaya çıkmasının pek de mümkün olmadığına inanıyor.

Türkiye’nin sıfırla bitmeyen günlük koronavirüs verileri 

Brown’ın analizinde üzerinde durduğu önemli noktalardan biri, Sağlık Bakanlığı’nın günlük olarak dört farklı başlık altında açıkladığı verilerin sadece çok azının 0’la bittiği gerçeği.

Sağlık Bakanlığı’nın açıkladığı verilere bakıldığında, günlük hasta sayısı en son 5 Haziran’da, test sayısı 29 Eylül’de, ölüm sayısı 26 Ağustos’ta ve iyileşen hasta sayısı da 13 Kasım’da küsuratlı olarak değil, yani sıfırla bitiyor. Son üç ayda bu dört başlıkta açıklanan 364 veriden de sadece dördünün (üçü iyileşen hasta, biri günlük test) sonundaki sayı sıfır.

On binlerce testin sonucunu veren sayının son hanesinin gelişigüzel olması gerektiğini belirten Brown, analizinde Benford Yasası’na dayanarak Ki-Kare testi yardımıyla Sağlık Bakanlığı’nın veri setindeki sayıların gelişigüzelliğini hesaplıyor ve listede yer alan günlük verilerin tekdüze şekilde dağılmadığı sonucuna ulaşıyor.

“Benford Yasası, genellikle “İlk Hane Kanunu” olarak biliniyor. Buna göre, gerçek dünyada ölçümler bazı koşullar dışında genellikle logaritmik olarak dağılır ve bir sayı listesinde en çok kullanılan ilk rakamın ‘1’ olması ihtimali yüzde 30.6, ‘9’ olması ihtimali ise yüzde 4.7’dir.

Benford Yasası’na göre, seri sayıların ikinci basamakları ‘genellikle’; üçüncü, dördüncü ve devam eden basamakları ise her zaman tekdüze dağılım gösteriyor. Her bir rakamın bu basamaklarda bulunma olasılığı birbirine yakın olmasına rağmen hesaplamaya göre 0, 1, 2, 3 rakamlarının üçüncü ve devam eden basamaklarda bulunma ihtimali 6, 7, 8, 9’dan daha yüksek.”

Bakanlığın açıkladığı günlük sayılar ise nadiren 0’la bitiyor ve özellikle de günlük ölüm sayılarının son rakamında 7, 8, 9 çok daha yaygın olarak görülüyor; oysa Benford Yasası’na göre bunların tekdüze dağılması gerekirdi.

En az anomalinin günlük ölüm sayılarında görüldüğünü belirten Brown, tutarsızlığın tek veriyle sınırlı kalması durumunda bunun üzerinde konuşmaya değmeyecek önemde olduğunu ancak dört veride de tutarsızlık tespit edilmesinin bir şekilde bu verilerin doğal bir süreç sonucu oluşmadığı izlenimi verdiğini söylüyor.

Ortaya çıkan sonucun Türkiye’de vaka ve hasta sayıları konusunda yaşanan tartışmayla ilgili olmadığını ifade eden Brown, “Bu ikisini birbirinden ayırmanın önemli olduğunu düşünüyorum. Elde edilen sonuçlar, vakalar, testler, ölümler ve diğer istatistiklerin her birinin Nisan ayından bu yana içlerinde hatalar barındırdığını gösteriyor. Bu farklı bir problem” yorumunda bulunuyor.

Bir başka çalışma: Türkiye’nin günlük açıkladığı toplam vaka sayısında bir ‘sorun’ bulmadık, ancak günlük açıklanan ‘yeni vaka sayısında’ istatistiki gariplikler tespit ettik

Duke Üniversitesi Siyasal Bilimler Fakültesi’nden Fatih Serkant Adıgüzel, Oxford Üniversitesi’nden Aslı Cansunar ve Kadir Has Üniversitesi Ekonomi Fakültesi’nden Gözde Çörekçioğlu İshakoğlu’nun Ağustos ayı sonunda tamamladıkları ve Eylül ayında yayımlanan “Doğruluk mu, cesaret mi? KOVİD-19 istatistiklerinde sistematik manipülasyonun saptanması” başlıklı makalelerinde yer verdikleri çalışmada da Türkiye verilerinin “sorunlu” olduğu sonucuna ulaşılmış.

Türkiye’nin yanısıra ABD, Çin ve Rusya’nın da aralarında bulunduğu dokuz ülkeye ait koronavirüs verilerini inceleyen çalışma, yöntemsel olarak Bernd Beber ve Alexandra Scacco’nun 2012 yılında yayımladıkları makaleye dayanıyor.

Beber ile Scacco’nun birtakım istatistiki metotlarla seçim sandıklarından gelen sonuçların ‘doğal bir veri girişi sonucu’ mu olduğu yoksa ‘insan eliyle manipüle ile girildiğini’ anlamaya çalıştıklarını belirten Oxford Üniversitesi’nden Cansunar, bunun için da çok basit bir mantığı olan, oldukça yararlı bir istatistiki metot geliştirdiklerini söylüyor.

‘Son rakam analizi’ adı verilen bu metotla, çalışmalarında Türkiye için hem günlük toplam vaka sayısını hem de günlük yeni vaka sayısını incelediklerini kaydeden Cansunar, şöyle devam ediyor:

“Biz Türkiye’nin günlük açıkladığı toplam vaka sayısında bir ‘sorun’ bulmadık. Ancak günlük açıklanan ‘yeni vaka sayısında’ istatistiki gariplikler tespit ettik. Bu verileri kullanıp yaptığımız testlerde, 0’ların çok az olduğunu gördük, ki bu aslında Beber ve Scacco’nun açıkladığı, ‘insanlar rastgele sayı oluşturmaya çalışırken 0’la biten sayıların rastgeleymiş gibi hissedilmemesi’ bulgusuyla uyumlu. Bizim araştırmamıza göre, istatistiki garipliğin günlük yeni vakalarda olması da normal, çünkü Türkiye’de gerek haber kanallarının gerekse insanların genellikle üzerine konuştuğu veri istatistik günlük yeni vaka (hasta) sayıları.”

Brown’ın yaptığı testlerin kendilerinin uyguladıklarına çok benzediğinin ancak uygulama zamanı ve odaklanılan veri grupları açısından farklılıklar barındırdığının altını çizen Cansunar’a göre, ‘son rakam analizi’ yöntemiyle yayımlanan sayılardaki “garipliğin” ne olduğunu bulmak ya da birini açıkça suçlayabilmek mümkün değil, mümkün olan tek şey ‘veri üretim sürecinde’ bir anormallik olduğunun tespiti.

Açıklanan sayılar daha gerçekçi görünmeleri için sıfırla bitmeyen sayılar olarak belirlenmiş olabilir

Brown’ın analizini değerlendiren Bilgi Üniversitesi’nden Prof. Dr. Başlevent’se, salgın döneminin tüm verilerini kullanan veri analistinin incelemesinin yeterince büyük bir seti kapsadığı yorumunda bulunuyor.

“Bu kadar çok sayıda ve büyük sayılar incelendiğinde son basamaklarının 0–9 rakamları arasında düzenli dağılması gerektiğini, ancak incelediği sayılarda bunun söz konusu olmadığını, özellikle sıfırla biten sayıların çok az olduğunu söylüyor. Yaptığı istatistiksel test de sıradışı bir dağılım olduğunu destekliyor.”

Verilerin “sıradışı” dağılım göstermesinin, “açıklanan vaka ve benzeri sayıların daha gerçekçi görünmeleri için sıfırla bitmeyen sayılar olarak belirlendiği şeklinde yorumlanabileceğini” söyleyen Başlevent, “Bu çaba çok uzun süre gösterilince bu kez de farklı bir tuhaflık ortaya çıkmış” değerlendirmesini yapıyor.

Kaynak: Independent Türkçe

Exit mobile version