10 Ekim 2021 Pazar

Benford Yasası: Sayılar İşin İçine Girdiğinde Karşımıza Çıkan İlginç Örüntü

 Bizi ve dünyayı birbirine bağlayan, dünyayı bambaşka görmemizi sağlayan bazı matematiksel bağlantılar vardır. Bunlardan bir tanesi de Benford yasası olarak bilinir.

Suçlular suç mahallerinde artlarından çoğu zaman belli ipuçları bırakırlar. Bunlar bazen bir saç teli, bazen parmak izi, bazen bir iplik bazen de sayılar olabilir. Sayılar derken telefon numarası ya da banka hesap numarası gibi şeyleri kast etmiyoruz. Potansiyel suçu ortaya çıkaran en ilginç kanıtlardan birisi bir sayısı ile ilgilidir. Arkasındaki prensibi anlamak için bugünün gazetesinin ön sayfasına bir göz atın. Gazetede her türlü bağlamda bir çok sayı göreceksiniz. ‘50.000 asker daha…’, ‘yüzde 2,5 azaldı’, ”… en son 1962’de oldu… ‘,’ 18 kesin talimat verdi ‘,’… 65 yaşında baba…Birbiriyle alakasız olan bu sayıların hepsini ele aldığımızda ne kadarının 1 rakamıyla başladığını tahmin edersiniz? Ya da kaç tanesi 5 ya da 8 ile başlayacaktır?

Normal koşullarda her rakamın görülme ihtimalinin diğerleri ile aynı olduğunu düşünebilirsiniz. Başka bir deyişle, bir gazeteden rastgele alınan bir sayının 9’la olduğu kadar 1 ile başlamasının eş olasılıkta olmasını bekleyebilirsiniz. Ne var ki çoğu veri türü için bu düşüncenin aslında yanlış olduğunu biliyoruz. Aslında, ön sayfadan rastgele alınan bir sayının 1 ile başlama olasılığı diğer herhangi bir rakam ile başlama olasılığından çok daha fazladır. Sayıların neredeyse yarısı 1 veya 2 ile başlayacak ve rakam 9’a doğru gittikçe görülme olasılığı azalacaktır. Ortaya çıkan bu sonuç Benford yasası olarak bilinir.

Benford Yasası Nedir?

Aslında bu ilginç dağılım ilk olarak 1881 yılında Amerikalı bir gökbilimci olan Simon Newcomb tarafından fark edildi. Newcomb araştırmaları için logaritmik tablolar içeren bir kitabı incelerken, baş hanesi 1 olan sayıların sayfalarının, 9 olan sayıların sayfalarından daha fazla yıpranmış olduğu gözlemledi. Bazı nedenlerden dolayı, insanlar sürekli olarak belirli sayıları diğerlerinden daha sık arıyor gibiydi.

Yaklaşık 50 yıl bu gözlemle ilgili pek bir çalışma yapılmadı. Daha sonra 1939 yılında General Electric’de bir mühendis olan Frank Benford, ilginç bir gözlem yaptı. Şehirlerin nüfus istatistiklerine bakarken, sayıların çok daha fazlasının herhangi bir rakamdan çok “1” ile başladığını tekrardan fark etti. Bunu konuyu araştırmaya devam etti; hisse senedi fiyatlarına, nehir uzunluklarına, spor istatistiklerine ve daha bir çok sayı koleksiyonuna baktığında aynı şaşırtıcı sonuç ile karşılaştı.

Benford araştırmasında, 20.000’den fazla gözlemden oluşan bir veri kümesinde 1’den 9’a kadar olan doğal sayıların gerçekleşme yüzdesini analiz etti. Sonucunda ilk rakamın belirli bir değeri alma olasılığının 1’den 9’a doğru rakam arttıkça azaldığını ortaya koydu. Benford bulduğu formüle Anormal Sayılar Kanunu adını verdi ancak bugünlerde adı sadece Benford Yasası olarak biliniyor.

Konu üzerinde yapılan çalışmalar arttıkça Benford yasasının elektrik faturaları, sokak adresleri, hisse senedi fiyatları, nüfus, ölüm oranları, nehir uzunlukları, galaksilerin uzaklıkları gibi çok çeşitli veri kümelerinin hepsinde geçerli olduğu gösterilmiştir. Fenomen 1995 yılında, Theodore P. Hill tarafından tekrar incelendi. Benford Yasasını izleyen veri serilerindeki sayıların aslında “ikinci nesil” dağıtımlar olduğu, yani diğer dağıtımların kombinasyonları olduğu ortaya konuldu.

Benford Yasası ve Dolandırıcılık Tespiti

1990’ların başlarında, Benford Yasası, dolandırıcılık tespit dünyasında kendine ilginç bir yer edindi. Muhasebe alanında öğretim görevlisi olan Mark Nigrini, öğrencilerinden, ilk rakamların tahmin edilebilir dağılımını kendilerine göstermek için bildikleri bir işletmenin hesaplarına bakmalarını istedi. Bir öğrenci, bir nalbur dükkanı işleten kayınbiraderinin hesaplarına bakmaya karar verdi. Şaşırtıcı bir şekilde, sayılar Benford dağılımına hiç benzemiyordu. Tutarsızlık o kadar büyüktü ki, rakamlar bir şeylerin yanlış olması gerektiğini gösteriyordu. Bu öğrenci farkında olmadan aslında minik bir sahtekarlığı açığa çıkarmıştı.

Bu küçük başlangıçlardan itibaren, Benford Yasası, birçok muhasebecinin dolandırıcılığı tespit etmek için kullandığı resmi araçlardan biri haline geldi. Örneğin yasa, 2001 yılında Yunanistan’ın ekonomik verilerini incelemek için kullanıldı ve ülkenin Avrupa Birliği’ne katılmak için sayıları manipüle etmiş olabileceği anlaşıldı. Günümüzde bu yasa sahte haber ve görüntüleri tespit etmek için de kendine bir kullanım alanı bulmuş durumda. Dijital fotoğraflar da temelde sayılardan oluşur ve bu görüntüleri kurcalarsanız bu sayılar Benford yasasına uygunluklarını yitirir.

5 Ekim 2021 Salı

 

AI algoritmaları duygularımızı anlayabilir mi?