1. P(A|B); a olayının b olayına koşullu olasılığı olmak üzere ve P(b|a); b olayının a olayına koşullu olasılığı olmak üzere, iki koşullu olasılığın aynı olmadığını ancak birbirini etkilediğini söyleyen ve bu ilişkiyi açıklayan teoreme verilen isimdir. tarafında ortaya atılmıştır ancak onun ölümünden sonra arkadaşı tarafından derlenerek yayınlanmıştır. Kısaca, yeni bilgiler (veya kanıtlar) inancı günceller der. Bu açıdan insan beyninin de bayesçi düşünmeye yatkın olduğu yaygınca düşünülür.

    formal olarak şu linkteki ifade edilebilir. bu bayes teoremi'nin sade formudur. bir de alternatif formu vardır.
    bu formların nasıl elde edildiğine değinmeyeceğim ama linkler bırakacağım.

    Bayes teoremi’ni 3 girdi halinde özetleyeceğim.
    - İlk girdi, bu, genel kavramları anlatacak.
    - ikinci girdide sayısal örnekler ve ünlü bir davada nasıl kullanıldığına değineceğim.
    - üçüncü girdide siz değerli sözlük yazarlarının daha iyi kavrayabilmesi için, eğer üşenmezsem ve girdide sizleri örnek olarak kullanmama izin verirseniz, sözlük içi bir örnekle seriyi sonlandıracağım.

    kısım 1) sıkıcı kavramlar:

    |: ingilizce matematik literatüründe "given" ya da “given that” anlamına gelen, Türkçeye “öyle ki” ya da “göz önüne alındığında” olarak çevrilebilecek matematiksel sembol.

    (önsel) olasılık: bir olayın başka bir olaydan bağımsız olarak sadece geçmiş gözlemlere dayanan gerçekleşme olasılığı. hipotez ya da bayesçi yaklaşımda (inanç) olarak da geçebilir. P(a)

    (kanıt) : bazen veri (data) olarak da geçer. Olasılık içine alınınca Marjinal olasılık olarak geçer. Bu eğer konu metninde sabit olarak verilmişse, ilk paylaştığım basit form formülündeki p(B) yerine direkt yazılabilir. Ama formal tanımı, olabilirliklerle önsel olasılıkların çarpımlarının toplamıdır. Hipotezin (önsel olasılık) doğru olup olmamasından tamamen bağımsızdır. İngilizce wikipedia’dan bu formların nasıl elde edildiğini bulabilirsiniz. ya da şu linkten.
    ya da şu linkten Türkçe olarak bakabilirsiniz: enginunal.medium.com/...

    bu kısım muhtemelen en karışık kısım, o yüzden anlamadıysanız takılmayın fazla. Sayısal örneklerde anlayacaksınız.

    (olabilirlik): bayes teoremi özelinde en basit şekliyle, önsel olasılık göz önüne alındığında kanıtın (evidence) doğru olma olasılığı olarak özetlenebilir. bu tanımdan anlaşılacağı üzere koşullu olasılıkla ifade edilir. P(b|a)

    (sonsal) olasılık: önsel olasılığın, verilen kanıta göre güncellenmesiyle elde edilen yeni olasılık. (Önsel olasılık x olabilirlik)/kanıt olarak yazılabilir. Bu da yukarıdaki formüllerin sözel halidir. Yani inancın elde edilen yeni bilgilerle güncellenmesidir. P(a|b)

    A ile b ile karışık geliyorsa şu formül daha anlaşılabilir gelebilir.

    bir sonraki girdide örnek sorulara geçiyorum, o kısımda daha iyi oturacak.

    ekleme: ve

    #9355 hcauldfield1932 | 2 yıl önce (  2 yıl önce)
    1matematik terimi 
  2. bu girdi nolu girdinin devamı niteliğindedir.
    Aşağıdaki örneklerle daha iyi anlaşılabilecek teorem. Bu konuda kullanılan en yaygın örnek kanser testi örneğidir o yüzden o örnekle başlayacağım.

    örnek 1) Geçmiş gözlemlere dayanarak, sizin yaş grubunuzdaki insanların %1’inde olduğu tahmin edilen bir kanser türü için bir test mevcut. Ancak hiçbir test tamamen güvenilir değildir ve bu testin güvenilirliği de %99. Endişelendiniz ve test yaptırmak istediniz. Sonucu pozitif çıktı. Gerçekten kanser olma olasılığınız nedir?

    Çözüm:
    Soruyu okuyunca cevap direkt olarak %99 gibi geliyor, çünkü testin güvenilirliği %99. Ancak kanıtın, önsel olasılığı güncellemesi gerektiğini düşünerek soruyu tekrar dikkatlice okursak şu bilgilere erişeceğiz:

    önsel olasılık: sizin yaş grubunuzdaki birinin kanser olma olasılığı: %1 ya da 0.01
    olabilirlik: kanser hastalığınız varsa testinizin pozitif çıkma olasılığı %99 ya da 0.99. Çünkü testin güvenilirliği %99.
    kanıt: kanser olup olmanızın doğruluğu ile ilgilenmeden, testin pozitif çıkma olasılığı. (hatırlarsanız ilk girdide hipotezin doğruluğundan bağımsızdır demiştim.) yani başka bir deyişle, önsel olasılıkla (gerçekten kanser ve testi pozitif) çarpımının, önsel olasılığın tersiyle (gerçekte kanser değil ama testi pozitif) çarpımıyla toplamı bize kanıtı verecektir. Bu da;
    0.01x0.99 + 0.99x0.01 = 0.0198 olarak hesaplanır.

    sonsal olasılık= (önsel olasılık x olabilirlik)/kanıt = (0.01x0.99)/0.0198 = 0.5 olarak bulunur. Yani testiniz pozitif çıktıysa gerçekten kanser olma olasılığınız %50.

    peki Neden böyle oldu?
    Yaş grubunuzda 10000 kişi olduğunu varsayalım. Bunların 100’ü gerçekten kanserdir (%1). Test yapılırsa, test bu 100 kanserli hastanın 99’unu bulacak ancak birine hatalı negatif (false negative) verecektir. Gerçekte kanser olmayan 9900 kişinin ise 99’una hatalı pozitif (false positive) verecektir (çünkü %99 güvenilir, %1 hata payı var)

    Şimdi elimizde kaç pozitif oldu: 99+99 = 198.
    testi pozitif olan kaç gerçek kanser hastası var: 99
    Yani testiniz pozitifse gerçekten kanser olma olasılığınız: 99/198 = %50

    Soruya ilk bakışta testin güvenilirliğine bakarak %99 cevabı verenler aslında hatalı pozitifleri ve negatifleri hesaba katmadıkları için yanılıyorlar. Bayesçi yaklaşımla yeni bilgiyle önsel olasılığın güncellenmesi ise hatayı ortadan kaldırıyor.

    Örnek 2) Birinci sorudaki gibi bir testi yaptırdınız ve sonuç pozitif çıktı. Aynı testi ikinci kez yaptırdınız ve yine pozitif çıktı. Bu kez gerçekten kanser olma olasılığınız nedir?

    çözüm:

    İlk soruda önsel olasılığı, yeni bilgilerle güncelleyerek sonsal olasılığı elde etmiştik. Bu sorudaki kritik nokta; bir kez test yaptırdıktan sonra, ikinci testte o sonsal olasılık artık önsel olasılık olur. Çünkü zaten kanser olma olasılığınızı hesapladınız ve ilk soruda verilen bilgiler ışığında bu önsel olasılık %1 iken artık %50.

    şimdi güncel bilgilerle tekrar yazıyoruz:

    önsel olasılık: %50 ya da 0.5
    Olabilirlik: %99 ya da 0.99
    Kanıt: testin pozitif çıkma olasılığı. Yine önsel olasılıkla true positive (gerçekten kanser ve testi pozitif) çarpımının, önsel olasılığın tersiyle false positive (gerçekte kanser değil ama testi pozitif) çarpımıyla toplamı bize kanıtı verir. Bu da;
    0.5x0.99 + 0.5x0.01 = 0.4955
    Sonsal olasılık: (önsel olasılık x olabilirlik)/kanıt = (0.5x0.99)/0.4955 = 0.495/0.4955 = 0.99899 = %99.9
    Yani ilk testiniz pozitif çıktıktan sonra ikinci kez aynı testi yaptırıp, yine pozitif sonuç alırsanız %99.9 olasılıkla kansersiniz.
    Bu örnek büyük oranda şuradan alınmıştır.
    ama hemen hemen her yerde konuyla ilgili verilen ilk örnek kanser testidir zaten.

    Örnek 3) Pikniğe gitmeyi planlıyorsunuz ama sabah hava kapalı. Geçmiş verilere dayanarak yağmurlu günlerin %50’sinin hava kapalı olduğunda olduğunu görüyorsunuz. Öte yandan tüm günlerin %40’ında ise sabahları hava kapalı. Ve bulunduğunuz ay içinde sadece 3 gün yağmur yağıyor, bu da o ay içinde bir gün yağmur yağma olasılığını %10 yapıyor.
    O gün yağmur yağma olasılığı nedir?

    çözüm:

    Önsel olasılık: yağmur yağma olasılığı %10
    Olabilirlik: yağmur yağmasının doğru olması halinde, havanın kapalı olma olasılığı: %50
    Kanıt: yağmur yağsın ya da yağmasın havanın kapalı olma olasılığı. %40

    bu soru direkt olarak teoremin basit formuna örnek oluşturuyor.

    Sonsal olasılık = (önsel olasılık x olabilirlik)/kanıt = (0.1 x 0.5) x 0.4 = 0.125 = %12.5

    Son örnek de şu siteden alınmıştır.

    Bu girdide bayes teoremi’nin kullanıldığı ünlü bir davadan bahsedecektim ama o da üçüncü girdiye kaldı artık.
    #9360 hcauldfield1932 | 2 yıl önce (  2 yıl önce)
    1matematik terimi 
  3. bu girdi ve nolu girdilerin devamı niteliğindedir.

    bayes teoremi ünlü "o.j. simpson cinayet davası" olarak bilinen ünlü bir davada da kullanılmıştır. davanın tüm detaylarını yazmayacağım, isteyenler wikipedia linkinden erişebilir. tr.wikipedia.org/...
    ancak bilinmesi gereken nokta o.j. simpson'ın, eşi Nicole Brown Simpson'ı öldürmekle suçlanması ve daha önceden eşine şiddet uyguladığının bilinmesi.

    davada, simpson'ın avukatlarından Dershowitz, geçmiş verilere bakarak eşine şiddet uygulamış olan erkeklerin yalnızca 1/2500'ünün sonradan eşini öldürdüğünü, dolayısıyla daha önce eşine şiddet uygulamış olmasının onu öldürmüş olması için makul bir kanıt olmadığını iddia eder. (bu sayılar birkaç farklı kaynakta farklı geçiyor. ama çok küçük bir olasılık olduğunu anlayın.)

    ancak iddiasında dikkate almadığı ekstra bir bilgi vardır: nicole simpson'ın öldürülmüş olması olayı gerçekleşmiştir. bilgileri sıralayalım:

    üç farklı olay (event) var.
    1) eşin kocası tarafından öldürülmesi
    2) eşin kocası tarafından şiddete uğraması
    3) eşin öldürülmüş olması

    simpson'ın avukatı birinci olayın, ikinci olaya koşullu olarak gerçekleşme olasılığını 1/2500 olarak vermişti zaten. ancak elimizde eşin öldürülmüş olduğu gerçeği (üçüncü olay) var. bu yüzden sonsal olasılığın "eğer kocası tarafından şiddete uğrayan bir kadın öldürüldüyse, kadının kocası tarafından öldürülmüş olması olasılığı" şeklinde bulunması lazım.

    koşullu çoklu olaylar olduğu için bayes teoremi formülü çok karışık bir forma geliyor. o formun nasıl elde edildiğine değinmeyeceğim, ki zaten baya karışık. direkt sonuca gelirsek, tüm verileri yerine koyduklarında buldukları olasılık 8/9 civarında, yani "eğer kocası tarafından şiddete uğrayan bir kadın öldürüldüyse, öldüren kişi %88 olasılıkla kocasıdır". görsel olarak ağaca aktarım yardımıyla şu şekilde görülebilir. (bu arada tüm bayes soruları da ağaca aktarım yoluyla da çözülebilir ama ona da başka bir zaman değinirim artık.) sonucunda mahkeme süreci nasıl etkilendi bilmiyorum ama bu şekilde davada yer aldı bayes teoremi.

    girdideki olasılık değerlerini wikipedia'dan aldım: en.wikipedia.org/...

    bu dava olayı dışında, adli genetik başta olmak üzere birçok adli olayda kullanılabilir bayes teoremi.

    son olarak sözlük içi bir örnek vererek herkesin kafasında daha iyi canlanmasını istiyorum. soruyu kendim tasarladığımdan hata yapmamış olmayı umuyorum.

    :
    , sözlükte yazarlardan nude isteyip, onlardan aldığı nude'leri photoshop yardımıyla eserler haline getirerek kataloğu hazırlamaktadır. yıllarca yazdığı sözlükte bu sistemi sürdürdükten sonra başka bir sözlükte yazmaya başlar. yeni sözlükte rainbow dışında, üç yazar daha olduğunu varsayalım. (daha fazla da olabilir de işlemler uzamasın) kullanıcı isimleri sırasıyla: , ,

    rainbow'un aynı anda sadece bir yazardan nude istediği ve yeni sözlüğünde henüz kimseden istemediği bilinmektedir. rainbow'un geçmiş nude isteme davranışları incelendiğinde, yeni yazmaya başladığı sözlükte bachophile kullanıcı adlı yazardan nude isteme olasılığı %80, laylomcu kullanıcı adlı yazardan nude isteme olasılığı %8, kabizhipopotam kullanıcı adlı yazardan nude isteme olasılığı %12 olarak tahmin edilmektedir.

    kullanıcı adlı yazarın, bir başka yazar kendisinden nude istemesi halinde ona nude atma olasılığı %2'dir.
    kullanıcı adlı yazarın, bir başka yazar kendisinden nude istemesi halinde ona nude atma olasılığı %20'dır.
    kullanıcı adlı yazarın, bir başka yazar kendisinden nude istemesi halinde ona nude atma olasılığı %12'dur.


    , bir sonraki kataloğu yetiştirme derdine düşmüşken sözlükten nude istemeye karar verir. eğer rainbow'a nude atıldıysa, bunun hangi yazar tarafından atılmış olması en olasıdır?

    çözüm:

    soruyu dikkatli olarak okursanız bir koşullu olasılık sorusu olduğunu (nude atılması halinde...) ve yazarların nude gönderme olasılıklarının da koşullu olasılık olduğunu (nude istenmesi halinde...) görebiliriz. hemen soruda verilen bilgileri yazıyoruz.

    önsel olasılıklar: rainbow'un yazarlardan nude isteme olasılıkları. p(a)
    bachophile için %80 ya da 0.8
    laylomcu için %8 ya da 0.08
    kabizhipopotam için %12 ya da 0.12

    olabilirlikler: nude istenmesi halinde yazarların atma olasılıkları. p(b|a)
    bachophile için %2 ya da 0.02
    laylomcu için %20 ya da 0.2
    kabizhipopotam için %12 ya da 0.12

    kanıt: kimin göndermesini istediğinden bağımsız olarak rainbow'a nude atılmış olma olasılığı. p(b)
    bachophile için: 0.8x0.02 = 0.016
    laylomcu için: 0.08 x 0.2 = 0.016
    kabizhipopotam için 0.12x0.12 = 0.0144

    hepsini topladığımıza rainbow'a toplam nude gönderilme olasılığını buluyoruz ve bu da kanıt oluyor. 0.0464 yani %4.6

    (gönderme olasılığı düşük kişiden istemesi daha olası olduğu için nude alma olasılığı hayli düşük oluyor haliyle. umarım okuyunca kızmaz.)

    sonsal olasılıklar: p(a|b)
    geldik sorunun çözüm kısmına. her yazar için sırasıyla (önsel olasılık x olabilirlik)/kanıt işlemini yapacağız.
    bachophile için: (0.8x0.02)/0.0464 = 0.3448 = %34.5
    laylomcu için: (0.08x0.2)/0.0464 = 0.3448 = %34.5
    kabizhipopotam için: (0.12x0.12)/0.464 = 0.31 = %31

    görüldüğü üzere rainbow'un sözlükteki bir yazardan nude göndermesini istemesi halinde, verilen bilgilerle, ona nude atılması olasılığı %4.6. nude atılması halinde atılan nude'nin bachophile'den ya da laylomcu'dan gelme olasılıkları eşit ve en olası durumlar.


    #9381 hcauldfield1932 | 2 yıl önce
    4matematik terimi