Zrobimy to, ponieważ wzór ten jest jednocześnie prosty i elegancki, a także niezwykle potężny. Można go stosować do oceny sprzecznych dowodów w medycynie, w sądzie i w wielu (jeśli nie we wszystkich) dziedzinach nauki. Wzór ten jest nazywany twierdzeniem Bayesa (lub wzorem Bayesa).
Pokazując siłę twierdzenia Bayesa, posłużymy się na początek prostym problemem z zakresu diagnostyki medycznej, na przykładzie którego widać, jak słabo nasza intuicja radzi sobie z łączeniem sprzecznych dowodów. Następnie pokażemy możliwości wykorzystania twierdzenia Bayesa do tworzenia metod sztucznej inteligencji, które mogą radzić sobie ze sprzecznymi i wprowadzającymi szum obserwacjami.
Kluczowe terminy
Twierdzenie Bayesa można wyrazić na wiele sposobów. Najprościej to zrobić, korzystając z szans. Koncepcja ta zakłada przyjęcie szans, że coś się wydarzy (w przeciwieństwie do tego, że się nie wydarzy), które zapiszemy jako szanse a priori. Sformułowanie „a priori” odnosi się do naszej oceny szans przed uzyskaniem nowych informacji, które mogą być ważne. Celem tego wzoru jest uaktualnienie szans a priori po udostępnieniu nowych informacji i otrzymanie w ten sposób szans a posteriori lub szans po uzyskaniu informacji (według słownika „a posteriori” oznacza coś, co następuje po, później).
Aby ocenić nowe informacje i określić, jak po ich udostępnieniu zmienią się szanse, musimy zastanowić się, jakie jest prawdopodobieństwo uzyskania takich informacji w poszczególnych sytuacjach. Weźmy jako przykład szanse, że dziś po południu będzie padać. Wyobraź sobie, że wstajesz rano w Finlandii. Szanse, że będzie padać, wynoszą 206 na 365 (w tym szanse na deszcz, śnieg i grad. Brrr.). Liczba dni bez deszczu wynosi zatem 159. Mamy zatem szanse a priori 206:159, na korzyść deszczu, więc masz pecha jeszcze zanim otworzysz oczy.
Kiedy jednak otwierasz oczy i wyglądasz na zewnątrz, zauważasz pochmurne niebo. Załóżmy, że szanse na pochmurny poranek w deszczowy dzień wynoszą 9 na 10 – oznacza to, że tylko jeden na dziesięć deszczowych dni przywita Cię błękitnym niebem. Ale czasem chmurom nie towarzyszy deszcz – szanse na obecność chmur w dzień bez deszczu wynoszą 1 na 10. O ile większe są zatem szanse na obecność chmur w deszczowy dzień w porównaniu z dniem bez deszczu? Zastanów się nad tym dobrze, ponieważ ważne będzie zrozumienie tego pytania i uzyskanie na nie odpowiedzi w dalszej części.
Odpowiedź brzmi: szanse na chmury są dziewięciokrotnie wyższe w deszczowy dzień niż w dzień bez deszczu. W deszczowy dzień szanse te wynoszą 9 na 10, natomiast w dzień bez deszczu szanse na chmury wynoszą 1 na 10, co oznacza, że szanse w dzień deszczowy są dziewięciokrotnie większe.
Kluczowe terminy
Powyższy iloraz (dziewięciokrotnie wyższe szanse na chmury w deszczowy dzień niż w dzień bez deszczu) jest nazywany ilorazem prawdopodobieństwa. Bardziej ogólnie iloraz prawdopodobieństwa to obserwowane prawdopodobieństwo w przypadku wystąpienia danego zdarzenia (w przykładzie powyżej deszczu) podzielone przez obserwowane prawdopodobieństwo w przypadku braku tego zdarzenia (brak deszczu). Przeczytaj proszę poprzednie zdanie kilka razy. Może wydawać się trochę straszne, ale da się je przetrawić, jeśli dobrze się skupisz. Przeprowadzimy Cię przez kolejne kroki, tylko trzymaj nerwy na wodzy. Już prawie nam się udało.
Stwierdziliśmy zatem, że w pochmurny poranek: iloraz prawdopodobieństwa = (9/10) / (1/10) = 9
Potężne twierdzenie Bayesa pozwalające przekształcić szanse a priori w szanse a posteriori to – uwaga, uwaga: szanse a posteriori = iloraz prawdopodobieństwa × szanse a priori
Pomyślisz teraz pewnie: Chwileczkę, i to jest ten wzór? Przecież to jest najzwyklejsze mnożenie! To jest właśnie ten wzór – mówiliśmy, że jest prosty, prawda? Trudno sobie wyobrazić, że proste mnożenie można wykorzystać do wszelkiego rodzaju niezwykle przydatnych zastosowań, ale tak jest. Omówimy kilka przykładów, które to zobrazują.
Uwaga
Jeżeli będziesz mieć problemy z wykonaniem poniższych ćwiczeń, spróbuj przeczytać wcześniejszy tekst kilka razy i poświęć mu trochę czasu, a jeżeli to nie pomoże, poszukaj dodatkowych materiałów w internecie. Jedna rada: twierdzenie Bayesa można zapisać na różne sposoby, a zapis szans, który stosujemy, nie jest najbardziej powszechny. Poniżej kilka linków, które mogą się przydać.
Pierwsze prawdziwe zastosowanie, którym się zajmiemy, to klasyczny przykład zastosowania twierdzenia Bayesa, a mianowicie diagnoza medyczna. Przykład ten ilustruje również błąd popełniany powszechnie przy okazji rozpatrywania niepewnych informacji, nazywany zaniedbywaniem miarodajności.
Przykładem niech będą badania przesiewowe w kierunku raka piersi. Posługując się wymyślonymi wartościami procentowymi dla uproszczenia liczb, przyjmijmy, że 5 na 100 kobiet choruje na raka piersi. Załóżmy, że badanie mammograficzne wykaże raka piersi u 80 na 100 chorych kobiet. W przypadku wyniku sugerującego obecność raka piersi mówimy, że wynik jest pozytywny, chociaż oczywiście dla osoby badanej nie ma w tym nic pozytywnego (technicznie można powiedzieć, że czułość badania wynosi 80 %).
Badanie może być zawodne również w drugą stronę, tzn. wykazać raka piersi tam, gdzie go nie ma. Mówimy wtedy o wyniku fałszywie pozytywnym. Przypuśćmy, że jeżeli badana kobieta w rzeczywistości nie choruje na raka piersi, wówczas szanse na to, że badanie mimo wszystko da wynik pozytywny, wynoszą 10 na 100.
Opierając się na powyższych założeniach, jesteś w stanie obliczyć iloraz prawdopodobieństwa. Skorzystasz z tego w kolejnym ćwiczeniu. Jeżeli nie pamiętasz, jak obliczyć iloraz prawdopodobieństwa, sprawdź ramkę w terminami we wcześniejszej części tej sekcji i przeczytaj jeszcze raz przykład o deszczu.