I. Šance a pravděpodobnost

V předchozím oddíle jsme probírali vyhledávání a jeho uplatnění v případě, že máme úplné informace – například u her, jako jsou šachy. V reálném světě jsou však věci jen zřídkakdy tak jednoznačné.

Namísto úplných informací existuje celá řada neznámých možností od chybějících informací až po úmyslný klam.

Vezměme si například autonomní vozidlo – můžeme sice stanovit cíl dostat se z bodu A do bodu B efektivním a bezpečným způsobem, který je v souladu se všemi předpisy. Co se ale stane, je-li dopravní situace horší, než jsme čekali, třeba kvůli dopravní nehodě? Zhoršilo se náhle počasí? Nastaly náhodné události, například míč zakutálený na silnici nebo kus smetí blokující kameru vozidla?

samořídící automobil před značkou „Stop“

Autonomní vozidlo musí používat řadu senzorů, včetně senzorů na bázi ultrazvuku a kamer, aby mohlo rozpoznat, kde se nachází a co je kolem něj. Tyto senzory nejsou nikdy perfektní, a data ze senzorů vždy obsahují chyby a nepřesnosti zvané „šum“. Je běžné, že jeden senzor ukáže, že silnice před námi se stáčí doleva, zatímco jiný senzor ukazuje směr opačný. To je třeba vyřešit, aniž by vozidlo muselo vždy při byť jen minimálním šumu zastavovat.

Pravděpodobnost

Jedním z důvodů, proč moderní metody umělé inteligence – na rozdíl od většiny dřívějších zastaralých metod z 60. až 80. let 20. století – umí pracovat s problémy skutečného světa, je jejich schopnost si poradit s nejistotou.

Poznámka

Historie řešení nejistoty

Historie umělé inteligence zažila různé konkurenční přístupy k nejistým a nepřesným informacím. Možná jste například slyšeli o tzv. mlhavé neboli fuzzy logice. Fuzzy logika se nějakou dobu ucházela o post nejlepšího přístupu k řešení nejistých a nepřesných informací a používala se v mnoha aplikacích určených pro koncové uživatele, jako jsou pračky, kdy pračka uměla rozpoznat zašpinění (tj. míru zašpinění, nejen rozdíl mezi špinavým a čistým prádlem) a podle toho nastavit příslušný program.

Pro logickou argumentaci v nejistotě se však nejlepším přístupem ukázala být pravděpodobnost a téměř všechny současné aplikace umělé inteligence jsou na ní alespoň do určité míry založeny.

držící hrací karty

Proč na pravděpodobnosti záleží

Uplatnění pravděpodobnosti je možná nejznámější v rámci her: jaká je šance, že v pokeru dostanu tři karty stejné hodnoty (asi 1 ku 46), jaká je šance na výhru v loterii (velmi malá) a tak dále. Co je však mnohem důležitější, pravděpodobnost lze využít k vyčíslení a porovnání rizik v běžném životě: jaká je pravděpodobnost, že nabouráte, když překročíte povolenou rychlost, jaká je pravděpodobnost, že úrokové sazby z vaší hypotéky v příštích pěti letech vzrostou o pět procentních bodů, nebo jaká je pravděpodobnost, že umělá inteligence povede k automatizaci některých úkonů, např. odhalování zlomených kostí na rentgenových snímcích nebo obsluhování v restauraci?

Poznámka

Klíčová lekce o pravděpodobnosti

Nejdůležitějším poznatkem ohledně pravděpodobnosti, který bychom vám chtěli předat, není její výpočet jako takový. Spíše je to schopnost považovat nejistotu za něco, co lze alespoň v zásadě kvantifikovat. To znamená, že o nejistotě můžeme hovořit, jako by to bylo číslo – čísla lze porovnávat („je tohle pravděpodobnější než tamto“) a často je lze i měřit.

Jistě, měření pravděpodobností je těžké – k dosažení závěrů obvykle potřebujeme mnoho pozorování určitého jevu. Systematickým shromažďováním dat však můžeme kriticky hodnotit pravděpodobnostní prohlášení a někdy zjistíme, že naše čísla jsou správná nebo špatná. Klíčovým ponaučením jinými slovy je, že nejistota nestojí mimo racionální myšlení a diskusi a že systematický způsob takového racionálního myšlení a diskuse zajišťuje právě pravděpodobnost.

Skutečnost, že nejistotu lze vyčíslit, je nesmírně důležitá, například u rozhodování o očkování nebo jiných veřejných pravidlech a regulacích. Před uvedením na trh jsou všechny vakcíny klinicky testovány za účelem vyčíslení jejich přínosů a rizik. Rizika sice nikdy nejsou známa do nejmenších detailů, ale jejich závažnost lze obvykle určit natolik přesně, že můžeme posoudit, zda přínosy nad těmito riziky převažují.

Poznámka

Proč je důležité vyčíslit nejistotu

Budeme-li nejistotu považovat za něco, co nelze vyčíslit ani změřit, může aspekt nejistoty být překážkou pro racionální diskusi. Můžeme třeba argumentovat, že když přesně nevíme, zda vakcína nemůže mít škodlivé vedlejší účinky, je příliš nebezpečná. V důsledku toho se však může stát, že budeme ignorovat životu nebezpečnou nákazu, kterou vakcína vymýtí. Ve většině případů známe přínosy a rizika natolik přesně, že umíme jasně určit, zda jsou přínosy významnější než rizika nebo naopak.

Výše uvedený poznatek je užitečný v mnoha běžných scénářích i z profesního hlediska – například lékaři, soudci či investoři musí zpracovávat nejisté informace a na jejich základě činit racionální rozhodnutí. Jelikož toto je kurz umělé inteligence, budeme se zabývat tím, jak lze pravděpodobnost využít k automatizaci nejistého rozhodování. Jako příklady použijeme lékařskou diagnózu (i když to zrovna není úkol, který bychom chtěli zcela automatizovat) a detekci podvodných e-mailových zpráv („spamu“).

Úkol se načítá...

Šance vs. pravděpodobnost

Než budeme pokračovat, rádi bychom se ujistili, že vám nečiní potíže provádět základní výpočty poměrů (neboli zlomků). Jak asi víte, zlomky jsou čísla jako 3/4 a 21/365. Budeme zlomky násobit a dělit, takže si tyto operace raději osvěžte, pokud si jimi nejste jisti. Ucelenou prezentaci naleznete například zde: Umíme matiku: Zlomky. Další zábavnou animovanou prezentací základních operací se zlomky je Umíme matiku nebo Khan akademy. V případě potřeby můžete samozřejmě použít svůj oblíbený zdroj.

Šancí máme na mysli například poměr 3:1 (tři ku jedné), což znamená očekávání, že na každé tři případy určitého výsledku, jako je například výhra sázky, připadá jeden případ s opačným výsledkem, tj. prohra sázky. Jiným způsobem vyjádření téhož by bylo říci, že pravděpodobnost výhry je 3/4 (tři ze čtyř). Vyjádření tři ze čtyř má matematicky vzato stejnou hodnotu jako tři čtvrtiny. Při vyjadřování šance však používáme celá čísla (označujeme je jako přirozené četnosti). U celých čísel si třeba snadno představíme, že tři lidé ze čtyř mají hnědé oči. Nebo čtyři dny, z nichž tři prší (jste-li v Helsinkách).

tři osoby s hnědýma očima, jedna osoba s modrýma očima

Poznámka

Proč používáme šanci, a ne procenta

Tři ze čtyř je samozřejmě totéž co 75 % (matematici místo procent raději používají desetinná čísla jako 0,75). V anglosaském světě bylo zjištěno, že lidé se snáze spletou, když řeší zlomky (nebo desetinná čísla) a procenta, než když používají přirozené četnosti či šance. Velkou výhodou přirozených četností je navíc to, že dávají představu o “velikosti výzkumu”. Velikost čísla říká, kolik dní jsme sledovali počasí nebo u kolika lidí jsme zkoumali barvu očí, a tato velikost je zase důležitá pro představu, jak přesně je šance odhadnuta. Proto pokud možno používáme přirozené četnosti a šance.

Všimněme si, že i když se šance vyjadřuje dvěma čísly, například 3 a 1, lze ji také vyjádřit jako jeden zlomek nebo poměr, například 3/1 (tři děleno jednou), což se rovná 3. Šance 3:1 je tedy totéž co šance 6:2 nebo 30:10, jelikož tyto poměry se také rovnají 3. Obdobně platí, že šanci 1:5 lze vyjádřit jako 1/5 (jedna děleno pěti), což se rovná 0,2. Je to totéž jako šance 2:10 nebo 10:50, protože ke stejnému výsledku dospějete i vydělením čísla 2 číslem 10 nebo čísla 10 číslem 50. Ale pozor! Šance 1:5 (jedna výhra na každých pět proher), i když ji lze vyjádřit jako desetinné číslo 0,2, se liší od 20% pravděpodobnosti (neboli pravděpodobnosti 0,2 podle matematiků). Šance 1:5 znamená, že byste hru museli hrát v průměru šestkrát, abyste jednou vyhráli. Pravděpodobnost 20 % znamená, že na jednu výhru byste museli hrát v průměru pětkrát.

V případě šance, která je vyšší než jedna, např. 5:1, si snadno zapamatujeme, že nejde o pravděpodobnost, protože žádná pravděpodobnost nemůže být vyšší než 1 (nebo vyšší než 100%), avšak u šance menší než jedna, např. 1:5, nebezpečí zmatení existuje.

Ujistěte se tedy, že vždy víte, kdy jde o šanci a kdy o pravděpodobnost.

Následující úkol vám pomůže procvičit si vztahy mezi šancí a pravděpodobností. Nic si z toho nedělejte, pokud v této fázi budete chybovat – hlavním cílem je naučit se dovednosti, které budete potřebovat v dalších oddílech.

Úkol se načítá...