„Myslím, že je na místě potlesk. Dnes tady píšeme historii. Až o tom budete někdy v budoucnu vyprávět potomkům a pouštět jim dnešní podcast, můžete říci: slyšíš to tleskání? Tenkrát jsem tam tleskal i já,“ podtrhl výjimečnost události John Donovan, moderátor debat organizace Intelligence Squared.
Systém umělé inteligence „Project Debater“ vyvinutý společností IBM Research se totiž v předvečer konference IBM Think 2019 utkal v debatní soutěži s finalistou mistrovství světa v debatování a zároveň mistrem Evropy v debatování Harishem Natarajanem.
A vedl si velmi dobře.
Soutěž v debatování
V debatních soutěžích proti sobě stojí dva diskutující, přičemž jeden musí argumentovat „pro“ nějaké tvrzení a druhý naopak svými argumenty dané tvrzení vyvracet. Vítězem se stane ten, který v hlasování dokáže svoji argumentací přesvědčit více lidí.
Debata proběhla podle zjednodušené klasické šablony: obě strany pronesly úvodní řeč o délce čtyř minut, poté se pokusily ve čtyřminutové řeči vyvrátit argumenty protistrany, po čemž následovala dvouminutová závěrečná shrnující řeč obou stran.
Tématem, respektive otázkou, nad kterou debatovala umělá inteligence proti člověku zněla: „Měli bychom dotovat předškolní vzdělávání?“ „Project Debater“ měl myšlenku podpory předškolního vzdělávání argumentačně podporovat, Harish Natarajan naopak vyvracet. Téma bylo do poslední chvíle tajné, jak Project Debater, tak Natarajan se jej dozvěděli 15 minut před začátkem debaty, aby měli čas na přípravu úvodní řeči.
„Důležité je pamatovat na to, že Project Debater nebyl nikdy na vybrané téma trénován, bude to pro něj zcela nová věc,“ doplnil ana úvod Dario Gil, ředitel IBM Research.
Překvapivě dobré, na obou stranách
Debata mezi umělou inteligencí a debatním šampionem byl působivým zážitkem. I Project Debater mluvila (ano, je to oficiálně žena) od začátku k věci a zcela jednoznačně předkládala argumenty podporující myšlenku dotací předškolního vzdělávání - což zdaleka není tak samozřejmé, jak se zdá.
Na tom je totiž dobře vidět, že systém dokázal správně a do hloubky porozumět tématu a z obří znalostní databáze vybrat právě ty vhodné informace, přetavit je v argumenty a navíc je správně zformulovat v přirozeném lidském jazyce. Lze vlastně říci, že počítačový systém nejvíce prozradila jeho ne úplně přirozená hlasová syntéza.
Aniž bych se chtěl kohokoli dotknout, umělá inteligence předvedla lepší schopnost udržet téma a zformulovat myšlenku, než leckteří naši volení zástupci, které slyšíme v televizi.
Její závěrečnou řeč si můžete poslechnout v úvodním článkovém videu.
To nic nemění na tom, že na lidského oponenta nestačila. Projev Harishe Natarajana byl hutnější a konkrétnější a zejména v druhé řeči (ve které obě strany mají vyvracet argumenty protivníka, které zazněly v řeči první) bylo vidět, že Natarajan více reaguje na konkrétní umělou inteligencí vyřčené argumenty, zatímco Project Debater spíše pokračoval v argumentaci vlastní.
Diváci v sále měli na začátku i na konci debaty možnost hlasovat, na kterou stranu sporu se přidávají. Pro návrh „dotovat předškolní vzdělávání“ bylo před zahájení debaty 79 % hlasujících, po skončení debaty jen 62 % hlasujících. A protože počet nerozhodnutých se nezměnil, byl 17% rozdíl i v opačném směru. Svou argumentací tak posluchače více přesvědčil Harish Natarajan, čímž se stal vítězem debaty.
Zajímavé bylo, že v doplňkovém hlasování „kdo více obohatil vaše znalosti“ si vedla výrazně lépe Project Debater.
K čemu je to dobré?
Je hezké, že něco funguje, ale má taková věc vlastně reálné využití? Podle Noama Slonima z vývojového týmu Project Debater nemá vyvíjený systém umělé inteligence soutěžit s člověkem, ale naopak mu pomáhat.
Pokud se rozhodujeme v otázce, která nemá jedno jasně převažující a o fakta opřené řešení, ale je dostatek validních argumentů pro více závěrů, může být takováto debata s umělým systémem velmi cenným nástrojem. Použití systému Project Debater by nejspíše bylo mnohem rychlejším a nejspíše i levnějším řešením, než shánění kompetentního živého partnera pro diskuzi na dané téma.
Na systém Project Debater pracovali v IBM Research šest a půl roku. Využili i již hotové věci z předchozích projektů, jako systém práce s přirozenou řečí Watson Speech Recognition.
Systém pracuje nad databází deseti miliard vět ze článků z novin a (zejména, ale nejen) odborných časopisů. Jedním z úspěchů projektu je, že systém dokáže pochopit význam těchto vět a spojit si je do myšlenkových map. Během debaty systém není živě připojený k internetu, ale pracuje nad touto hotovou databází, harvesting nových informací probíhá jinde. Z toho vyplývá, že pokud by bylo téma debaty tak marginální nebo nové, že by nebylo ve zdrojových dokumentech dostatečně zastoupené, systém debatovat nebude.
Během debaty si systém z databáze „vytáhne“ stovky relevantních informací a poté se pokouší odstranit ty významově duplicitní, tak se snaží výsledný projev zahustit. Díky znalosti přirozeného jazyka není výsledek kompilátem uložených vět, ale je přímo systémem formulován.
Je nutné zdůraznit, že časové rozložení debaty je pro systém ideální, má čas si odpovědi připravit. V klasickém rozhovoru by zatím Project Debater nemohl obstát, byly by to příliš malé segmenty informací a příprava odpovědí by dialog zdržovala.
Systém využívá již strojovým učením zpracované znalosti o fungování světa a jeho principech, takže by například neměl používat argumenty, které jsou v rozporu se základními lidskými právy a podobně.
Vždy „jede“ ve více instancích, aby bylo možné, pokud by došlo k nějaké komplikaci, nepřerušovaně pokračovat. Spoustu času zabralo testování a ne vždy to šlo dobře. „Jednou se systém rozhovořil o sexuální výchově, která s předmětem debaty nijak nesouvisela. Smála se celá kancelář. Až na mne. Zrovna tam byla na návštěvě moje malá dcerka,“ zavzpomínal Noam Slonim.