Odhad výsledků voleb funguje jako doporučování filmů na Netflixu, naznačuje AI expert

  • 5
Systém společnosti Blindspot Solutions dokázal odhadnout výsledek prvního kola prezidentských voleb už po sečtení 15 % okrsků. Z čeho vychází algoritmus pro odhad voleb a jak je chování lidí předvídatelné? Nejen to v Rozstřelu rozebírala s vedoucím AI projektů Jiřím Čermákem moderátorka Elen Černá.

Od zavření volebních místností do sečtení posledního hlasu uběhne podle typu voleb relativně mnoho času. A to je prostor pro různě sofistikované programy na odhad volebních výsledků. Jeden z nich vytvořili ve společnosti Blindspot Solutions a vytrénovali jej na datech z voleb za posledních pět let.

Jak vlastně taková umělá inteligence na odhad výsledků voleb vznikla a co bylo inspirací, i to byla jedna z oblastí, na kterou se ptala vedoucího AI projektů zmíněné firmy moderátorka Rozstřelu.

„Algoritmus, který my používáme, je metoda strojové učení, která je inspirována tím, jak velké streamovací služby typu Netflix, HBO Max, atd. doporučují obsah svým uživatelům,“ popisuje základy systému Čermák.

Také v tomto případě se podle něj vychází z historických preferencí. Vychází se z toho, na jaké filmy jste se dívali, a na základě preferencí jiných uživatelů s podobným „filmovým“ profilem se následně doporučují například novinky, premiéry a další filmový obsah, který by se vám mohl líbit. I v tomto případě se vychází u historických dat – z historických voleb. Systém strojového učení se pak učí podle toho, jak se vyvíjely volby do Poslanecké sněmovny či v předchozích prezidentských voleb atd. Z toho pak podle Čermáka vznikne jakési doporučení týkající se i nových kandidátů, kteří ve volbách nutně nemuseli nikdy dříve figurovat.

„Důležité je říct, že my pracujeme s historickými daty z předchozích voleb, jak je zveřejňuje Český statistický úřad, který detailně popisuje každý konkrétní okrsek. A pak, po zavření volebních místností, dostáváme průběžně sečtené údaje zhruba každých pět minut. A my se učíme na základě těch okrsků a preferencí voličů, které jsme viděli historii,“ popisuje hlavní logiku modelu vedoucí AI projektů Blindspot Solutions.

Jako příklad dává předchozí prezidentské volby, kdy se mezi sebou utkali Miloš Zeman a Jiří Drahoš. Systém strojového učení této firmy se pak na základě historických dat a prvních výsledků aktuální volby naučí, jak se voliči těchto dvou kandidátů přelévají mezi nové kandidáty. Čím více je sečtených okrsků, tím lépe si umělá inteligence dokáže představit, jak se voliči mezi kandidáty přelévají, a dokáže pak přesněji předpovídat, jak to dopadne ve zbytku okrsků, které ještě nemají zveřejněné výsledky.

Takové předpovědi mohou být velice rychlé, pokud se vybere správný model, který se hodí na velké populace lidí, kteří volí.

„Trend se pak dá vysledovat rychle a nějaké výkyvy, které jsou dané třeba sociální situací nebo tím, že se zvedla volební účast, a tím pádem byli vidět voliči, kteří předtím vidět nebyli, se v tom schovají,“ vysvětluje Čermák. Systém tak spoléhá na zákon velkých čísel, který říká, že při dostatečně velké populaci voličů nejsou výkyvy tak signifikantní, a výsledky se tak dají dobře předpovědět.

Zatímco sentiment na takto velké populaci lze předpovědět, u menších skupin to tak dobře nejde. „Kdybychom pracovali na nějakém výběru třeba, řekněme, sta lidí a měli jsme informace od deseti, tak tam to dobře fungovat nebude. Tam skutečně fungují ta velká čísla, která máme k dispozici,“ doplňuje odborník.

Rozstřel se však nezbýval jen otázkou odhadu výsledků voleb. Prostor dostaly i obecné dotazy na strojové učení a umělou inteligenci a její současný rozvoj a budoucnost. V Rozstřelu se tak dozvíte například i to, jak souvisí generativní modely strojového učení, které vám třeba nakreslí obrázek nebo vytvoří text s vakcínami nebo proteiny.