Premium

Získejte všechny články
jen za 49 Kč/měsíc

Test odhalil devítiprocentní chybovost v AI odpovědích na Googlu

Autor:
Již téměř se i v našich končinách setkáváme při vyhledávání na Googlu s přehledy od AI (AI Overview). Nelze se na ně bezezbytku spolehnout. Dokazuje to nynější test, který zjistil, že v devíti procentech je souhrn informací vytvořený generativní umělou inteligencí nesprávný. Jinými slovy, jsou v něm nějaké chyby.

Ilustrační snímek | foto: Roman Všetečka, Technet.cz

Na celosvětovém internetu se slovo Google stalo synonymem pro vyhledávání. S loňským příchodem přehledů od AI se však původní vnímání vyhledávání jako zobrazení série odkazů na relevantní webové stránky změnilo.

Nynější souhrn údajů do textového výstupu, který se zobrazí vždy nahoře, je na první pohled efektivní cestou, jak se dobrat kýžené odpovědi. Je však třeba dát si pozor, jako je to ostatně vždy, když využíváme AI.

AI se zlepšuje, ale…

Deník The NewYork Times zopakoval po několika měsících svůj test, který se zaměřuje právě na přehledy od AI. Podle této analýzy, kterou provádí společně se startupem Oumi zabývajícím se umělou inteligencí, zvládly AI přehledy Google v únoru správně zodpovědět testovací dotazy zaměřené na faktickou správnost v 91 % případů, což představuje nárůst oproti 85 % v testu provedeném v říjnu.

Na druhou stranu při více než pěti bilionech položených dotazů Googlu ročně znamená devítiprocentní chybovost zobrazení stovek tisíc nesprávných odpovědí každou minutu.

Podle deníku společnost Oumi otestovala systém na 4 326 vyhledáváních. Použila přitom benchmark SimpleQA od OpeanAI. Zjistila, že přehledy generované umělou inteligencí byly přesné v 85 % případů u Gemini 2 a v 91 % případů po aktualizaci na Gemini 3.

Vyzkoušejte kouzelnou formulku, která ukáže Google bez AI a dalšího balastu

Většina odhalených chyb přitom nebyla přímo lživá tvrzení. V některých případech přehledy vynechaly důležité souvislosti, příliš zjednodušovaly složitá témata a nebo uváděla částečně správné informace jako přesné.

I když se schopnosti AI v tomto ohledu zlepšují, objevil se možná trochu překvapivý problém. Tím je práce se zdroji. Oumi zjistila, že více než polovina správných odpovědí z února odkazovala na zdroje, které nemusely skutečnosti takto uvádět.

Nevěřte jí. Výzkum ukazuje, že si AI vymýšlí i tam, kde se to možná nečeká

A to je samozřejmě problém v okamžiku, kdy si chcete odpověď od AI ověřit. Což byste podle našeho názoru měli dělat minimálně u důležitých věcí, vždy. V konečném důsledku tak v říjnu nebylo 37 % správných odpovědí podloženo a v únoru se tento podíl zvýšil na 56 %.

Společnost Google na tento test reagovala s tím, že studie používala chybný benchmark a neodrážela to, co lidé ve skutečnosti vyhledávají.

Vstoupit do diskuse (8 příspěvků)

Černobyl i Fukušima nás poučily. Dnes by naše jaderky odolaly i tornádu, říká expert

Nejčtenější

Jaká letadla používaly a používají severokorejské aerolinky

Iljušin Il-18 společnosti Air Koryo

S Air Koryo by chtěl letět každý dobrodruh. Jediný severokorejský letecký dopravce dnes provozuje tři pravidelné mezinárodní linky. Denní počty mezinárodních letů se pohybují od nuly do šesti....

Železnice zpřístupnila davům ztracené město Inků Machu Picchu

Železnice k Machu Picchu

Jedna z nejkrásnějších a nejznámějších železničních tratí světa vede pod zaniklé indiánské město Machu Picchu. Je to jediný možný způsob mechanizované dopravy do jeho blízkosti. Přestože jde o trať...

Sony slaví 80 let. Podívejte se na nejzajímavější televizory historie

Sony 80 let

Společnost Sony slaví 80 let existence a při příležitosti představení nových letošních televizorů se pochlubila výstavkou svých televizních milníků. Zatímco na novinky je ještě embargo, archivní...

Bezkřídlý zázrak i létající rakev. Jak vznikal legendární letoun F-104

F-104A Starfighter

Šestnáctého května si připomínáme jeden z milníků letecké historie. Letoun F-104 na základně Edwards AFB v Kalifornii dosáhl v roce 1958 průměrné rychlosti 2 259,538 km/h. Zajímavé je, že na krátký...

„S našimi zatracenými loděmi je dnes něco špatně.“ Sto deset let od Jutska

Studie bitvy u Jutska

Na přelomu května a června 1916 vypukla jedna z největších námořních bitev všech dob. Dodnes se diskutuje, kdo ji vyhrál. Věnujeme jí krátký seriál. Článek, který právě čtete, je jeho první díl.

Data v cloudu jsou snadný terč. Útočníkům stačí jedna chyba v nastavení

Ilustrační foto - kyberzločinci

Veřejný cloud se stal pro 80 % organizací klíčovým pilířem jejich podnikání. Jenže zatímco migrace dat probíhá v plném tempu, zabezpečení často pokulhává. Kyberzločinci se stále častěji zaměřují na...

21. května 2026

Lži a manipulace o druhé světové válce. Jak to bylo doopravdy

Kamarádi ve zbrani aneb vojáci Wehrmachtu a Rudé armády, Brest, 22.9.1939

Už jste slyšeli, že „Bushova rodina vyráběla Cyklon B“ nebo že „Německo za války financovaly americké firmy?“ Podobné a mnohé další nesmysly se pravidelně objevují při připomínkách historických...

21. května 2026

Za tajemstvím ultračistých krystalů. Fyzik prozrazuje, že výzkum v Česku si nezadá s tím na Západě

Premium
Michal Vališka.

„Nekonvenční supravodiče typu sloučenin UTe2 mohou vytvářet speciální stavy, jež by mohly být vhodné pro kvantové počítače,“ říká oceněný fyzik Michal Vališka z matfyzu, který v lednu převzal Cenu...

20. května 2026  12:30

Modrý měsíc 2026: Vzácný úplněk 31. května provází slavný omyl

Modrý Měsíc v plné kráse. I když název naznačuje barevnou změnu, ve skutečnosti...

Na noční obloze se občas odehrávají úkazy, které v kalendáři vyvolávají malý chaos. Jedním z nich je i takzvaný modrý měsíc. Ačkoliv jeho název svádí k představě o barevné proměně naší oběžnice, ve...

20. května 2026

Starý zvětšovák nevyhazujte. Propojte jej s mobilem a ulehčete si práci

V našem případě jsme pracovali se zvětšovacím přístrojem Magnifax s barevnou...

Není neobvyklé, že nám doma překáží zvětšovací přístroj pro výrobu klasických fotografií. Spolu se zásobou klasických negativů z minulosti tvoří základ „bedny“, kterou se zdráháme vyhodit. Odborník...

20. května 2026

Google ukázal, jak nám změní vyhledávání. Jeho AI více rozumí světu

Šéf společnosti Google zahajuje letošní vývojářskou konferenci firmy.

Mountain View (od zpravodaje Technet.cz) Společnost Google na své výroční konferenci představila řadu novinek, které podle ní mají změnit to, jak používáme AI. Běžný uživatel bude zřejmě nejvíce narážet na další změny ve vyhledávání, ale...

19. května 2026  21:57

Sony slaví 80 let. Podívejte se na nejzajímavější televizory historie

Sony 80 let

Společnost Sony slaví 80 let existence a při příležitosti představení nových letošních televizorů se pochlubila výstavkou svých televizních milníků. Zatímco na novinky je ještě embargo, archivní...

19. května 2026

Podívejte se na to nejlepší z oslav 70 let základy v Náměšti nad Oslavou

Dvojice nových vrtulníků UH-1Y Venom a AH-1Z Viper z domácí 22. základny...

22. základna vrtulníkového letectva v Náměšti nad Oslavou oslavila 70 let od svého založení. I před nepřízeň počasí zhlédly tisíce návštěvníků letecké ukázky současných, ale i historických strojů z...

19. května 2026

Železnice zpřístupnila davům ztracené město Inků Machu Picchu

Železnice k Machu Picchu

Jedna z nejkrásnějších a nejznámějších železničních tratí světa vede pod zaniklé indiánské město Machu Picchu. Je to jediný možný způsob mechanizované dopravy do jeho blízkosti. Přestože jde o trať...

18. května 2026

Přípravy na Artemis III běží, bude to poslední krok před letem na Měsíc

Premium
Při misi Artemis III NASA vyzkouší spojení lodi Orion s  měsíčními přistávacími...

Dubnová úspěšná mise Artemis II, při níž se při letu kolem Měsíce dostal člověk do zatím nejvzdálenějšího bodu od Země, byla jen dalším krokem k hlavnímu cíli. Tím je návrat lidí na povrch Měsíce....

18. května 2026

Dorůstání končetin a orgánů? Regenerace u lidí jen usnula, vědci ji umí probudit

Premium
Prekurzory kmenových buněk vznikají z univerzálních kmenových buněk, avšak jsou...

Mohly by lidem dorůst amputované končetiny? Nebo nám evoluce zavřela k růstu nových tkání cestu? Vědci dnes překvapivě tvrdí: „Regenerace u člověka pouze usnula. Umíme ji probudit.“

17. května 2026

„S našimi zatracenými loděmi je dnes něco špatně.“ Sto deset let od Jutska

Studie bitvy u Jutska

Na přelomu května a června 1916 vypukla jedna z největších námořních bitev všech dob. Dodnes se diskutuje, kdo ji vyhrál. Věnujeme jí krátký seriál. Článek, který právě čtete, je jeho první díl.

17. května 2026
Nastavte si velikost písma, podle vašich preferencí.