Meta zkouší svůj systém strojového učení, či chcete-li umělé inteligence, testovat na různých úlohách. Nedávno se rozhodla, že jej využije pro automatické ověřování stovek tisíců citací najednou, a to přímo na Wikipedii.

Automaty nyní mohou pomoci lidským editorům identifikovat bláboly nebo výroky, které nejsou ozdrojované. Výrazně složitější disciplínou je určit, zda zdroj skutečně podporuje tvrzení a právě v této oblasti chce svůj nástroj Meta nasadit. vyžaduje hloubku porozumění a analýzy systému AI.

„Na základě Meta AI jsme nyní vyvinuli první model schopný automaticky skenovat stovky tisíc citací najednou, abychom zkontrolovali, zda skutečně podporují odpovídající tvrzení,“ napsali vývojáři na blogu.

Metou vyvinutý model strojového učení skenuje citace a pak porovná jejich obsah s články na Wikipedii, a to včetně toho, že porovná i konkrétní citovaná čísla.

Není to přitom tak, že by systém srovnával, zda se citace ukázala na Wikipedii přesně v tom znění, které má v původním zdroji. Svým způsobem musí Meta AI pochopit, co je obsahem sdělení.

Nestačí tak porovnat textové řetězce, ale využívá srovnání matematických reprezentací bloků textu, ke kterým dospěje pomocí technik porozumění přirozenému jazyku (NLU).

„To, co jsme udělali, je vytvořit index všech těchto webových stránek tím, že je rozdělíme do pasáží a poskytneme přesnou reprezentaci pro každou pasáž,“ řekl Fabio Petroni, vedoucí Meta Fundamental AI Research, pro Digital Trends. „To nepředstavuje slovo od slova pasáž, ale význam pasáže. To znamená, že dva kusy textu s podobným významem budou reprezentovány ve velmi těsné poloze ve výsledném rozměrném prostoru, kde jsou uloženy všechny tyto pasáže,“ uzavírá.

Umělá inteligence je trénována na sadě čtyř milionů citací Wikipedie a kromě výběru chybných citací na webu by její tvůrci chtěli, aby nakonec byla schopna navrhnout přesné zdroje, které by zaujaly jejich místo, a to z masivního indexu dat, který se neustále aktualizuje.

Jedním z velkých problémů, které zbývá vyřešit, je práce v systému hodnocení spolehlivosti zdrojů. Například článek z vědeckého časopisu by získal vyšší známku než blogový příspěvek.

Meta svůj model zveřejnila s otevřeným zdrojovým kódem a ti, kteří jsou zvědaví, si mohou vyzkoušet demoverzi tohoto ověřovacího nástroje. Meta zdůrazňuje, že společnost na tomto projektu nespolupracuje s Wikimedií a že je stále ve fázi výzkumu. Proto se nyní nepoužívá k aktualizaci obsahu na Wikipedii.