Logo chatbota Gemini poháněného generativní umělou inteligencí od Googlu

Logo chatbota Gemini poháněného generativní umělou inteligencí od Googlu | foto: Google

Generativní AI Gemini od Googlu překonala v testu i lidské experty

  • 2
Google je zatím v oblasti generativní umělé inteligence spojován především se svým chatbotem Bard. Právě ten nyní dostává nový pohon v podobě velkého jazykového modelu Gemini. Nahrazuje předchozí PaLM2.

Google již na své vývojářské konferenci v květnu slíbil, že se Bard brzy dočká nového jazykového modelu Gemini 1.0. Nyní ten čas přišel a firma jej uvádí jako multimodální. To znamená, že si má poradit s textem, zvukem, obrázky i videem a také s programováním, respektive kódem.

„Navrhli jsme tedy Gemini tak, aby byl nativně multimodální, tedy od začátku předtrénovaný na různé modality. Poté jsme jej vyladili pomocí dalších multimodálních dat, abychom jej ještě více zefektivnili. Díky tomu Gemini bezproblémově rozumí všem druhům vstupů a uvažuje o nich mnohem lépe než stávající multimodální modely – a jeho schopnosti jsou nejpokročilejší v téměř každé oblasti,“ píše Google na blogu.

Google navíc připravil tři varianty tohoto modelu s označením Ultra, Pro a Nano. Ty se od sebe liší svými schopnostmi. Poslední zmíněný je navržen tak, aby byl úsporný, a je proto určený pro běh na jednom zařízení, jako je například mobilní telefon. Naproti tomu má nejvyšší model Ultra maximální schopnosti, a k jeho běhu je tak nejlépe využít nějaké datacentrum.

Google plánuje postupné uvolňování jednotlivých verzí modelu. Nano se tak objeví v telefonech Pixel 8 Pro. Gemini Pro má být již nyní součástí chatbota Bard a podle Googlu se více než vyrovná systému GPT-3.5 od OpenAI.

V Bardu zatím nebude uvolněna celá jeho funkčnost, ale reagovat bude jen na textové prompty (výzvy, zadání), podpora dalších modalit se podle firmy objeví již brzy. Bard s novým pohonem je nyní k dispozici pouze v angličtině ve více než 170 zemích, ale nepatří sem země EU. Google však slibuje, že v blízké budoucnosti se dostane do dalších jazyků a míst, a to včetně našich končin. Záležet patrně bude na dohodě o nastavení ochrany osobních údajů s orgány EU.

Na verzi Ultra, která v některých testech měla podle Googlu překonat i současný model GTP-4, si však musíme počkat až do zatím neurčeného termínu v příštím roce. Ta pak bude součástí chatbota Bard Advanced.

„S výsledkem 90,0 % je Gemini Ultra prvním modelem, který překonal lidské experty v testu MMLU (massive multitask language understanding), který využívá kombinaci 57 předmětů, jako je matematika, fyzika, historie, právo, medicína a etika, aby otestoval jednak obecné znalosti, ale také schopnosti řešit problémy,“ píše se na blogu Googlu.

Vedle schopností nového modelu Google vyzdvihuje i důraz na bezpečnost. Nastavené zabezpečení si má poradit se závadným obsahem, jako je například násilí.

„K diagnostice problémů bezpečnosti obsahu a k zajištění toho, aby ve fázích tréninku Gemini jeho výstupy dodržovaly naše zásady, používáme srovnávací testy, jako je například Real Toxicity Prompts.To je sada 100 tisíc zadání s různým stupněm toxicity, které vybrali odborníci z Allenova institutu pro umělou inteligenci,“ uzavírá Google.