Premium

Získejte všechny články
jen za 89 Kč/měsíc

Google chce měnit vyhledávání a také ukázal asistenta, který slyší a vidí

  7:53
Společnost Google na výroční konferenci tradičně nazvané I/O, představila řadu novinek. Všechny se točily kolem umělé inteligence. Největšího počtu uživatelů se patrně dotkne změna ve vyhledávání. Ale nové projekty Googlu nás možná s generativní umělou inteligencí (genAI) svážou ještě více.
Výroční konferenci Google I/O i v roce 2024 zahajuje CEO firmy Sundar Pichai

Výroční konferenci Google I/O i v roce 2024 zahajuje CEO firmy Sundar Pichai | foto: GoogleTechnet.cz

Pondělní představení novinek společnosti OpenAI, která provozuje asi nejznámější chatbot (ChatGPT) poháněný AI ukázal zajímavou kombinaci využití umělé inteligence, která reaguje na hlas a s pomocí kamery dokáže pracovat i s obrazem.

I Google, který nazývá svou generativní AI Gemini, nyní ukázal tzv. multimodální AI, tedy takovou, která není omezená jen na textová zadání, ale dokáže využít i obraz a zvuk a také je generovat.

Firma schopnosti tohoto systému ukázala v rámci ukázky z projektu Astra. V něm uživatelka procházela se zapnutou kamerou po pracovišti a například se zeptala, zda může Gemini najít nějaké zvukové zařízení.

Když systém upozornil na reproduktor, zaměřila na něj kameru a nakreslila na displeji šipku na výškový reproduktor, načež o něm chtěla vědět podrobnosti. Následně se přesunula k displeji, kde byl nějaký kód a ten chtěla popsat, což pro ni systém udělal. Další úkol dostala umělá inteligence poté, co kameru uživatelka zaměřila na okno a zeptala se, kde se nacházejí, na což jí AI odpověděla informací o místě.

Umělá inteligence od Googlu odhaduje, kam se uživatel dívá

Vedle řady dalších úkolů byl zajímavý i ten, kdy byly na tabuli nakresleny dvě kočky, přičemž jedna měla otevřené a druhá zavřené oči, demonstrátorka u obrázku přidržela krabičku a zeptala se AI, co jí to připomíná, ta odpověděla že Schrödingerovu kočku.

Projekt Astra ukazuje schopnosti multimodální generativní AI

I když je projekt Astra zatím ve vývojové fázi, firma některé jeho funkce brzy využije v jiných produktech. Především v připravovaném projektu AI agentů, což mají být jacísi univerzální asistenci, které si uživatel nakonfiguruje podle sebe.

Rozpoznávání věcí na obrázcích a rozpoznání jejich smyslu chce Google využít nové službě Ask Photos (Zeptej se Fotek). Gemini díky tomu umožní vyhledávat ve vašich fotografiích a videích. Na prezentaci si tak šéf firmy Sundar Pichai nechal vyhledat a ukázat fotografie, které měly ukazovat pokrok jeho malé dcery v plavání. Zeptal se ovšem třeba i na to, jakou má registrační značku auta, a vyhledala se mu nejen fotografie, ale Gemini její číslo vypsala i do odpovědi.

Ve své laboratoři Labs.Google firma také ukuchtila experimentální službu pro generování videa. VideoFX je nástroj využívající systém Veo, který je postavený na generativním modelu videa DeepMind. Experimentální nástroj je také vybaven režimem Storyboard, který umožňuje pracovat scénu po scéně a přidávat do výsledného videa hudbu.

VideoFX navazuje na již dříve uvedené generátory obrázků a hudby ImageFX a MusicFX, které nyní dostaly aktualizaci. Zároveň budou tyto nástroje v Google Labs nově dostupné ve 110 zemích a 37 jazycích.

Změna ve vyhledávání

To jsou všechno funkce, které ještě nejsou připraveny pro všeobecné použití a ne každý je využije. Na rozdíl od vyhledávání na Googlu, se kterým denně pracují miliardy lidí.

Už nyní jsme si mohli všimnout, že některé vyhledávače dávají do výsledků nejen odkaz na stránky, ale pokouší se zobrazit i relevantní odpovědi. Google tuto funkci nazývá AI overview a je podle ní určena k odpovědím na dotazy, když uživatel nemá čas dávat dohromady všechny potřebné informace. Google nabídne několik variant takového shrnutí s většími či menšími detaily, či zjednodušeným výstupem.

Nyní služba přechází z testovacího režimu do ostrého provozu. Nejdříve bude dostupná v USA a později přibudou další země.

Systém však v dohledné době zvládne i komplexnější dotazy, aby nebylo třeba dotaz rozdělit do několika vyhledávání. Uživatel tak bude moci položit najednou celý dotaz se všemi upřesněními a podrobnostmi.

Jako příklad uvedla Liz Reidová, která v Googlu šéfuje sekci vyhledávání hledání nového studio pro tréning jógy nebo pilates. V zadání bylo, že chce takové, které je oblíbené u místních obyvatel, má výhodnou polohu pro dojíždění a zároveň nabízí slevu pro nové členy. „Brzy budete moci pomocí jediného vyhledávání zadat něco jako „najdi nejlepší studia jógy nebo pilates v Bostonu a ukaž mi podrobnosti o jejich úvodních nabídkách a době chůze z Beacon Hill,“ uvedla Reidová. Systém pak vytvořil posunovací seznam tělocvičen s několika údaji a mapou, kde se nacházejí.

Ukázka vyhledávání pomocí AI Overview od Googlu

V další ukázce byl prezentující na pódiu při Google I/O předveden například i dotaz na naplánování jídelníčku na tři dny pro malou skupinu s pokrmy, které je jednoduché připravit. AI overview bude také možné použít jako studnici nápadů pro brainstorming, třeba při komplexním plánování nějaké události. Zpočátku bude nabízet tipy a rady pro to, kam jít na jídlo s ohledem na událost, která se bude slavit. Má být ale nápomocná třeba i při hledání receptů, filmů, hudby, knih, hotelů a při nakupování.

V neposlední řadě bude možné využít i video. Třeba pří hledání řešení proč nějaká věc nefunguje, což bylo na výroční konferenci Googlu prezentováno jako gramofonem, který nefunguje protože se přenoska pro uživatelku nečekaně odsouvala. Vyhledávání pomocí videa umožnilo najít slova k popisu problému a přehled s kroky k nápravě a odkazem na zdroje, odkud byly informace čerpány.

AI Overview od Goolgu nabízí řešení problémů na základě zadání pomocí videa a hlasového požadavku

Rychlý model

Google zároveň oznámil rozšíření schopností svého nejvyššího jazykového modelu Gemini 1.5 Pro, který nově dostává paměť na až 2 miliony tokenů (token u Gemini odpovídá přibližně 4 znakům, 100 tokenů je přibližně 60–80 anglických slov). To by mělo být nejvíce ze současných velkých jazykových modelů.

„U Gemini 1.5 Pro se vylepšilo generování kódu, logické uvažování a plánování, konverzaci s více účastníky a porozumění zvuku a obrazu díky pokroku v oblasti dat a algoritmů. U každé z těchto úloh vidíme výrazné zlepšení ve veřejných i interních srovnávacích testech,“ chlubí se Google.

Vedle toho se objevil i odlehčenější model Gemini 1.5 Flash (také multimodální) s rychlejší odezvou a levnějším provozem a pamětí milion tokenů. Oba systémy budou pro přístup k větší tokenové paměti dostupné v rámci předplatného Gemini Advanced přes Google AI Studio a Vertex AI.

Gemini 1.5 Flash i Pro mohou pracovat s milionem tokenů naráz

„Flash vyniká v sumarizaci, chatovacích aplikacích, titulkování obrázků a videí, extrakci dat z dlouhých dokumentů a tabulek a dalších funkcích. Je tomu tak proto, že byl vyškolen Gemini 1.5 Pro prostřednictvím procesu zvaného „destilace“, kdy jsou nejpodstatnější znalosti a dovednosti z většího modelu přeneseny do menšího a efektivnějšího modelu,“ popisuje schopnosti nového modelu Google.

Vedle toho mohou zájemci využít i původní modely Gemini 1.0 Pro, Ultra a Nano. Poslední zmíněný určený pro mobilní zařízení s Androidem dostal podporu práce s obrázky. Google uvedl i novou generaci opensource modelu Gemma2.

Další podrobnosti s některé další novinky představené na Google I/O najdete v naší galerii.

Autor:
  • Nejčtenější

Hackerský průlom. Z peněženky, k níž zapomněl heslo, získal miliony dolarů

v diskusi je 75 příspěvků

28. května 2024  18:02

V roce 2013 přišel Michael při poruše pevného disku o heslo k digitální peněžence, ve které měl...

Benzín dodá špagetám říz, pizzu vylepší lepidlo. Googlu se zbláznila AI

v diskusi je 92 příspěvků

29. května 2024

Snad žádná jiná technologie se nevyvíjela tak rychle jako v posledních měsících umělá inteligence....

{NADPIS}

{LABEL} {POPISEK}

Nejtěžší dělostřelecká baterie bojující proti invazi měla kanony z Plzně

v diskusi je 35 příspěvků

2. června 2024

Invazní síly mířící přes Kanál k plážím Normandie spatřila jako první posádka těžké dělostřelecké...

Nejlepší přítel zabijákem. Čína testovala robotického psa s útočnou puškou

v diskusi je 46 příspěvků

29. května 2024  11:23

Čína během společného vojenského cvičení Číny a Kambodži „Zlatý drak 2024“ testovala robotického...

{NADPIS}

{LABEL} {POPISEK}

Stalin, nebo Trockij? Před 100 lety se v Moskvě konal klíčový sjezd bolševiků

v diskusi je 21 příspěvků

1. června 2024

Před 100 lety probíhal v Moskvě třináctý sjezd ruských bolševiků, první sjezd po Leninově smrti....

Funkce Windows 11, které jsou zatím ve vývoji a možná se jich ani nedočkáme

v diskusi je 1 příspěvek

4. června 2024

Testovací verze Windows 11 ukazují možné nové funkce tohoto systému. V přípravě je například změna...

Před 100 lety zemřel v sanatoriu u Vídně světoznámý spisovatel Franz Kafka

v diskusi je 1 příspěvek

3. června 2024

Pražský německý spisovatel židovského původu Franz Kafka zemřel před 100 lety, třetího června 1924,...

Prohlížeč se schopnostmi, které v jiných jen tak nenajdete

v diskusi je 8 příspěvků

3. června 2024

Vivaldi je multiplatformní internetový prohlížeč. Netěší se sice tak velkému zájmu uživatelů jako...

Čínská sonda přistála na odvrácené straně Měsíce, chce odtud přivézt vzorky

v diskusi je 42 příspěvků

2. června 2024  11:35

Číně se podařil další krok v plánu, který jí umožní stát se prvním státem, která doveze na Zemi...

Akční letáky
Akční letáky

Prohlédněte si akční letáky všech obchodů hezky na jednom místě!

Vznikající nádor v těle signalizuje celá plejáda příznaků, říká neurochirurg

Premium Narodil se v USA, zkušenosti sbíral i ve světě, ale doma je v Praze. Specialista na operace mozku Jan Šroubek si nyní...

Posedlost sexem, tíže lásky, nekrofilie. Gejšin příběh zmátl Japonsko

Vine se jím sex, mocná záliba v sexu. Rovněž láska. Neukojitelná, doslova vražedná. Onen příběh se odehrál v kulisách...

Žádná tajná bokovka. S manželkou jsme rozvedeni, překvapil Petr Nedvěd

Generální manažer české hokejové reprezentace Petr Nedvěd (52) byl po divoké oslavě zlaté medaile z mistrovství světa...

Brankář Dostál zklamal fanynky. Randí s finskou volejbalistkou, bývalkou Nečase

Neprůstřelný gólman Lukáš Dostál (23) byl hvězdou letošního mistrovství světa v hokeji. Nadšení z něj byli nejen mužští...

Hana Vagnerová: Nikdo v USA neříkal, že bych měla být vdaná a mít děti

Herečka Hana Vagnerová (41) žila střídavě v Česku a USA. Aktuálně má za sebou natáčení amerického filmu s hvězdou...