Pro někoho to může znít jako noční můra, pro jiného je to další úroveň zábavy. Nový generátor videí Sora 2 od OpenAI umí využít reálné lidi, rozpohybovat je, ozvučit jejich hlasem a vložit do 10sekundové virtuální scény, kterou vytvoří na základě textového promptu.
Tyto avatary společnost nazývá cameos a k jejich vložení do systému se musí uživatel nejdříve „naskenovat“ pomocí mobilního telefonu. Podobný systém vytvoření avatara známe například z brýlí Vision Pro od společnosti Apple.
„Díky funkci cameos se můžete přenést přímo do jakékoli scény vytvořené Sorou s pozoruhodnou věrností, a to po krátkém jednorázovém nahrání videa a zvuku v aplikaci, která slouží k ověření vaší identity a zachycení vaší podoby,“ vysvětlují lidé z OpenAI na blogu.
Zástupci OpenAI uvedli, že aplikace obsahuje opatření, která zabraňují vytváření videí s veřejně známými osobnostmi nebo ostatními uživateli bez jejich souhlasu. Má k tomu vést už samotné nahrávání obrazu avatara do systému, kdy aplikace vyžaduje, aby uživatel pohyboval hlavou do různých směrů a řekl náhodnou posloupnost čísel. Uživatelé také budou mít možnost vidět návrhy videí, ve kterých se jejich podoba objevuje.
„Minulý týden jsme aplikaci interně spustili pro všechny zaměstnance OpenAI. Od našich kolegů jsme již slyšeli, že díky této funkci si ve společnosti nacházejí nové přátele. Myslíme si, že sociální aplikace postavená na této funkci „cameos“ je nejlepší způsob, jak zažít kouzlo Sora 2,“ popisují dále.
Právě nově spuštěná sociální síť na sdílení videí, která je zatím přístupná pouze na pozvánky a dostupná jen na iOS ve Spojených státech, může být dalším krokem společnosti, který jí pomůže získat potřebná data pro vývoj tohoto nástroje. Je přímo navržena pro vytváření a sdílení videí generovaných umělou inteligencí z textového zadání.
Napojení AI generátoru videí na sociální síť přitom není nic nového, již při uvedení systému Veo 2 od Googlu bylo možné jeho schopnosti využít v Youtube Shorts.
Vraťme se ale k novince od OpenAI. Nový generátor videí Sora 2 vylepšuje pochopení celé scény a fyziky, která se v ní odehrává.
„Náš nejnovější model generování videa je fyzicky přesnější, realističtější a ovladatelnější než předchozí systémy. Obsahuje také synchronizované zvukové efekty a dialogy,“ popisuje hlavní změny OpenAI.
Sora 2 tak má dokázat věci, které byly pro předchozí modely obtížné, až nemožné. OpenAI uvádí jako příklad třeba gymnastické sestavy, salta vzad na paddleboardu, která přesně modelují dynamiku vztlaku a pružnosti.
„Předchozí video modely jsou příliš optimistické – mění objekty a deformují realitu, aby úspěšně provedly textový příkaz. Například pokud basketbalista mine koš, míč se může spontánně teleportovat do koše. V modelu Sora 2 se míč odrazí od desky, pokud basketbalista mine koš,“ upozorňují tvůrci modelu. Pochvalují si tak, že model získal důležitou schopnost modelovat nejen úspěchy, ale i neúspěchy.
Problém s autorskými právy
I Sora 2 umožňuje uživatelům vytvářet a sdílet na sociálních sítích videa, která mohou být vytvořena z autorsky chráněného obsahu. Majitelé práv, například televizní a filmová studia, se musí aktivně odhlásit, pokud nechtějí, aby jejich díla byla použita, uvedli představitelé společnosti. Tento krok, který navazuje na dřívější zásady společnosti ohledně generování obrázků, pravděpodobně podle ČTK vyvolá kritiku v Hollywoodu.
Společnost OpenAI v posledních týdnech jednala s různými držiteli autorských práv o nové politice aplikace. Podle zdrojů se alespoň jedno velké studio, Disney, již rozhodlo, že jeho materiál se ve videích aplikace Sora objevovat nebude. Na začátku tohoto roku OpenAI také apelovala na administrativu Donalda Trumpa, aby oficiálně uznala, že když se AI učí z materiálů, které jsou chráněné autorským právem, např. filmy, seriály a knihy, nejde tím automaticky o porušení autorských práv. Považuje se to totiž podle OpenAI za tzv. fair use, tedy zákonné dovolené použití pro účely výzkumu, vzdělávání nebo vývoje technologie.