Premium

Získejte všechny články
jen za 89 Kč/měsíc

Jak vám Google vnucuje videa? Nahlédněte pod pokličku YouTube

aktualizováno  9:21
Při brouzdání po YouTube vás zřejmě napadlo, na základě čeho vám doporučuje videa. Ponořte se s námi do fungování algoritmu, který vyvíjí programátorská elita Googlu. Na problém manipulace se poté podíváme s jeho bývalým vývojářem, určování trendů objasní youtuber Tary a nakonec prozradíme, jak doporučení ovlivnit.

Pojďme se mrknout pod pokličku Youtubu, jak největší streamovací služba funguje. | foto: Fotomontáž Pavel Kasík

Možná se vám to také stalo. Večerní nuda a než si to uvědomíte, už se přes pravý panel návrhů proklikáváte YouTubem. Klik za klikem a najednou vůbec netušíte, proč koukáte na pouliční bitku, když jste začali u návodu na avokádovou pomazánku. Mnohdy pak v komentářích vedou věty „I´m on the weird part of YouTube again“ (v překladu: Jsem znovu na té divné stránce YouTubu). Jak se na ni dostaneme?

Rolls-Royce mezi programy

Zavede nás tam chytrý algoritmus. Vývojáři uvnitř firmy ho označují za „nejsofistikovanější doporučovací systém současnosti“. A proč jsou na něj tak pyšní? Systém doporučování využívá mnoho stránek a služeb, ovšem YouTube se musí vypořádat se třemi faktory:

  • Objem: Na YouTube najdete miliardy aktivních videí. Algoritmus tedy musí pracovat s ohromným množstvím dat. Na astronomická čísla se můžete podívat zde.
  • Aktuálnost: Každou minutu uživatelé nahrají 400 hodin videa. I ty musí software zpracovat a vyhodnotit jejich relevanci pro každého individuálního člověka.
  • Šum: V prodejně elektroniky jsou návrhy jednoduché. Když někdo brouzdá notebooky, doporučíte mu pod produktem jiný notebook nebo příslušenství. Ale uživatelské chování na YouTube je jen extrémně těžko předvídatelné. Někdy máte chuť si pustit energickou hudbu, jindy se zasmát u youtubera, večer si pustit tutoriál na zavázání kravaty a v noci teskné soundtracky. Úkolem algoritmu je najít ve vašem chování některé vzorce a na základě nich pak doporučovat.

Algoritmus v současnosti vyvíjí tým Google Brain - nejlepší mozky z Alphabetu zabývající se umělou inteligencí (AI). Algoritmus si samozřejmě YouTube střeží, ovšem jeho fungování zveřejnil (PDF, anglicky). Pokud se nechcete prokousávat složitější angličtinou, zkusíme si to zjednodušit.

Vysvětlení jednoduše Filtr přes dvě síta

Aby se AI prokousala množstvím videí a vybrala tucet vám šitých na míru, používá dvě síta. Tím prvním je generování kandidátů (candidate generation). To zúží díky vaší historii a kontextu (demografických údajů, lokace, slov ve vyhledávání) výběr řádově ze stamilionů na stovky.

Tento zlomek projde druhým sítem nazvaným hodnocení (ranking), které přidělí díky testování v reálném čase každému videu skóre - a jen ty nejvyšší si zaslouží místo na vaší hlavní stránce nebo pravém panelu návrhů.

Schéma sít

Do roku 2012 se autoři odměňovali za počet zhlédnutí - tedy kliknutí na video. Vznikala tak clickbaitová videa, u kterých ovšem uživatelé nevydrželi. Alphabet proto v roce 2012 vytvořil nové ústřední pravidlo. Nejdůležitější je délka sledování videa a uživatelé, kteří je chodí sledovat pravidelně, ostatní je podružné.

Je proto pravděpodobné, že se vám budou objevovat videa, která jste již viděli. Pokud u nich strávíte delší dobu a kliknete na ně dle nálady tu a tam znovu, YouTube nemá důvod vám ho opět nedoporučit, dokud vás neomrzí. Typickým příkladem jsou dlouhé mixy hudby nebo hodiny záznamu bouřky, které si lidé pouští jako podcast a doposlouchají celé.

Vysvětlení složitěji Neuronová síť nám studuje podvědomí

A teď se ponořme více do hloubky. Předchůdcem současného softwaru byla tzv. maticová faktorizace. Složitě znějící sousloví značí metodu doporučování na základě předchozí činnosti, v níž hledá skryté vzorce. Ty pak zpřesňují preference daného uživatele a lépe vyfiltrují výsledky. Výhodou maticové faktorizace je adaptace na změny, tedy v našem případě nával nových videí nebo měnící se zájem uživatele.

Podle vývojářů Googlu je tato metoda zbytečně složitá. Vyvinuli proto neuronovou síť, která z faktorizace vychází a zjednodušuje ji. Algoritmus se opírá primárně o naši historii spolu se zmíněnými skrytými náznaky, které jdou podle vývojářů do hloubky více než řízená zpětná vazba (líbí/nelíbí se mi, dotazníky). Můžeme si to představit tak, že metoda spíše než z vědomí čerpá z našeho podvědomí.

Vyhledávání hraje roli

Schéma zúžení výběru

Pro software je stejně důležitá historie sledování jako hledání. Cokoli, co zadáte do vyhledávače, se zaindexuje a promítne do následných návrhů. Nehledě na to, jestli jste na nalezená videa klikli. Do souhrnu dat se přidají demografické údaje - věk, pohlaví i stát, to vše má o vás Google k dispozici. Vývojáři si uvědomují, že uživatelé preferují nová videa, a proto i datum publikace se řadí mezi klíčové faktory.

Prvním sítem projde jen pár stovek videí. Díky zúženému vzorku se může v druhém sítu zapojit faktorů mnohem více. Některé z nich jsou binární, tedy mají pouze dva možné výsledky (např. je-li uživatel přihlášen). Většina má miliony různých variant (např. poslední hledaný výraz) a kategorií jsou stovky. Software je musí rychle zpracovat, ovšem vývojáři přiznávají, že neuronová síť v reálném čase všechny faktory nestíhá a pracuje s tím, co aktuálně má.

Učte děti programovat, radí expertka z Googlu. Umělá inteligence je překvapivě stará

Kromě toho se do hry zapojují nejen atributy uživatele, ale i samotného videa. Je přehráváno více v Brazílii? Proklikli se na něj lidé z tohoto videa? Podobně si software zjišťuje váš zájem o kanály. Sledujete jeho videa pravidelně? Proč u nich nevydržíte do konce? Proč jste přestali kanál odebírat?

Ze získaných dat pak algoritmus vygeneruje pro video nominální skóre, které se odvíjí od předpokladu dvou věcí - zda na něj kliknete a jak dlouho na něm strávíte. Štve vás nějaké video, které se vám neustále zobrazuje? Je to tím, že má vysoké skóre. Snížit ho můžete tak, že ho budete ignorovat, dokud nezmizí, nebo na něj kliknete a po vteřině utečete pryč. Přesně to totiž software nemá rád.

Trendy „Pozitivní diskriminace“ v praxi

Na hlavní stránce se setkáte i s tzv. trendy. Jde o panel videí, která jsou aktuálně populární. Ale popularita není vše. „Některé trendy jsou předvídatelné, jako nová píseň od známého interpreta, jiné jsou ovšem zcela překvapivé. Proto se snažíme o kombinaci popularity a novinek,“ píší vývojáři.

Pořadí trendů (#1, #2...) se určuje zejména podle rychlosti růstu zhlédnutí, místa vzniku a dalších faktorů. Proto video s největším počtem zhlédnutí nemusí být nutně na prvním místě. Že počty zhlédnutí nehrají hlavní roli potvrzuje i známý český youtuber Tary.

YouTube zkouší nahradit pozadí i bez zeleného plátna

„Ještě před rokem se do trendů dostalo téměř vše, co mělo abnormální počet lajků a komentářů. A díky tomu jsem získal 400 tisíc odběratelů za rok. Fungovalo to tak, že jsem řekl: Pojďme hecnout 50 tisíc lajků. Uživatelé to zvládli, Youtube poznal, že to je trendy a hodil to tam. A to samé platilo u komentářů,“ popisuje úspěšný youtuber.

Od prosince loňského roku se ovšem systém výběru proměnil. „V trendech se nově objevují i videa s málo zhlédnutími i lajky. Je to díky kategorii, kam spadají. YouTube zřejmě vymezil určité kvóty z jednotlivých kategorií,“ říká Tary. Například vlog z jízdy na motorce může být méně úspěšný než hudební novinky, ale díky kategorii auto-moto se do trendů zařadí.

Manipulace Ovlivňuje umělá inteligence běh společnosti?

V poslední době se řeší vliv fake news na výsledky voleb. Otázkou je, jestli nás více neovlivňuje něco „z vlastních řad“. O hrozbě YouTube na mínění populace promluvil pro The Guardian jeden z těch, kdo vidí pod pokličku - vývojář algoritmu návrhů.

„YouTube se tváří jako realita, ale je pokřivená, abychom na něm trávili více času,“ říká francouzský programátor Guillaume Chaslot. Google ho propustil v roce 2013. Oficiální důvod: výkonnostní problémy. Chaslotova verze: snažil se prosadit změnu, aby byl algoritmus „víc fér“.

Rusko zkouší ovlivnit dění všude po světě. Jinak, než si většina myslí

Představy o ruských hackerech jsou často zjednodušené (ilustrační snímek)

Po padáku se začal do hloubky věnovat strojovému učení, na kterém se spolupodílel. A během amerických prezidentských voleb si všiml menší anomálie. „Bylo to zvláštní. Nezávisle na tom, jestli jste začali hledat Trumpa nebo Clintonovou, návrhy videí vás tlačily do protrumpovské oblasti,“ říká Chaslot.

Autor článku v The Guardian Paul Lewis se rozhodl jeho teorii prověřit. Prošel tisícovku nejúspěšnějších videí spojených s volbami a došel k šokujícímu skóre: 551:92 (360 neutrálních). YouTube šestkrát častěji doporučoval videa, která pomáhala Trumpovi než Clintonové. Algoritmus tak jistě nebyl přednastaven, ale díky uživatelskému jednání se tak začal chovat. Jednoduše řečeno: lidem se více líbila videa o Trumpovi, tak je YouTube začal doporučovat.

Chaslot spustil vlastní stránku algotransparency.org, kde vysvětluje, jak dle něj YouTube propaguje konspirační teorie nebo upřednostňuje některé volební kandidáty.

Z pohledu uživatele Jak mohu doporučení ovlivnit?

No a jak můžete přímo vy zasáhnout do nabízení videí? Jako uživatelé máte vícero možností. Jedním z nich je přihlášení: „Když začnete sledovat videa přihlášení, budete dostávat více personalizované návrhy,“ vysvětluje pro Technet Alžběta Houzarová z Googlu.

„Pokud nejste s doporučeními spokojeni, videa, kanály a sekce, které vás nezajímají, můžete odstranit a svá doporučení tak vylepšit.“ To můžete udělat pomocí funkce Nezajímá mě.

Nezajímá mě

„Pokud z jednoho kanálu odstraníte dvě nebo více videí, tento kanál už vám nebude doporučován,“ pokračuje Houzarová. „V případě, že jste omylem odstranili doporučení, která chcete zachovat, můžete jej klepnutím na tlačítko Zpět vrátit. To je v tuto chvíli možné pouze na počítači.“

Je také možné, že jste odstranili kanály, které vás nezajímaly, a nyní již ano. To napravíte na stránce history.google.com, kde kliknete na otevřenou nabídku a poté na „Zpětná vazba Nezajímavé“. Doporučení obnovíte kliknutím na „Smazat zpětnou vazbu“. A doporučení můžete ovlivnit i v historii vyhledávání.

„Řekněme, že jste hledali určité téma, například výměnu řetězu kola. Ale teď je to ve vašich doporučeních samé video s koly. Stačí přejít do historie sledování a vyhledávání a vymazat tato konkrétní videa a výrazy,“ doplňuje Houzarová s varováním, že vymazání nelze vrátit zpět.

Příště se podíváme pod pokličku jiné softwarové zbraně YouTubu - programu Content ID, který bdí nad autorskými právy a blokuje videa, která dle něj kopírují obsah.

Kdo ovlivňuje podobu vaší hlavní stránky Facebooku a jak na něj vyzrát

Jak vám facebook sestavuje obsah hlavní stránky na míru?

Zajímalo vás někdy, proč na Facebooku vídáte příspěvky v pořadí, v jakém jsou? Odpovědí je News...

YouTube jako továrna na peníze. Jak na tomto portálu funguje reklama?

YouTube jako továrna na peníze

Vše se točí kolem peněz a na YouTube to není jinak. Jenže když se do reklamního kolotoče zamotají...

Video bylo zablokováno. Jak Youtube zvládá kontrolovat miliardy videí

Content ID

Běžní uživatelé o programu Content ID mnohdy neslyšeli. Autoři mu fandí, protože díky němu získali...

Jak vám Google vnucuje videa? Nahlédněte pod pokličku YouTube

Youtube pod pokličkou

Při brouzdání po YouTube vás zřejmě napadlo, na základě čeho vám doporučuje videa. Ponořte se s...

  • Nejčtenější

Pátý Starship odstartoval a pak jeho stupeň zachytila Mechazilla

Excitement guaranteed. Nadšení zaručeno. V rozpisu aktivity před startem a po něm rakety Starship společnosti SpaceX takto označený okamžik dvě sekundy před vzletem, kdy 33 motorů Raptor prvního...

13. října 2024  11:03,  aktualizováno  14:33

Udělá cesta na Mars z astronautů invalidy? Lékaři tápou a výzkumy varují

Přistání lidí na Marsu se zdá otázkou nepříliš vzdálené budoucnosti. Lékaři však zatím vědí zoufale málo o tom, jak by lidský organismus let na rudou planetu zvládal. Nejnovější výzkumy naznačují, že...

15. října 2024

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

V sobotu bude nejblíže Zemi kometa, kterou uvidíte pouhým okem

Jako nejjasnější kometu minimálně od roku 2007 popisuje astrofotograf Petr Horálek přilétající kometu Tsuchinshan–ATLAS, která má katalogové označení C/2023 A3. Jiní o ní hovoří dokonce jako o kometě...

11. října 2024  16:41

Nobelovu cenu za fyziku získali vědci za strojové učení a neuronové sítě

Královská švédská akademie věd letos ocenila za výzkum na poli fyziky vědce Johna J. Hopfielda a Geoffreyho E. Hintona „za zásadní objevy a vynálezy, které umožňují strojové učení za pomocí umělých...

8. října 2024  11:48,  aktualizováno  13:31

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

V šestnácti ohromil NASA. Čech chce laserem opravovat nefunkční družice

Premium

O kosmonautiku a vesmír se začal zajímat díky Star Wars. Dá se říct, že mu filmy ukázaly životní cestu. Nadšení přivedlo Simona Klingu až k mezinárodní soutěži Conrad Challenge, kterou se svým týmem...

10. října 2024

Speciál „Chytrý dům“ se rozjíždí, pomůže vylepšit i vaši domácnost

Můžete s ní hodně ušetřit, může vám zpříjemnit a zjednodušit život. A nebo taky zkoušet vaši trpělivost. Chytrá domácnost je dostupnější a funkčnější než kdy dříve, ale zorientovat se v možnostech...

15. října 2024  14:27

Udělá cesta na Mars z astronautů invalidy? Lékaři tápou a výzkumy varují

Přistání lidí na Marsu se zdá otázkou nepříliš vzdálené budoucnosti. Lékaři však zatím vědí zoufale málo o tom, jak by lidský organismus let na rudou planetu zvládal. Nejnovější výzkumy naznačují, že...

15. října 2024

Výzkum odhalil, zda dinosauři svými ocasy překonávali rychlost zvuku

V roce 1997 publikovali paleontologové Nathan P. Myhrvold a Philip J. Currie studii, v níž přišli s odvážnou myšlenkou, že apatosauři i další diplodokidi možná záměrně švihali svými ocasy tak, aby...

15. října 2024

Linux není jen pro geeky. Boříme mýty

Zvažujete změnu operačního systému? Linux by mohl být tím pravým řešením. Moderní distribuce nabízejí intuitivní prostředí a širokou kompatibilitu s hardwarem i softwarem. Určené jsou jak pro práci,...

14. října 2024

Porno a Česko. Jsme téměř unijním extrémem, ukázala data

Je to vlastně vedlejší, nezamýšlený produkt evropské legislativy. Její nařízení o digitálních službách necílilo na...

Zemřel český raper Pavel Protiva. Bylo mu sedmadvacet let

V sedmadvaceti letech zemřel raper Pavel Protiva, informovalo hudební vydavatelství Blakkwood, pro které umělec tvořil....

Mlčení o mzdách padne. Lidé budou mít právo ptát se, kolik berou kolegové

Premium Zaměstnavatelé budou muset uchazečům o práci prozrazovat, jaký minimální rozpočet na danou pozici mají k dispozici....

Karel Janeček žaluje exmanželku o bitcoiny. Chce je zpět, jde o víc než miliardu

Miliardář Karel Janeček se soudí s exmanželkou Mariem Mhadhbi o kryptoměny, které jí před lety daroval při rozvodovém...

Výrobce luxusní minerálky má problém. Jeden z jeho vrtů je kontaminovaný

Značka luxusní minerální vody Perrier je symbolem privilegované „francouzskosti“. Má miliardový obrat a její zelené...