Premium

Získejte všechny články mimořádně
jen za 49 Kč/3 měsíce

Jak vám Google vnucuje videa? Nahlédněte pod pokličku YouTube

aktualizováno  9:21
Při brouzdání po YouTube vás zřejmě napadlo, na základě čeho vám doporučuje videa. Ponořte se s námi do fungování algoritmu, který vyvíjí programátorská elita Googlu. Na problém manipulace se poté podíváme s jeho bývalým vývojářem, určování trendů objasní youtuber Tary a nakonec prozradíme, jak doporučení ovlivnit.

Pojďme se mrknout pod pokličku Youtubu, jak největší streamovací služba funguje. | foto: Fotomontáž Pavel Kasík

Možná se vám to také stalo. Večerní nuda a než si to uvědomíte, už se přes pravý panel návrhů proklikáváte YouTubem. Klik za klikem a najednou vůbec netušíte, proč koukáte na pouliční bitku, když jste začali u návodu na avokádovou pomazánku. Mnohdy pak v komentářích vedou věty „I´m on the weird part of YouTube again“ (v překladu: Jsem znovu na té divné stránce YouTubu). Jak se na ni dostaneme?

Rolls-Royce mezi programy

Zavede nás tam chytrý algoritmus. Vývojáři uvnitř firmy ho označují za „nejsofistikovanější doporučovací systém současnosti“. A proč jsou na něj tak pyšní? Systém doporučování využívá mnoho stránek a služeb, ovšem YouTube se musí vypořádat se třemi faktory:

  • Objem: Na YouTube najdete miliardy aktivních videí. Algoritmus tedy musí pracovat s ohromným množstvím dat. Na astronomická čísla se můžete podívat zde.
  • Aktuálnost: Každou minutu uživatelé nahrají 400 hodin videa. I ty musí software zpracovat a vyhodnotit jejich relevanci pro každého individuálního člověka.
  • Šum: V prodejně elektroniky jsou návrhy jednoduché. Když někdo brouzdá notebooky, doporučíte mu pod produktem jiný notebook nebo příslušenství. Ale uživatelské chování na YouTube je jen extrémně těžko předvídatelné. Někdy máte chuť si pustit energickou hudbu, jindy se zasmát u youtubera, večer si pustit tutoriál na zavázání kravaty a v noci teskné soundtracky. Úkolem algoritmu je najít ve vašem chování některé vzorce a na základě nich pak doporučovat.

Algoritmus v současnosti vyvíjí tým Google Brain - nejlepší mozky z Alphabetu zabývající se umělou inteligencí (AI). Algoritmus si samozřejmě YouTube střeží, ovšem jeho fungování zveřejnil (PDF, anglicky). Pokud se nechcete prokousávat složitější angličtinou, zkusíme si to zjednodušit.

Vysvětlení jednoduše Filtr přes dvě síta

Aby se AI prokousala množstvím videí a vybrala tucet vám šitých na míru, používá dvě síta. Tím prvním je generování kandidátů (candidate generation). To zúží díky vaší historii a kontextu (demografických údajů, lokace, slov ve vyhledávání) výběr řádově ze stamilionů na stovky.

Tento zlomek projde druhým sítem nazvaným hodnocení (ranking), které přidělí díky testování v reálném čase každému videu skóre - a jen ty nejvyšší si zaslouží místo na vaší hlavní stránce nebo pravém panelu návrhů.

Schéma sít

Do roku 2012 se autoři odměňovali za počet zhlédnutí - tedy kliknutí na video. Vznikala tak clickbaitová videa, u kterých ovšem uživatelé nevydrželi. Alphabet proto v roce 2012 vytvořil nové ústřední pravidlo. Nejdůležitější je délka sledování videa a uživatelé, kteří je chodí sledovat pravidelně, ostatní je podružné.

Je proto pravděpodobné, že se vám budou objevovat videa, která jste již viděli. Pokud u nich strávíte delší dobu a kliknete na ně dle nálady tu a tam znovu, YouTube nemá důvod vám ho opět nedoporučit, dokud vás neomrzí. Typickým příkladem jsou dlouhé mixy hudby nebo hodiny záznamu bouřky, které si lidé pouští jako podcast a doposlouchají celé.

Vysvětlení složitěji Neuronová síť nám studuje podvědomí

A teď se ponořme více do hloubky. Předchůdcem současného softwaru byla tzv. maticová faktorizace. Složitě znějící sousloví značí metodu doporučování na základě předchozí činnosti, v níž hledá skryté vzorce. Ty pak zpřesňují preference daného uživatele a lépe vyfiltrují výsledky. Výhodou maticové faktorizace je adaptace na změny, tedy v našem případě nával nových videí nebo měnící se zájem uživatele.

Podle vývojářů Googlu je tato metoda zbytečně složitá. Vyvinuli proto neuronovou síť, která z faktorizace vychází a zjednodušuje ji. Algoritmus se opírá primárně o naši historii spolu se zmíněnými skrytými náznaky, které jdou podle vývojářů do hloubky více než řízená zpětná vazba (líbí/nelíbí se mi, dotazníky). Můžeme si to představit tak, že metoda spíše než z vědomí čerpá z našeho podvědomí.

Vyhledávání hraje roli

Schéma zúžení výběru

Pro software je stejně důležitá historie sledování jako hledání. Cokoli, co zadáte do vyhledávače, se zaindexuje a promítne do následných návrhů. Nehledě na to, jestli jste na nalezená videa klikli. Do souhrnu dat se přidají demografické údaje - věk, pohlaví i stát, to vše má o vás Google k dispozici. Vývojáři si uvědomují, že uživatelé preferují nová videa, a proto i datum publikace se řadí mezi klíčové faktory.

Prvním sítem projde jen pár stovek videí. Díky zúženému vzorku se může v druhém sítu zapojit faktorů mnohem více. Některé z nich jsou binární, tedy mají pouze dva možné výsledky (např. je-li uživatel přihlášen). Většina má miliony různých variant (např. poslední hledaný výraz) a kategorií jsou stovky. Software je musí rychle zpracovat, ovšem vývojáři přiznávají, že neuronová síť v reálném čase všechny faktory nestíhá a pracuje s tím, co aktuálně má.

Učte děti programovat, radí expertka z Googlu. Umělá inteligence je překvapivě stará

Kromě toho se do hry zapojují nejen atributy uživatele, ale i samotného videa. Je přehráváno více v Brazílii? Proklikli se na něj lidé z tohoto videa? Podobně si software zjišťuje váš zájem o kanály. Sledujete jeho videa pravidelně? Proč u nich nevydržíte do konce? Proč jste přestali kanál odebírat?

Ze získaných dat pak algoritmus vygeneruje pro video nominální skóre, které se odvíjí od předpokladu dvou věcí - zda na něj kliknete a jak dlouho na něm strávíte. Štve vás nějaké video, které se vám neustále zobrazuje? Je to tím, že má vysoké skóre. Snížit ho můžete tak, že ho budete ignorovat, dokud nezmizí, nebo na něj kliknete a po vteřině utečete pryč. Přesně to totiž software nemá rád.

Trendy „Pozitivní diskriminace“ v praxi

Na hlavní stránce se setkáte i s tzv. trendy. Jde o panel videí, která jsou aktuálně populární. Ale popularita není vše. „Některé trendy jsou předvídatelné, jako nová píseň od známého interpreta, jiné jsou ovšem zcela překvapivé. Proto se snažíme o kombinaci popularity a novinek,“ píší vývojáři.

Pořadí trendů (#1, #2...) se určuje zejména podle rychlosti růstu zhlédnutí, místa vzniku a dalších faktorů. Proto video s největším počtem zhlédnutí nemusí být nutně na prvním místě. Že počty zhlédnutí nehrají hlavní roli potvrzuje i známý český youtuber Tary.

YouTube zkouší nahradit pozadí i bez zeleného plátna

„Ještě před rokem se do trendů dostalo téměř vše, co mělo abnormální počet lajků a komentářů. A díky tomu jsem získal 400 tisíc odběratelů za rok. Fungovalo to tak, že jsem řekl: Pojďme hecnout 50 tisíc lajků. Uživatelé to zvládli, Youtube poznal, že to je trendy a hodil to tam. A to samé platilo u komentářů,“ popisuje úspěšný youtuber.

Od prosince loňského roku se ovšem systém výběru proměnil. „V trendech se nově objevují i videa s málo zhlédnutími i lajky. Je to díky kategorii, kam spadají. YouTube zřejmě vymezil určité kvóty z jednotlivých kategorií,“ říká Tary. Například vlog z jízdy na motorce může být méně úspěšný než hudební novinky, ale díky kategorii auto-moto se do trendů zařadí.

Manipulace Ovlivňuje umělá inteligence běh společnosti?

V poslední době se řeší vliv fake news na výsledky voleb. Otázkou je, jestli nás více neovlivňuje něco „z vlastních řad“. O hrozbě YouTube na mínění populace promluvil pro The Guardian jeden z těch, kdo vidí pod pokličku - vývojář algoritmu návrhů.

„YouTube se tváří jako realita, ale je pokřivená, abychom na něm trávili více času,“ říká francouzský programátor Guillaume Chaslot. Google ho propustil v roce 2013. Oficiální důvod: výkonnostní problémy. Chaslotova verze: snažil se prosadit změnu, aby byl algoritmus „víc fér“.

Rusko zkouší ovlivnit dění všude po světě. Jinak, než si většina myslí

Představy o ruských hackerech jsou často zjednodušené (ilustrační snímek)

Po padáku se začal do hloubky věnovat strojovému učení, na kterém se spolupodílel. A během amerických prezidentských voleb si všiml menší anomálie. „Bylo to zvláštní. Nezávisle na tom, jestli jste začali hledat Trumpa nebo Clintonovou, návrhy videí vás tlačily do protrumpovské oblasti,“ říká Chaslot.

Autor článku v The Guardian Paul Lewis se rozhodl jeho teorii prověřit. Prošel tisícovku nejúspěšnějších videí spojených s volbami a došel k šokujícímu skóre: 551:92 (360 neutrálních). YouTube šestkrát častěji doporučoval videa, která pomáhala Trumpovi než Clintonové. Algoritmus tak jistě nebyl přednastaven, ale díky uživatelskému jednání se tak začal chovat. Jednoduše řečeno: lidem se více líbila videa o Trumpovi, tak je YouTube začal doporučovat.

Chaslot spustil vlastní stránku algotransparency.org, kde vysvětluje, jak dle něj YouTube propaguje konspirační teorie nebo upřednostňuje některé volební kandidáty.

Z pohledu uživatele Jak mohu doporučení ovlivnit?

No a jak můžete přímo vy zasáhnout do nabízení videí? Jako uživatelé máte vícero možností. Jedním z nich je přihlášení: „Když začnete sledovat videa přihlášení, budete dostávat více personalizované návrhy,“ vysvětluje pro Technet Alžběta Houzarová z Googlu.

„Pokud nejste s doporučeními spokojeni, videa, kanály a sekce, které vás nezajímají, můžete odstranit a svá doporučení tak vylepšit.“ To můžete udělat pomocí funkce Nezajímá mě.

Nezajímá mě

„Pokud z jednoho kanálu odstraníte dvě nebo více videí, tento kanál už vám nebude doporučován,“ pokračuje Houzarová. „V případě, že jste omylem odstranili doporučení, která chcete zachovat, můžete jej klepnutím na tlačítko Zpět vrátit. To je v tuto chvíli možné pouze na počítači.“

Je také možné, že jste odstranili kanály, které vás nezajímaly, a nyní již ano. To napravíte na stránce history.google.com, kde kliknete na otevřenou nabídku a poté na „Zpětná vazba Nezajímavé“. Doporučení obnovíte kliknutím na „Smazat zpětnou vazbu“. A doporučení můžete ovlivnit i v historii vyhledávání.

„Řekněme, že jste hledali určité téma, například výměnu řetězu kola. Ale teď je to ve vašich doporučeních samé video s koly. Stačí přejít do historie sledování a vyhledávání a vymazat tato konkrétní videa a výrazy,“ doplňuje Houzarová s varováním, že vymazání nelze vrátit zpět.

Příště se podíváme pod pokličku jiné softwarové zbraně YouTubu - programu Content ID, který bdí nad autorskými právy a blokuje videa, která dle něj kopírují obsah.

Kdo ovlivňuje podobu vaší hlavní stránky Facebooku a jak na něj vyzrát

Jak vám facebook sestavuje obsah hlavní stránky na míru?

Zajímalo vás někdy, proč na Facebooku vídáte příspěvky v pořadí, v jakém jsou? Odpovědí je News...

YouTube jako továrna na peníze. Jak na tomto portálu funguje reklama?

YouTube jako továrna na peníze

Vše se točí kolem peněz a na YouTube to není jinak. Jenže když se do reklamního kolotoče zamotají...

Video bylo zablokováno. Jak Youtube zvládá kontrolovat miliardy videí

Content ID

Běžní uživatelé o programu Content ID mnohdy neslyšeli. Autoři mu fandí, protože díky němu získali...

Jak vám Google vnucuje videa? Nahlédněte pod pokličku YouTube

Youtube pod pokličkou

Při brouzdání po YouTube vás zřejmě napadlo, na základě čeho vám doporučuje videa. Ponořte se s...

  • Nejčtenější

Spotify končí s „věcí do auta“, posluchači mají zánovní zařízení vyhodit

v diskusi je 40 příspěvků

26. května 2024  13:28

Je to jak z příručky „jak naštvat zákazníky“. Spotify ukončuje podporu svého jediného fyzického...

Druhá světová válka měla i své dinosauří oběti

v diskusi jsou 4 příspěvky

25. května 2024

Psal se 24. duben roku 1944 a nacistická válečná mašinérie už nebyla schopna zabránit konečné...

{NADPIS}

{LABEL} {POPISEK}

KVÍZ: Znáte letadla československých pilotů?

v diskusi nejsou příspěvky

24. května 2024

Typů letadel, do kterých usedali českoslovenští letci, bylo nepřeberné množství. Zlomkové množství...

Nejzajímavější sluchátka na trhu? Novinka Sonosu je první svého druhu

v diskusi je 17 příspěvků

21. května 2024

Úderem patnácté hodiny skončilo embargo na první sluchátka společnosti Sonos, které po krátkém...

{NADPIS}

{LABEL} {POPISEK}

Rusko vypustilo družici schopnou sledovat a ničit jiné satelity, míní Američané

v diskusi je 55 příspěvků

22. května 2024  8:30

Rusko 16. května vypustilo satelit, o němž se americké zpravodajské služby domnívají, že je to...

Deset věcí, které by měl znát každý uživatel úložiště myšlenek OneNote

v diskusi nejsou příspěvky

28. května 2024

Zajímavý pomocník v každodenním životě OneNote disponuje velkou paletou funkcí. Osvojte si...

Hokej byl zátěžovým testem pro český internet, padaly rekordy

v diskusi je 6 příspěvků

27. května 2024  14:57

V síti společnosti O2, která přímé přenosy po internetových linkách pro Českou televizi...

Ladislava Chudíka si diváci pamatují hlavně jako laskavého primáře Sovu

v diskusi jsou 3 příspěvky

27. května 2024  14:05

Slovenský herec Ladislav Chudík, který se narodil 27. května 1924, byl v Česku známý a oblíbený...

Jsou tu už skoro 40 let. Pamatujete si na starší verze Windows?

v diskusi je 27 příspěvků

27. května 2024

Operační systém Windows příští rok oslaví 40 let od svého vzniku. Za tu dobu si prošel mnoha...

Jaké vitamíny brát v těhotenství? Poradíme vám, jak se rozhodnout.
Jaké vitamíny brát v těhotenství? Poradíme vám, jak se rozhodnout.

Každá budoucí maminka se snaží zajistit pro své miminko jen to nejlepší. GS Mamavit je komplexní multivitaminový doplněk, který je speciálně...

Párkům odzvonilo. Podnikatel lije do rohlíků svíčkovou a dobývá benzinky

Na pracovních cestách se podnikatel v gastronomii Lukáš Nádvorník přejedl párků v rohlíku. Napadlo ho, že by do pečiva...

Herec Lukáš Vaculík se oženil, dívčí idol 80. let si vzal ředitelku z Primy

Lukáš Vaculík (61) se tajně oženil. Vzal si výrobní ředitelku a producentku FTV Prima Luciu Kršákovou (46). Herec a...

Milan Hein odhalil neshody mezi Simonou Postlerovou a její matkou

Smrt herečky Simony Postlerové (†59) byla ranou pro celou její rodinu. Na parte ale chybělo jméno hereččiny matky Jany...

Hoši, nádhera, děkují celebrity za hokejové zlato. Pokáč baví vítěze písničkou

Česká hokejová reprezentace získala po čtrnácti letech zlato na mistrovství světa. Obrovský úspěch nadchl nejen...

Zavřela jsem vagínu a už neotevřu. Když ženy žijí bez sexu a nechybí jim

Premium Stále častěji se můžeme dočíst, že lidstvo se nevěnuje své základní, přirozené potřebě – sexu. Nastupující generace...