Premium

Získejte všechny články
jen za 89 Kč/měsíc

Video bylo zablokováno. Jak Youtube zvládá kontrolovat miliardy videí

  0:01
Běžní uživatelé o programu Content ID mnohdy neslyšeli. Autoři mu fandí, protože díky němu získali miliardy dolarů. A někteří s ním svádí boj, když je neprávem zablokuje. Pojďte nahlédnout do fungování softwaru, který jako internetový kriminalista bdí nad ochranou autorských práv na serveru YouTube.

Dnes se podíváme blíže na software, který nepřetržitě skenuje nahraná videa. | foto: Fotomontáž Tomáš Hegedüš

Jak je možné, že některou píseň najdete na YouTube jen od originálního autora a jinou vyhledáte mnohokrát na různých kanálech?

Kdo někdy nahrával video na YouTube, mohl se setkat s hlášením, že bylo ztlumeno nebo zcela vymazáno. Server se v kontrolování autorských práv spoléhá na dvě věci. Okrajově na uživatelskou komunitu, která může zejména nevhodné i práva porušující video nahlásit. Následně vám po schválení může přijít podobná zpráva:

Youtube stížnost

Zatímco uživatelé spíše odhalí nevhodné video, hlavní zbraní proti zneužívání práv je specializovaný software Content ID. Ten spustil Google v roce 2007, tedy rok poté, co platformu YouTube dostal pod svá křídla. Abychom pochopili, jak funguje, nejprve si v krátkosti představíme software na rozpoznávání hudby.

Rozpoznávání hudby Rozklad zvuku na data

Programů na rozpoznávání zvuku je vícero a každý k detekci přistupuje jinak. Některé spoléhají na analýzu rytmu a tempa, jiné frekvenci a amplitudu nebo dokonce orientační body, které se vyznačují výraznou změnou akustiky. Vždy však musí zvukovou stopu dekódovat na měřitelná data.

Rozpoznávací programy

Na trhu najdete řadu specializovaných softwarů, jedním z největších je Audio Analytic.

Běžní uživatelé ovšem znají spíše Shazam, který je prima pomocník při hledání jména písničky. Fungují na stejném principu - písně se rozloží na numerickou stopu, které se následně porovnávají s databází provozovatele.

Pokud chcete převést byť několik sekund zvuku na tyto série dat, musíte mít něco, co si s tím rychle poradí. Programy k analýze používají algoritmus, mezi rozpoznávacími mechanismy nejčastěji vede technika zvaná Rychlá Fourierova transformace. Ta zvládne provést bleskovou analýzu dat, najít charakteristické rozdíly (tempo, hlasitost) a vygenerovat unikátní stopu (většinou v číselné formě).

Programy si takto vytvoří databázi originálních záznamů. Jakmile pak chcete najít, jak se jmenuje některá píseň, dáte programu tuto nahrávku k dispozici. Ten provede stejnou analýzu jako u originálních a následně algoritmus porovná stopu s těmi, které má v databázi. Stanoví pravděpodobnost shody a uživatel programu si může vybrat hranici, při které mu software shodu ohlásí (např. na 95 %). A teď si to pojďme zjednodušit a podívat se přímo na Content ID.

ScotTube Yard Každé video má svůj „otisk prstu“

Práci softwaru bychom mohli přirovnat ke kriminalistům, kteří používají metodu zvanou daktyloskopie. Na místě zločinu získají otisk prstu, který naskenují a porovnají ho s databází. Jakmile je shoda, pachatel je jednou nohou za mřížemi, protože každý otisk je jedinečný. Content ID funguje velmi podobně s jedním rozdílem: sází na presumpci viny a preventivně kontroluje všechny otisky.

Daktyloskopie

Každý z nás má jedinečné kožní papilární linie na prstech. Jelikož ruce neustále vylučují pot, zanechávají naše doteky otisky prstů. Policie otisků nebo fotografií linií následně využívá k identifikaci osob. Jedním z prvních, kdo si začal linií všímat, byl v polovině 19. století Jan Evangelista Purkyně.

Vlastník autorských práv může YouTubu poskytnout svůj výtvor (audio a/nebo vizuální stopu). Content ID stanoví „digitální otisk“ jeho zvukové stránky, v případě samotného videa ho rozloží na tisíce obrázků.

Kvantum těchto informací shromažďuje v jedné velké databázi. Jakmile nahrajete video, software začne jeho stopu automaticky porovnávat s otisky originálních videí. Aby počítače stíhaly porovnávat rychleji, než je kadence nahrávání, vstoupil na scénu Google Brain tým, parta programátorů, kteří mají na starosti například i algoritmus na doporučování videí. I Content ID funguje na neuronové síti, která jakmile najde shodu, upozorní vlastníka některá z partnerských platforem (AdRev, Audiam). 

Originální autor má vícero možností, které si může přednastavit. Některým vlastníkům stačí, že jim z vašeho videa budou chodit statistiky (jako v kterých zemích se video sleduje a podobně). Nejčastější volbou je tolerance videa a „za trest“ do něj systém vloží reklamy, jejichž zisky chodí vlastníkovi, což činí zejména hudebníci a zpěváci. Dalšími možnostmi je ztlumení zvuku nebo zablokování videa, k čemuž většinou přistupují například filmová studia.

Jak se bránit? I mistr program se někdy utne

Díky programu a vložení reklam se autorům vrátily dohromady miliardy dolarů. Jenže software má i své mouchy. Dokáže porovnávat nejen přesnou kopii zvukové stopy, ale i melodie. Což může být problém například pro uživatele, kteří nahrávají předělávky originálních písní.

A tady někdy vyvstává problém - Content ID je program, který chybuje. A shodu může rozpoznat i tam, kde není. Uživatel má v tomto případě možnost bránit se protioznámením, které řeší přímo správci služby.

Protioznámení

Problémy až donedávna nebyly jen v programu, zneužívaly se i stížnosti. Zpracování trvalo až třicet dní a ačkoli uživatel nepoužil cizí materiál, po tuto dobu bylo video zablokované nebo přišel o příjmy z reklamy, které chodily ohlášenému autorovi. V dubnu 2016 proto přišel YouTube s řešením

„Dnes přicházíme se zásadním vylepšením. Jakmile se autor videa i podavatel stížnosti (údajně originální autor) rozhodnou do videa vložit reklamy, peníze z ní nebudou chodit ani jednomu z nich, ale budeme je izolovat ve speciální peněžence. Po vyjasnění situace se peníze přepošlou právoplatnému majiteli,“ oznámil tehdy produktový manažer programu David Rosenstein.

Pokud je tedy zablokování neprávem a po protioznámení se stížnost stáhne, peníze z přidané reklamy jdou zpět autorovi videa, nikoli vyhledanému vlastníkovi údajně shodné nahrávky.

Oddělená peněženka

Content ID může rozpoznat falešnou shodu a pravou naopak neobjeví. Mezinárodní federace hudebního průmyslu si předloni stěžovala, že systém nerozpozná 20 až 40 % nahrávek jejích členů a přichází tak o značný zisk. Uživatelé se v průběhu existence programu učili, jak ho obejít a on se snažil s triky držet krok a adaptovat se. Známými technikami bylo zrychlení o několik setin, lehké navýšení tónu a další triky, které tu ovšem rozepisovat nebudeme.

„Dříve jsme s těmito kličkami měli problémy. Ale dnes dokážeme systém mnohem rychleji učit, jak tyto klamavé techniky rozpoznat,“ říká jeden z členů týmu Harris Cohen.

Zvuková knihovna Bezplatná hudba do videí

Pokud chcete vytvářet videa s reklamami, jaké zvuky můžete použít? YouTube k tomu účelu vytvořil Zvukovou knihovnu. Do obsáhlé hudební databáze se dostanete na svém účtu v sekci Studio pro autory pod záložkou Vytvořit.

V bezplatné hudbě můžete vyhledávat dle žánru, nástroje nebo dokonce nálady. V druhé části lze najít zvukové efekty, ve kterých lze brouzdat dle kategorií nebo využít fulltextové vyhledávání. Nahrávky je možné zdarma stahovat nebo pokud plánujete zvuk používat častěji, jde jej kliknutím na hvězdu přidat do oblíbených.

Příště se podíváme na to, kolem čeho se vše točí: peníze a fungování reklamního systému na YouTube.

Jak funguje Content ID (video: YouTube, anglicky)

Kdo ovlivňuje podobu vaší hlavní stránky Facebooku a jak na něj vyzrát

Jak vám facebook sestavuje obsah hlavní stránky na míru?

Zajímalo vás někdy, proč na Facebooku vídáte příspěvky v pořadí, v jakém jsou? Odpovědí je News...

YouTube jako továrna na peníze. Jak na tomto portálu funguje reklama?

YouTube jako továrna na peníze

Vše se točí kolem peněz a na YouTube to není jinak. Jenže když se do reklamního kolotoče zamotají...

Jak vám Google vnucuje videa? Nahlédněte pod pokličku YouTube

Youtube pod pokličkou

Při brouzdání po YouTube vás zřejmě napadlo, na základě čeho vám doporučuje videa. Ponořte se s...

Video bylo zablokováno. Jak Youtube zvládá kontrolovat miliardy videí

Content ID

Běžní uživatelé o programu Content ID mnohdy neslyšeli. Autoři mu fandí, protože díky němu získali...

  • Nejčtenější

Skončí 400 milionů počítačů na skládce? Microsoft „nechá“ volbu na vás

Podle dostupných statistik běží operační systém Windows 10 na 800 milionech počítačích. Tento systém přijde v říjnu roku 2025 o podporu, a proto by měli jeho uživatelé přejít na novější Windows 11....

13. prosince 2024

Na ukrajinské frontě se rodí zabijácké bakterie vzdorující antibiotikům

Těžká zranění ošetřená ve válečných podmínkách jsou líhní bakterie, která má už dnes na svědomí každou pátou oběť mikrobů rezistentních k antibiotikům. Na Ukrajině nabírají zabijácké schopnosti...

12. prosince 2024

Mohou existovat dva stejné QR kódy? A kdy dojdou?

Setkáváme se s nimi prakticky všude. V kině, v divadle, v obchodě, na internetu, při placení složenek atd. Jsou užitečnými pomocníky. Řeč je o QR kódech. Pokud jich existuje tak obrovské množství,...

9. prosince 2024

Unboxing notebooku Apple za 184 450 Kč. Dává vám taková konfigurace smysl?

Do redakce dorazil nový šestnáctipalcový MacBook Pro v doslova brutální konfiguraci. Nejvyšší verze procesoru M4 Max, nejvíce paměti co Apple nabízí a druhé největší úložiště. Takovýto stroj ani my...

9. prosince 2024

Modelaříte? Pošlete fotografii svého nejpovedenějšího kousku a vyhrajte

Soutěž

Baví vás stavět modely letadel, tanků, lodí vlaků či vraků? Je vaší specializací tvorba působivých a pracných diorámat, která diváka přenesou do dramatického okamžiku? Soustředíte na dokonalou patinu...

7. prosince 2024

Před 100 lety pátral zuřivý reportér v místě Husova pobytu v Kostnici

Před 100 lety vydaly Lidové noviny článek „zuřivého reportéra“ Egona Erwina Kische (1885-1948) o jeho pátrání v německé Kostnici, v místě, kde strávil Jan Hus závěrečnou část svého života.

14. prosince 2024

Vyrobte si vánoční přání. S mobilem či na počítači snadno a rychle

Chcete si potrénovat vaše grafické schopnosti a vyrobit si parádní vánoční (nebo novoroční) přání, nebo vám stačí si jen naladit mobil do vánoční nálady? Přinášíme několik tipů, jak toho docílit.

14. prosince 2024

Dej pozor, co si na Antarktidě přeješ. Plní se to, říká technik expedice

Vědecká expedice brněnské Masarykovy univerzity se opět chystá vyrazit na českou stanici na ostrově Jamese Rosse v Antarktidě, kde již řadu let úspěšně provádí řadu výzkumů. Spolu s vědci a vědkyněmi...

14. prosince 2024

Boston proti Montrealu. Už století trvá rivalita dvou slavných hokejových týmů

V prosinci 1924 odstartovala duelem mezi domácími Montreal Canadiens a hostujícími Boston Bruins nejdelší nepřetržitá rivalita dvou klubů v historii hokejové NHL. Je to i jedna z největších rivalit...

13. prosince 2024  17:05

Prodej bytu 3+1 97 m2
Prodej bytu 3+1 97 m2

Náměstí Republiky, Městec Králové, okres Nymburk
4 500 000 Kč

Lidl zlevnil až o devadesát procent, zákazníci kvůli tomu oblehli Letňany

Plastové autíčko za dvacku zlevněné o osmdesát procent, litinový hrnec za sto korun, zlevněný na čtvrtinu původní ceny....

Skončí 400 milionů počítačů na skládce? Microsoft „nechá“ volbu na vás

Podle dostupných statistik běží operační systém Windows 10 na 800 milionech počítačích. Tento systém přijde v říjnu...

Ve Švédsku vládne trend „měkkých dívek“. Ženy končí v práci a žijí z platu mužů

Švédsko má celosvětovou pověst země prosazující rovná práva žen a mužů. Přesto teď poněkud překvapivě tamní mladé ženy...

Bez léčby by to byla otázka pár měsíců. Jsem se vším smířená, říká Slováčková

Anna Julie Slováčková (29) se vyjádřila k tomu, jak se aktuálně cítí a reagovala na spekulace o svém stavu a...

Velký test másla: Nejlahodnější vzorek nebyl ani bio, ani z alpského mléka

Premium Lahodné máslo, které chutná a voní po smetaně, nemusí stát majlant. Jenže napěchovat jím mrazák, když je zrovna v akci,...