Pondělí 13. července 2020, svátek má Markéta
  • schránka
  • Přihlásit Můj účet
  • Pondělí 13. července 2020 Markéta

Google věnoval miliony dolarů Wikipedii. Ví, že ji bude potřebovat

  11:00aktualizováno  11:00
Firma Google věnovala další tři miliony dolarů (přes 67 milionů korun) neziskové organizaci Wikimedia, provozovateli otevřené internetové encyklopedie Wikipedia. Google využívá obsah Wikipedie v řadě svých produktů.

Společnost Google věnovala otevřené internetové encyklopedii Wikipedia miliony dolarů | foto: Wikimedia, montáž: Pavel Kasík, Technet.czTechnet.cz

Jedna z nejnavštěvovanějších stránek na internetu, otevřená encyklopedie Wikipedia, kterou může kdokoli editovat, nezobrazuje svým čtenářům žádné reklamy. Jde o princip. Její zakladatelé od začátku věřili, že reklamy by znamenaly možný střet zájmů. Místo toho žije nadace Wikimedia z příspěvků.

Jedním z výrazných přispěvatelů je společnost Google, která přispěla třemi miliony dolarů na provoz organizace. Celkem tak Google za posledních deset let věnoval na provoz Wikipedie přes sedm a půl milionů dolarů. Část příspěvku směřuje přímo na dlouhodobý projekt Wikimedia Endowment, zbytek na běžný provoz.

Wikimedia hospodaří s majetkem 145 milionů dolarů a ročním rozpočtem 104 milionů dolarů. Největší položkou v nákladech jsou mzdy a granty, které organizace poskytuje. Zdaleka největším zdrojem příjmů (přes 95 %) jsou každoročně příspěvky dárců.

Google využívá Wikipedii jako databázi vědomostí

Připomeňme, že v roce 2008 zkusil Google spustit svou vlastní konkurenci Wikipedie. Jmenovala se Knol a slibovala spolehlivé informace psané odborníky i laiky z celého světa. Projekt se ale neujal a po čtyřech letech jej Google bez náhrady zařízl.

Motivace společnosti Google tak v tomto případě není nutně nezištná. Google totiž obsah Wikipedie využívá v řadě svých produktů. Především ve vyhledávání, kde se informace z Wikipedie často zobrazují nejen mezi prvními „organickými výsledky vyhledávání“, ale i jako odpověď na otázku ve formě rámečku se stručnými informacemi.

Výstřižek (Snippet) z Wikipedie zobrazuje vyhledávač Google všude tam, kde...

Výstřižek (Snippet) z Wikipedie zobrazuje vyhledávač Google všude tam, kde podle algoritmu nabízí užitečný kontext nebo dokonce rychlou odpověď na položenou otázku

Wikipedie je také častým zdrojem informací pro rychlé odpovědi Asistenta Google na faktické otázky. Právě tyto překvapivě přesné odpovědi dávají asistentovi od společnosti Google určitou výhodu před konkurencí.

Jaké dotazy nejčastěji klademe asistentovi Google Home (roční test):

Výstřižky a odpovědi asistenta nezobrazují samozřejmě jen informace z Wikipedie, ale i z dalších zdrojů. Vzhledem k aktuální nejistotě ohledně budoucích úprav autorského zákona v EU by ovšem mohla nastat situace, kdy by Google nemohl zobrazovat náhledy některých stránek, aniž by za tyto náhledy platil. To se mu u Wikipedie, která obsah publikuje pod licencí Creative Commons, stát nemůže. Pro vyhledávač je tak existence Wikipedie velmi výhodná. A protože Google je nejpoužívanějším vyhledávačem prakticky ve všech zemích světa (s výjimkou Číny, kde je zakázaný, a Ruska, kde jej o několik procent poráží místní Yandex), je pro vyhledávač důležité, aby Wikipedia skvěle fungovala po celém světě.

Expanze do celého světa i díky strojovému učení

Wikipedia je svým rozsahem i šíří témat nejrozsáhlejším zdrojem vědomostí na světě. Týká se to ale především anglické Wikipedie, která obsahuje přes pět milionů článků, které jsou výsledkem více než 875 milionů editací.

Aktivně udržované jsou kromě anglicky psané Wikipedie také německá, francouzská, španělská, ruská a japonská, všechny tyto verze mají alespoň deset tisíc aktivních editorů. Česká Wikipedie patří svou velikostí do třetí desítky.

Řada „menších Wikipedií“, tedy jazykových variant méně rozšířených jazyků, se ale potýká s nedostatkem přispěvatelů, editorů, a tedy i obsahu. Google v tomto ohledu chce Wikipedii pomoci, a nabízí tak přispěvatelům možnost využívat integrovaný strojový překlad pomocí nástroje Google Translate. Ten nově využívá hluboké strojové učení pro lepší překlad v kontextu věty.

Jak funguje strojový překlad Google Translate (video: Technet.cz):

Tyto automatizované nástroje by tak měly pomoci rozšířit Wikipedii v jazycích, které jsou relativně rozšířené co do počtu aktivních uživatelů, ovšem jejich zastoupení na Wikipedii je maličké. Třeba jazykem zuluštinou se jako mateřským jazykem dorozumívá více než 10 milionů lidí (a dalších 16 mlionů jej používá jako druhý jazyk), ovšem příslušná verze Wikipedie obsahuje zatím jen tisícovku článků. To by mohl strojový překlad pomoci změnit. Počítačový překlad s sebou samozřejmě nese i nevýhody, především přehnaný důraz na cizojazyčný kontext na úkor lokálních témat.

V minulosti takto Google podpořil například projekt tvorby wikipedických článků ve 23 indických jazycích (Project Tiger).

Zdroj dat pro neuronové sítě a umělou inteligenci

Wikipedia dávno neslouží jen lidským uživatelům. Data z ní čerpají i vývojáři, kteří experimentují s různými formami „umělé inteligence“, tedy přesněji řečeno neuronových sítí. Protože data na Wikipedii jsou poskytovaná pod licencí Creative Commons, která (v některých verzích) umožňuje bezplatné využití dat k dalším účelům, stala se vítaným zdrojem podkladů, na kterých se neuronová síť trénuje nebo s nimi jinak pracuje. Přispívá k tomu i poměrně spolehlivá struktura kategorií, štítků a tabulek, která dělá z Wikipedie atraktivní soubor strojově čitelných, lidmi generovaných údajů o všem možném, od hlav států přes seznam hromadných vražd střelnou zbraní v USA až třeba po seznam všech lidí, kteří vycestovali do vesmíru.

Těchto vědomostí využívají třeba konverzační roboti jako Siri a Alexa, ostatně giganti Apple i Amazon rovněž patří mezi podporovatele nadace Wikimedia. S tím, jak bude stoupat význam těchto asistentů a zároveň bude na internetu přibývat lidí z rozvíjejících se oblastí světa, bude stoupat i význam Wikipedie v méně rozšířených jazykových verzích. Google ví, že pro úspěch na těchto zatím malých (ale za deset let možná významných lokálních trzích) potřebuje, aby noví uživatelé na webu našli stránky ve svém jazyce. Investice do Wikipedie je tedy pro firmu Google investicí do své vlastní budoucnosti.

Autor:

Přechod na DVB-T2

Od 27. 11. probíhá postupný přechod na vysílací standard DVB-T2. Kvůli koronavirové pandemii vláda rozhodla o odložení zbývajících přechodů na vysílání DVB-T2. Diváci si tak musí pořídit televizi s podporou kódování H.265 (HEVC) nebo starší televizi doplnit vhodným set-top boxem.

  • Nejčtenější

Nejjasnější kometa za třináct let. Na obloze ji uvidíte i bez dalekohledu

Oficiálně se jmenuje C/2020 F3, ale má také civilnější pojmenování Neowise. Po dlouhé době je to tak jasná kometa, že...

Pořídí si Česko „neviditelné“ stíhačky? Problém je cena za hodinu letu

V roce 2027 končí pronájem stíhacích strojů Gripen. Jaká je možnost, že místo nich pořídíme „neviditelné“ stroje F-35?

Čech vyfotil kometu Neowise, obrázek v NASA vybrali za snímek dne

Český fotograf Miloslav Druckmüller zabodoval u americké NASA. Agentura vybrala jeho snímek komety Neowise za...

Co nahradí gripeny? Ve hře jsou všichni kromě Číny a Ruska

Páteří české protivzdušné obrany jsou dnes letouny JAS 39 Gripen. Jejich pronájem končí v roce 2027, což vzhledem k...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Obří výpadek služeb T-Mobile způsobily dvě chyby v diskovém poli

Přesně před týdnem se T-Mobile potýkal s velkým výpadkem služeb. Nefungovala samoobsluha, aplikace, web, infolinka,...

Snažím se naučit mít jizvy po popálení ráda, říká Týnuš Třešničková

Premium Byl to okamžik. Vteřina, v níž ji ožehly plameny. Vlasy, krk, ruce, obličej... Ten krásný obličej, který ji živí. Jedna...

Největší slabiny ojetých dodávek. Přinášíme přehled nejporuchovějších vozů

Premium Dodávky byly stvořeny pro práci. Najedou mnohem více kilometrů než osobní auta, a to v náročných podmínkách. Ne všechna...

VELKÝ TEST ZOO: přehled cen, zvířat i atrakcí. Přijeďte, pomůžete!

Premium Mají otevřeno 365 dní v roce, ať praží slunce, nebo se žení čerti. Na několik týdnů je zavřel až koronavirus. Chcete...

  • Další z rubriky

Konspirátoři opět vyšli naprázdno. Fotka Churchilla zmizela kvůli chybě

Pokud jste v uplynulých dnech zadali do vyhledávače Google výraz „Winston Churchill“, možná vás zarazila absence jeho...

Obří výpadek služeb T-Mobile způsobily dvě chyby v diskovém poli

Přesně před týdnem se T-Mobile potýkal s velkým výpadkem služeb. Nefungovala samoobsluha, aplikace, web, infolinka,...

Facebook má vlastní mapy. Koupil firmu, kde s určováním věcí pomáhají lidé

Aby nebyl Facebook závislý na externím dodavateli mapových podkladů a aby mohl v této oblasti lépe konkurovat...

Varování: probíhá útok na RDP protokol pro vzdálený přístup k počítači

O probíhajícím útoku na protokol RDP, který je používán některými programy pro vzdálený přístup k ploše, informovala...

Akční letáky
Akční letáky

Všechny akční letáky na jednom místě!

Nejjasnější kometa za třináct let. Na obloze ji uvidíte i bez dalekohledu

Oficiálně se jmenuje C/2020 F3, ale má také civilnější pojmenování Neowise. Po dlouhé době je to tak jasná kometa, že...

Maďarka tvrdí, že nemůže pracovat, protože je příliš sexy

Plastiky dvaadvacetiletou Barbie Barbaru Lunu Siposovou z Maďarska stály v přepočtu přes tři miliony korun. Nyní nemůže...

Výpovědi už se nevyhnete. Nový zákoník práce přinese i spravedlivější dovolenou

Premium Poslední velká novela zákoníku práce za uplynulých devět let začne z podstatné části platit od začátku příštího roku, v...

Úspěšný šéf Škody po pěti letech náhle končí, prohrál boj o moc

Mladoboleslavská Škoda Auto oznámila, že Bernhard Maier po téměř pěti letech v čele společnosti opustí k 31. červenci...

Snažím se naučit mít jizvy po popálení ráda, říká Týnuš Třešničková

Premium Byl to okamžik. Vteřina, v níž ji ožehly plameny. Vlasy, krk, ruce, obličej... Ten krásný obličej, který ji živí. Jedna...