Pátek 9. prosince 2022, svátek má Vratislav
  • schránka
  • Přihlásit Můj účet
  • Pátek 9. prosince 2022 Vratislav

Google věnoval miliony dolarů Wikipedii. Ví, že ji bude potřebovat

  11:00
Firma Google věnovala další tři miliony dolarů (přes 67 milionů korun) neziskové organizaci Wikimedia, provozovateli otevřené internetové encyklopedie Wikipedia. Google využívá obsah Wikipedie v řadě svých produktů.

Společnost Google věnovala otevřené internetové encyklopedii Wikipedia miliony dolarů | foto: Wikimedia, montáž: Pavel Kasík, Technet.czTechnet.cz

Jedna z nejnavštěvovanějších stránek na internetu, otevřená encyklopedie Wikipedia, kterou může kdokoli editovat, nezobrazuje svým čtenářům žádné reklamy. Jde o princip. Její zakladatelé od začátku věřili, že reklamy by znamenaly možný střet zájmů. Místo toho žije nadace Wikimedia z příspěvků.

Jedním z výrazných přispěvatelů je společnost Google, která přispěla třemi miliony dolarů na provoz organizace. Celkem tak Google za posledních deset let věnoval na provoz Wikipedie přes sedm a půl milionů dolarů. Část příspěvku směřuje přímo na dlouhodobý projekt Wikimedia Endowment, zbytek na běžný provoz.

Wikimedia hospodaří s majetkem 145 milionů dolarů a ročním rozpočtem 104 milionů dolarů. Největší položkou v nákladech jsou mzdy a granty, které organizace poskytuje. Zdaleka největším zdrojem příjmů (přes 95 %) jsou každoročně příspěvky dárců.

Google využívá Wikipedii jako databázi vědomostí

Připomeňme, že v roce 2008 zkusil Google spustit svou vlastní konkurenci Wikipedie. Jmenovala se Knol a slibovala spolehlivé informace psané odborníky i laiky z celého světa. Projekt se ale neujal a po čtyřech letech jej Google bez náhrady zařízl.

Motivace společnosti Google tak v tomto případě není nutně nezištná. Google totiž obsah Wikipedie využívá v řadě svých produktů. Především ve vyhledávání, kde se informace z Wikipedie často zobrazují nejen mezi prvními „organickými výsledky vyhledávání“, ale i jako odpověď na otázku ve formě rámečku se stručnými informacemi.

Výstřižek (Snippet) z Wikipedie zobrazuje vyhledávač Google všude tam, kde podle algoritmu nabízí užitečný kontext nebo dokonce rychlou odpověď na položenou otázku

Wikipedie je také častým zdrojem informací pro rychlé odpovědi Asistenta Google na faktické otázky. Právě tyto překvapivě přesné odpovědi dávají asistentovi od společnosti Google určitou výhodu před konkurencí.

Jaké dotazy nejčastěji klademe asistentovi Google Home (roční test):

Výstřižky a odpovědi asistenta nezobrazují samozřejmě jen informace z Wikipedie, ale i z dalších zdrojů. Vzhledem k aktuální nejistotě ohledně budoucích úprav autorského zákona v EU by ovšem mohla nastat situace, kdy by Google nemohl zobrazovat náhledy některých stránek, aniž by za tyto náhledy platil. To se mu u Wikipedie, která obsah publikuje pod licencí Creative Commons, stát nemůže. Pro vyhledávač je tak existence Wikipedie velmi výhodná. A protože Google je nejpoužívanějším vyhledávačem prakticky ve všech zemích světa (s výjimkou Číny, kde je zakázaný, a Ruska, kde jej o několik procent poráží místní Yandex), je pro vyhledávač důležité, aby Wikipedia skvěle fungovala po celém světě.

Expanze do celého světa i díky strojovému učení

Wikipedia je svým rozsahem i šíří témat nejrozsáhlejším zdrojem vědomostí na světě. Týká se to ale především anglické Wikipedie, která obsahuje přes pět milionů článků, které jsou výsledkem více než 875 milionů editací.

Aktivně udržované jsou kromě anglicky psané Wikipedie také německá, francouzská, španělská, ruská a japonská, všechny tyto verze mají alespoň deset tisíc aktivních editorů. Česká Wikipedie patří svou velikostí do třetí desítky.

Řada „menších Wikipedií“, tedy jazykových variant méně rozšířených jazyků, se ale potýká s nedostatkem přispěvatelů, editorů, a tedy i obsahu. Google v tomto ohledu chce Wikipedii pomoci, a nabízí tak přispěvatelům možnost využívat integrovaný strojový překlad pomocí nástroje Google Translate. Ten nově využívá hluboké strojové učení pro lepší překlad v kontextu věty.

Jak funguje strojový překlad Google Translate (video: Technet.cz):

Tyto automatizované nástroje by tak měly pomoci rozšířit Wikipedii v jazycích, které jsou relativně rozšířené co do počtu aktivních uživatelů, ovšem jejich zastoupení na Wikipedii je maličké. Třeba jazykem zuluštinou se jako mateřským jazykem dorozumívá více než 10 milionů lidí (a dalších 16 mlionů jej používá jako druhý jazyk), ovšem příslušná verze Wikipedie obsahuje zatím jen tisícovku článků. To by mohl strojový překlad pomoci změnit. Počítačový překlad s sebou samozřejmě nese i nevýhody, především přehnaný důraz na cizojazyčný kontext na úkor lokálních témat.

V minulosti takto Google podpořil například projekt tvorby wikipedických článků ve 23 indických jazycích (Project Tiger).

Zdroj dat pro neuronové sítě a umělou inteligenci

Wikipedia dávno neslouží jen lidským uživatelům. Data z ní čerpají i vývojáři, kteří experimentují s různými formami „umělé inteligence“, tedy přesněji řečeno neuronových sítí. Protože data na Wikipedii jsou poskytovaná pod licencí Creative Commons, která (v některých verzích) umožňuje bezplatné využití dat k dalším účelům, stala se vítaným zdrojem podkladů, na kterých se neuronová síť trénuje nebo s nimi jinak pracuje. Přispívá k tomu i poměrně spolehlivá struktura kategorií, štítků a tabulek, která dělá z Wikipedie atraktivní soubor strojově čitelných, lidmi generovaných údajů o všem možném, od hlav států přes seznam hromadných vražd střelnou zbraní v USA až třeba po seznam všech lidí, kteří vycestovali do vesmíru.

Těchto vědomostí využívají třeba konverzační roboti jako Siri a Alexa, ostatně giganti Apple i Amazon rovněž patří mezi podporovatele nadace Wikimedia. S tím, jak bude stoupat význam těchto asistentů a zároveň bude na internetu přibývat lidí z rozvíjejících se oblastí světa, bude stoupat i význam Wikipedie v méně rozšířených jazykových verzích. Google ví, že pro úspěch na těchto zatím malých (ale za deset let možná významných lokálních trzích) potřebuje, aby noví uživatelé na webu našli stránky ve svém jazyce. Investice do Wikipedie je tedy pro firmu Google investicí do své vlastní budoucnosti.

Autor:
  • Nejčtenější

Český umělec Yemi A.D. se podívá k Měsíci, vybral si jej japonský miliardář

Český umělec Yemi A.D. se dostal do posádky historicky prvního civilního letu k Měsíci s názvem dearMoon. Vybral jej...

Nový rychlovlak TGV dorazil do Česka, ve Francii má začít jezdit za dva roky

Nový rychlovlak TGV ráno přejel česko-rakouské hranice a dopoledne dorazil do Českých Budějovic. Odtud jel dál do Prahy...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

„Svatba“ letounu L-39NG. Ve Vodochodech se po letech opět sériově vyrábí

Po osmi letech vývoje vyvrcholila práce na letounu L-39NG. Moderní následník slavného Albatrosu vstupuje do sériové...

KVÍZ: V roce 1939 napadl Sovětský svaz Finsko, začala zimní válka

Útokem Sovětského svazu na Finsko dne 30. listopadu 1939 začala tzv. zimní válka, která trvala až do 13. března roku...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Chat s umělou inteligencí baví internet. Umí česky, povídat si může každý

Novou senzací ve světě umělé inteligence je webový nástroj ChatGPT, který dovede opravdu působivě nejenom vést dialogy,...

Miliony na účtu i exekuce. Zmapovali jsme majetky kandidátů na prezidenta

Premium Senátor Marek Hilšer vlastní v Praze dva byty. Přesto v metropoli bydlí v pronájmu ve dvoupokojovém bytě na Pohořelci....

Miliony na účtu i exekuce. Zmapovali jsme majetky kandidátů na prezidenta

Premium Senátor Marek Hilšer vlastní v Praze dva byty. Přesto v metropoli bydlí v pronájmu ve dvoupokojovém bytě na Pohořelci....

Takoví slušní lidé, říkali o nich. Rodině přitom vládl teror a nechutnosti

Premium Muž, který ten prosincový den přišel na místní oddělení VB Strašnice, vypadal velmi rozpačitě. „Ono se to bude zdát asi...

Šest přehlížených funkcí, které ukazují, jak prohlížeč Edge dospívá

V posledních několika letech se posunul browser Microsoft Edge mílovými kroky vpřed. Se svým největším konkurentem sice...

Google má narozeniny. Kde vzal vyhledávač svůj podivný název?

Google oslavil už 24. výročí svého působení na trhu. Za skoro čtvrt století se stal nejen úspěšnou internetovou...

Zlaté, šedé i modré fajfky. Musk chystá pro Twitter „bolestivý“ systém účtů

Nový majitel sociální sítě Twitter zveřejnil novinky v systému ověřených účtů. Nově se mají dělit na několik kategorií....

Chcete YouTube ve vysokém rozlišení? Zaplaťte. Uživatelé zuří

Server YouTube začal testovat novou funkci, která však pobouřila diváky. Je totiž možné, že v budoucnu bude nutné za 4K...

Soutěžíme o 10 balíčků prémiového mléka BEBA COMFORT 2
Soutěžíme o 10 balíčků prémiového mléka BEBA COMFORT 2

Zapojte se s námi do soutěže a vyhrajte jeden z 10 balíčků oblíbené prémiové kojenecké výživy BEBA COMFORT 2, na které si vaše děťátko pochutná. Co...

Dcera je výjimečná, říká Julia Robertsová. Hazel oslavila 18. narozeniny

Herečka Julia Robertsová (55) oslavila osmnáctiny svých dvojčat, dcery Hazel a syna Finna společnou vzpomínkovou...

Zemřela Kirstie Alleyová. Hvězda trilogie Kdopak to mluví podlehla rakovině

Po krátkém boji s rakovinou zemřela v 71 letech americká herečka Kirstie Alleyová, hvězda filmové trilogie Kdopak to...

Politik opustil partnerku a děti po šestnácti letech kvůli pornoherečce

Německý politik Hagen Reinhold (44) opustil svoji dlouholetou partnerku Karoline Preislerovou (51), se kterou má tři...

Žádné Uložto! Startuje České kino, za stovku nabízí ke streamování 650 filmů

Oblíbené české filmy, pohádky i seriály ke stažení na jednom místě, legálně a ve vysoké kvalitě slibuje nová platforma...

Založili si rodinnou farmu, dnes jejich obrat míří k deseti milionům

K podnikání je přivedla společná láska k dobrému a zdravému jídlu. Přestože mají manželé Kuderovi dvě malé děti,...