Diskuse k článku

„Málem jsem zabil bratra!“ Nový překladač je lepší, chyby jsou vtipnější

Jak si neuronové sítě Překladače Google poradí s češtinou? Otestovali jsme překladač na 135 větách a srovnali novou verzi se starou. Na první pohled je patrné nejen výrazné zlepšení, ale i zásadní změna způsobu, jak systém využívá neuronové sítě k překladu celých vět. Ve specifických situacích se ovšem ještě má co učit.

Upozornění

Litujeme, ale tato diskuse byla uzavřena a již do ní nelze vkládat nové příspěvky.
Děkujeme za pochopení.

Zobrazit příspěvky: Všechny podle vláken Všechny podle času

L31u20k41á67š 57K24r83á13l 8828161697310

Staron's system :D

0/0
24.5.2017 15:30

V72á94c51l13a65v 10Š96u78b70r40t 9347333358217

Stále to ze všeho nejvíc připomíná legendárního Maďara v trafice od Pythonů:-)

0/0
14.5.2017 14:27

P31e42t33e18r 51M58l83i35c23h 8724122453575

Preklad prislovi je spravny, kdyz o prelozi doslovne. To jen ucitelky anglictiny nabyvaji dojemm, ze ma pouzit jednu z ceskych variant.

Predstavte si film, nejakou situaci, na kterou aplikuji osoby prislovi. Vy, kdyz pouzijete jine prislovi, tak nedava smysl pro danou situaci a neni vubec vtipne. A pritom vsichni ve filmu se osobe, co to anglicke prislovi rekla, zmeji, jako nejvtipnejsi poznamce na svete.

0/−1
13.5.2017 11:00
Foto

P23a93v70e15l 96K95a51s41í25k68, 42T84e24c13h39n59e52t49.11c42z

Není jeden správný způsob, jak přeložit takovou frázi. Musí se to dělat v kontextu.

0/0
16.5.2017 10:53

K34a88t72e80r49i81n60a 78M23a21t26t88h91e97w60s 3314564455631

Ten dotaznik pod clankem take, zda se, prosel prekladacem a vypada to na tu starsi verzi.

0/0
12.5.2017 18:51
Foto

P27a37v24e78l 11K17a49s18í73k68, 31T82e22c58h95n55e80t69.81c42z

Ano, prošel překladačem, a dokonce tou novou verzí. Šlo o ukázku toho, jak je si překladač poradí s běžnými i nezvyklými termíny. (Naivně jsem si myslel, že ten záměr byl zcela zřejmý.)

0/0
13.5.2017 8:37

J26o56s68e79f 45K54r30o67u34p21a 7411978315917

S umělou inteligencí mají lidi velké zkušenosti z úřadů.

0/0
12.5.2017 13:50

H64a78n17a 60P58r12o47k74o21p69o49v52á 8939160783491

Uf, z ruštiny колокольный звон (kolokol'nyj zvon) - což by mělo být asi zvonění zvonu - překládá do češtiny jako mýto, do polštiny myto, do němčiny Maut... přitom do angličtiny jako bell ringing... :-/

0/0
12.5.2017 0:49

H64o74n75z75a 80P83a21n66s19k31ý 3713932860150

Když už jsme u těch hříček s jazykem. Někde jsem četl souhrn asi 30 věcí, které byly pojmenovány ve stylu vysílačky (walkie talkie). Třeba potřesení rukou na schůzce bylo meetie greetie.

https://www.google.cz/amp/thechive.com/2015/11/26/if-the-guy-who-named-walkie-talkies-named-other-items-24-photos/amp/

0/0
11.5.2017 17:21
Foto

M44a20r51t24a 37D13o89u11b61r30a83v24o18v93á 4680744145777

Sorry jako, ale nejdřív musíte umět česky, aby se zobrazil správný překlad.

Příklad číslo 8 - máte místo "mě" slovo "mně", což úplně obrací smysl.

Když jsem do překladače zadala větu ve správném znění:

"Když odcházeli, málem mě, bratra a babičku zabili, protože domky v naší vesnici zapálili," vzpomínal po letech.

tak byla přeložena takto:

"When they left, they almost killed me and my brother and grandmother because they lit our houses in our village," he recalled for years.

0/0
11.5.2017 16:50
Foto

M73a28r41t91a 42D56o26u88b96r32a49v90o91v26á 4120264815447

aha, nevšimla jsem si, že už se tu o tom mluvilo. takže nic, jako bych nic nepsala.

+3/0
11.5.2017 16:54

M17i83r63e64k 21G61a83j73e23r 5601106969580

Dobre je videt, na jake urovni je ten novy jazykovy prekladac na prekladu tech 4 moznosti v ankete. Zbytecne jsem ucil cizi jazyky. Ostatne, co cekat, kdyz me za jejich vyuku nikdo neplatil.

0/0
11.5.2017 0:26

T24o62m 95S88t19r41a26k77o59š 7800797862118

Jestli Vám vyšlo to co mě, tak je to velmi kvalitní překlad. Manželka se ještě teď celá svíji v záchvatu smíchu.

0/0
10.5.2017 23:28

I14v39a79n92a 31N90o90v51a91k69o69v88a 2632752799802

zajimave, zkousela jsem kousek normalniho holandkeho txstu do cestiny. Preklad nedaval vubec smysl. To same pres anglictinu a vysledek perfektni.

0/0
10.5.2017 22:10
Foto

V51ě75r46a 32R51a41m76b63o16u36s72k12o90v15á 3145831410747

Ta vaše "vtipná" chyba tam byla, protože jste to měli špatně česky. Teď už IU zřejmě pochopila...

0/0
10.5.2017 21:47
Foto

P82a69v83e79l 16K74a66s33í20k13, 29T48e52c61h11n79e98t17.44c34z

Ta chyba v překladu tam byla bez ohledu na mně/mne. Stejně jako teď už tam není, bez ohledu na mně/mne. A chci taky připomenout, že to byla podstata testu: otestovat překladač v reálných podmínkách, na reálných textech.

0/0
10.5.2017 21:56

M66i16r38e60k 54G37a84j24e29r 5661786829590

Jestli ten prekladac vetsinou neni schopen rozlisit mně/mě, tak to bude hodne prakladu spatne. Doufejme jen, ze ten prekladac nebudou pouzivat vlady svetovych velmoci pri mezistatnich vyjednavanich. Mohlo by totiz brzo dojit ke sevetove valce.

0/0
11.5.2017 0:29
Foto

P91a47v16e88l 81K91a66s25í76k74, 53T52e13c17h34n59e39t13.33c83z

Nejde o to, že to neumí rozlišit, jde o to, že bere v potaz kontext věty.

0/0
11.5.2017 14:52

P33e39t57r12a 76K51o55v30á39ř47o95v83á 2610691681110

Díky za precizní článek. R^

+4/0
10.5.2017 21:40
Foto

K19a41r91e27l 61J42í10r89a 6604847111836

Zkuste si přeložit větu: Osuš si šosy. Anglický překlad Googlem zpětně přeložený do češtiny je opravdovou perlou...

+3/0
10.5.2017 21:35

T81o16m 93S16t48r78a35k17o24š 7750417792248

Jestli Vám vyšlo to co mě, tak je to velmi kvalitní překlad. Manželka se ještě teď celá svíjí smíchem.

0/0
10.5.2017 23:29

J24o69s55e44f 15K56a28r54f63í90k 7372935916900

Jo jo, hovíkno to překládá pořád;-D

0/0
11.5.2017 8:00

P15a76v24e11l 85S89t69a29v55j65a88n88í54k 6308895757111

Na "Dry your shit" mi nepřijde nic tak divného :-)

0/0
11.5.2017 0:57

D26u25š85a81n 28M84i30c15h49a94l36i62č60k39a 5259211839424

Tiež som sa riadne zarehlil..... R^

0/0
11.5.2017 20:25

F26i18l98i27p 77T37ř34e98b36a 6883480668396

Největší pokrok překladače Googlu bude, až se odkaz na něj vrátí na stránku s výsledky vyhledávání.

+2/0
10.5.2017 20:21
Foto

P10a43v11e60l 92K74a74s29í94k95, 25T65e84c29h33n28e13t38.58c39z

Nevím, jak to přesně myslíte, každopádně když vyhledáváte něco na Google, tak vedle výsledků, které jsou v jazyce, kterým nevládnete, je odkaz "Translate this page". Což je možná to, co chcete.

0/0
10.5.2017 20:41

T18o15m42á84š 18T26i67c13h89ý 3605307775602

Výborný článek!

Možná trpím profesionální deformací botanika:překvapuje mě, že překladač z kontextu zahrady nezvládl přeložit správně šeřík a hloh a místo plácá blbosti o barvě a trnu.

0/0
10.5.2017 20:07
Foto

P55a69v33e60l 95K24a59s90í67k50, 88T13e30c62h71n49e79t12.70c45z

Díky. Ano, ten kontext předchozí (statistická) verze překladače zvládala jen u sousloví, ale zvládla jej i tam, kde si nová verze (zatím) neporadí.

0/0
10.5.2017 20:54

W38a79l69t35e94r 28D18i66v58i60š 6907162642442

Zaujalo mne to hodnocení u překladu citace z Bible (list Korintským). V prvním případě vůbec nejde o skutečný počítačový překlad, je to téměř doslovně opsaný verš z ekumenického překladu Bible (Kdybych mluvil jazyky lidskými i andělskými, ale lásku bych neměl, jsem jenom dunící kov a zvučící zvon.). Řekl bych tedy, že stejně jako u přísloví se jedná o to, že tam někdo ručně doplnil lidský překlad a Google tento automaticky nabízel. Naproti tomu nová formulace je už skutečný překlad a ten kupodivu vůbec není špatný (až na podivný cinkál). Je tam sice posun Když/Kdyby, ale přesto je ještě pochopitelný smysl sdělení, což s ohledem na to, že Bible není exaktní encyklopedický text, je solidní.

Koneckonců z jazykového pohledu je docela zajímavé se občas podívat, jak se s překladem právě Bible potýkají velmi odlišně různé překlady (navíc v různých dobách). Ta kniha je překládána stovky let, z tohoto pohledu je to úžasný doklad vývoje jazyka. A rozdíl je občas do očí bijící. Viz třeba zmíněný verš v Bibli Kralické (1613): Bych jazyky lidskými mluvil i andělskými, a lásky kdybych neměl, učiněn jsem měď zvučící aneb zvonec znějící. V angličtině je mezi různými historickými překlady rozdíl velmi podobný jako v češtině. A překládat něco z trochu archaičtější angličtiny může být pro automatické překladače pořádný oříšek ještě dost dlouho (chybí dostatečná zásoba textů, na kterých se lze učit).

+2/0
10.5.2017 17:14
Foto

P68a77v58e78l 76K62a25s57í24k74, 44T28e23c47h50n27e20t50.75c89z

Samozřejmě, proto není článek jen výčtem hodnocení, ale jsou tam ty ukázky (plus PDF ke stažení), aby bylo zřejmé, v čem jsou silné a slabé stránky překladu, což není jednoduché kvantifikovat. Jinak Bible - právě proto, že je velmi pečlivě přeložena snad do všech světových jazyků - je jedním ze zdrojů podkladů pro statistický překladač, a nyní i pro neuronové sítě. Je to taková novodobá Rosettská deska, spolu například s dokumenty OSN. Takže starší verze překladače byla tak přesná i proto, že Bible v různých jazycích je jeden ze zdrojů těch dat, na kterých Google Translate už dlouhodobě staví.

+1/0
10.5.2017 20:39

M19i40r52e89k 70G28a41j82e10r 5901376219240

Novy prekladac je dobry, ale nemuze byt lepsi nez priklady, ze kterych se uci. Dovedu si predstavit, ze treba "rich odour of roses" nebude skoro nikde prelozeno spravne nebo je sprvnych prikladu malo. Podle me je to "silna vune ruzi". (Diakritiku si doplnte, namem ji tu.)

0/0
10.5.2017 17:07
Foto

J96i36ř42í 20D34v21o66ř60á27k 5545769800528

Samozřejmě to asi po dobu příštích několika desítek let nenahradí překladatele literatury (teda minimálně do doby, než stroje získají " cit " ), ale pro genaraci lidí, která se na škole učila s odporem ruštinu, je každé podobné zlepšení dobrou zprávou. Kupodivu i některá videa na " rouře " zvládají automatický překlad titulků . Třeba : https://www.youtube.com/watch?v=voNBzuI7IJ4.

+1/0
10.5.2017 17:06

J72a47r45o23s50l87a53v 93H40e78j67n27a 4367851909

Jenom jest míti obavy, že nový překladač pochytí něco z "češtiny" písálků iDnes nebo novostí Ústavu pro jazyk český.

+1/−1
10.5.2017 13:40

L95u26b40o74m52í90r 11K32a52m89e77n39s51k77ý 3520788343456

takže teď se už bude Google překladač sám učit a bude čím dál chytřejší?

0/0
10.5.2017 13:22
Foto

P93a46v87e19l 61Č55e24r70n35í53k 1428125410650

"sám" je nepřesné vyjádření.

On se samozřejmě bude učit sám, ale potřebuje zdroje, ze kterých se bude učit a jisté mantinely, které mu budou říkat, zda se učí dobře či špatně.

0/0
10.5.2017 17:17

L92u39b74o36m57í59r 50K77a30m56e43n89s96k96ý 3750648883106

tak zdrojů bude mít dostatek pokud bude používán a vzhledem k možnosti oprav a doporučení se najde i dost rádců. Pokud je to opravdu hluboká neuronová síť pak by nic víc neměl potřebovat.

0/0
10.5.2017 19:40

M24i47l11a50n 96V59o37l31e22k 5959753396969

Ano, umělá inteligence ale určité doby zjistí, že ji již lidé nemohou ničím obohatit a začne budoucnost určovat sama. Tedy tak vám to aspoň budou tvrdit.

0/−3
10.5.2017 18:49

M98i57r74o96s84l84a23v 14B97e86n43d95a 4203870148228

Zrovna včera jsem se pokoušel pomocí google překladače číst finský článek o nedělním zápasu s námi a co na mě vypadlo, bylo na a často za hranicí srozumitelnosti. A to bych řekl, že hokej není až tak složité téma.

+1/0
10.5.2017 12:05
Foto

P33a73v37e77l 76K23a41s50í54k37, 33T38e97c32h28n65e34t79.14c92z

Jak se to vezme. Hokej složité téma není, ale sportovní redaktor se pochopitelně snaží věty vyšperkovat, a používá tedy nestandardní obraty nebo metaforami. Tohle je z jednoho článku o hokeji na iDNES.cz: vyznamenal, prodloužil utrpení, zapsal, nabudil, promarnil, využil, manko, má na kontě, odložil.

Samozřejmě, kdyby ten text byl z tiskové agentury, tak s tím překladač problém nemá. Tam jsou obraty jako: zápas skončil za stavu, první gól dal, druhý gól dal, brankářem byl, byl vyloučen apod.

+7/0
10.5.2017 12:19

B97ř49e10t66i13s25l11a43v 13K63r63e62j27s42a 3174835527656

Všimněte si, že překlad Fin > Čj se děje stále ještě po slovech a je poměrně dost nesrozumitelný. Zkuste nastavit Fin > Aj a změní se na celé věty, které jsou podstatně smysluplnější.

Myslím si, že prostě nový translator nefunguje všude.

+1/0
10.5.2017 12:32

B68ř31e79t60i65s43l39a84v 80K69r87e20j76s54a 3634335187406

FIN > ČJ

Česká republika (TSEK. Česká republika), tj Českou republiku (TSEK. Česko), někdy také v České republice, je vnitrozemský stát ve střední Evropě. Sousedními zeměmijsou Německo, Rakousko, Slovensko a Polsko. Česká deset milionů obyvatel tvořídrtivá většina Čechů patří Slovany. Hlavní město země se nachází na řece Vltavě v Praze.

Česká republika se skládá z historických Čech, počet a ve Slezsku na jihu byla ve své historii, stejně jako součást habsburské monarchie v části 20. století Československa.V současné době patří Česká republika do Evropské unie a její cestovní pas bezSchengenského prostoru a NATO.

FIN > AJ + AJ > ČJ

Česká republika (Československo), Česká republika (Československo), někdy i Česká republika, je vnitrozemská země ve střední Evropě. Sousední státy jsou Německo, Rakousko, Slovensko a Polsko. Z deseti milionů obyvatel České republiky je velká většina Slovanů Češi. Hlavní město se nachází na řece Vltavě, v Praze.

V dějinách Čech, Määristä a jihovýchodní části Slezska je Česká republika součástí Habsburské říše a části Československa v 19. století. Dnes je Česká republika součástí Evropské unie a jejího schengenského prostoru bez pasů a NATO.

+2/0
10.5.2017 12:34

T74o87m76á20š 19T26a49t21í34č69e73k 5450152850578

Google i přes nasazení neuronových sítí pořád používá slovníky a databáze obsahující shodné texty v různých jazycích apod. Takže to má popis hokejového utkání těžší než třeba návod na mobil - články se nepřekládají jedna ku jedné, na rozdíl od návodů.

Jasně sepsané texty o technice, která je už alespoň pár měsíců běžná na trzích, mají v překladači velice dobré výsledky. Akorát teda se furt vyvíjí nový věci.

+1/0
10.5.2017 12:35
Foto

K49r37i47s33t76ý68n48a 11V69a84ň26k61o43v74á 3537850725773

Naučte se rozdíl mezi mě a mně a překladač si z vás nebude dělat kozy.

+3/−7
10.5.2017 11:11
Foto

P82a75v21e89l 80K53a69s51í48k93, 27T60e21c94h52n15e90t95.23c95z

V článku to vysvětluji: "Všimněte si překlepu v původní větě. Zachovali jsme jej z důvodu integrity testu, ve zdrojovém článku jsme ji ale již opravili. Na překlad neměl překlep vliv." A dále: "Mimochodem, chybu s „bratrovraždou“ již systém opravil..." Takže to shrnu ještě jednou: 1) Překlep "mně" místo "mne/mě" byl již v původním textu zdrojovém textu (brali jsme reálné texty, tedy včetně překlepů, chyb, neformálních výrazů apod.). 2) Nebylo by fér, abych v jedné verzi překladače předložil větu bez překlepu a jedné s překlepem, proto jsem překlep zachoval (v původním článku pana Pacnera jsem již ale překlep opravil). 3) Překladač v době testování přeložil stejně verzi s "mně" i "mě". 4) Nyní, dva týdny po testování, již Google opravil překlad, a to opět u obou verzí věty ("mně" i "mě").

Doufám, že je to nyní již jasné?

+6/0
10.5.2017 11:53
Foto

B69r16o97n28i37s18l49a40v 32G58a90b93r30y58š 2412179731

Ono je hlavne zakladem umet ten prekladac vubec pouzivat. Vim, ze je "hloupy", a proto tam nebudu psat slangove vyrazy a slozite vety. Vyraz "sto pade" bych tam urcite nenapsal. Jenze dost lidi neumi poradne cesky a nedokazou napsat vetu spravne tak, aby ta veta byla spravne prelozena.

0/−3
10.5.2017 11:05
Foto

P73a25v56e52l 32K98a96s61í74k67, 65T50e47c32h47n94e75t63.86c15z

Máte tedy pocit, že by překladač měl překládat jen spisovné věty, a kdykoli je v nich nespisovný výraz, tak má vyhodit chybu a říci "nespisovné výrazy nepřekládám"? To je přece nesmysl. A nejde o to, co byste "do překladače napsal", obvykle si překládáte něco, co napsal někdo jiný. Vždyť vy vlastně říkáte, že cizinec by neměl mít možnost dozvědět se, co znamená "sto pade" :-)

+4/0
10.5.2017 11:55
Foto

B15r90o61n26i60s11l18a70v 67G68a27b73r92y72š 2822329491

Ne, nemyslel jsem tím, že by to překladač neměl umožňovat. Je fajn, když si třeba najdu slangové výrazy v daném jazyce. Ale sám jistě dobře víte, že čím lepšími daty program nakrmíte, tím lepší máte výsledky. A tady je to podle mě stejný případ. Jenže řeč je pouze o angličtině, která je sama o sobě dost děsivá a chaotická.

Uvědomuju si jeho nedokonalost, a proto se v překladači raději vyjadřuju spisovně a v krátkých jednoduchých větách. Sám jsem měl s tímto přístupem problémy. Když jsem si nechal překládat teze disertační práce, použitím překladače bych ušetřil asi 6000 Kč. Problém byl v tom, že se vyjadřuju příliš složitě na to, aby to překladač pochopil. Bohužel se tohoto způsobu stále nemohu zbavit. Třeba si nemohl poradit s větou "Autor v problematice optimalizace linkového vedení v aglomeraci bude rovněž klást důraz na minimalizaci přestupních procesů za pomocí účelové funkce tak, aby byla zaručena jednoduchost a přehlednost celého systému v souvislosti s velikostí aglomerace.".

Zhruba před osmi lety jsem překládal titulky z angličtiny k jednomu filmu. Po částech jsem text kopíroval do překladače a ten měl odvahu překládat i citoslovce a jména. Např. citoslovce smíchu, které v anglických titulcích bylo napsáno jako "ha-ha" překladač přeložil jako "nízká zahradní zídka-nízká zahradní zídka". Ve filmu byla i postava jménem Rachel. Její překlad byl "světlehnědá barva".

Vůbec jsem nechtěl poukazovat na to, že by se do překladače měly psát jen spisové výrazy. Ale vzhledem k tomu, jak jsem už psal, že dost lidí neumí pořádně česky, nemůže od překladače na základě mizerných vstupů očekávat kvalitní výstupy. Ale předpokládám, že s dalším vývojem překladač chybu rozpozná a bude nějak tušit, co tím pisatel myslel.

0/−1
10.5.2017 13:25

J64o89s16e47f 95N53o14v98a95k 5338722386748

Ta vaše věta je nesrozumitelná i v češtině.

0/0
11.5.2017 6:40
Foto

B21r52o24n16i91s50l25a41v 85G14a36b45r13y59š 2262559911

Vědecká rada s ní problém neměla. Zkuste si ji rozpitvat.

0/0
11.5.2017 8:04

Premium

Chci chlapa, co má větší koule než ego, říká svobodná matka Nikol Štíbrová

Před pár dny oslavila třiatřicítku a cítí se šťastná a spokojená. Nebylo to ale zadarmo – moderátorka a hvězda...

Krampol o Belmondovi: Když on točil Zvíře, já hrál traktoristu

Přes třicet let promlouvá na české diváky božský Bébel, jak Jean-Paul Belmondovi v rodné Francii přezdívají, hlasem...

Premium

Sex je snadno dostupný, ale nevěra ještě není důvod k rozchodu

Tolerance je podle něj jen povýšenecký postoj k druhému a vytváří korupční prostředí, proto do partnerských ani jiných...

Najdete na iDNES.cz