Úterý 5. prosince 2023, svátek má Jitka
  • schránka
  • Přihlásit Můj účet
  • Úterý 5. prosince 2023 Jitka

Malá firma tvrdí, že počítače dokážou prolomit kód CAPTCHA

Malá americká firma Vicarious oznámila, že vyvinula program, který spolehlivě dokáže rozluštit kód, který se na internetu používá k rozlišení strojů od lidí. Jde o známý systém CAPTCHA, tedy opis špatně čitelných znaků. Software podle autorů představuje důležitý pokrok pro umělou inteligenci vůbec.

CAPTCHA. Jednoduchý prostředek, jak poznat na internetu člověka od stroje. | foto: CAPTCHA.com

Uživatelé z celého světa dnes ztratí vyplňováním bezpečnostního kódu známého jako CAPTCHA zhruba 150 tisíc hodin každý den. Odhad je to jen velmi přibližný, vytvořili ho před několika lety sami autoři názvu CAPTCHA, ale nepochybné je, že podivné klikyháky luští z obrazovky čas od času každý.

Co je CAPTCHA?

CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart) je automatizovaný test, který slouží k odlišení člověka od stroje. Obvykle se tak děje na základě lidské schopnosti rozpoznat i silně zkreslený text, což činí problém i nejlepším čtecím programům (OCR).

CAPTCHA se používá kdekoli, kde hrozí automatizovaný a hromadný vstup od robotů (botů), kteří šíří nevyžádané zprávy, nebo zahlcují stránky svými požadavky.

Dnes se často můžete setkat s její variantou nazvanou reCAPTCHA, což  je snaha proměnit jinak celkem otravnou záležitost v užitečnou službu. V reCAPTCHA ověření musíte opsat hned dvě slova (obvykle anglická, smysluplná). Jedno z nich umí počítač přečíst a na jeho základě ověří, zda jste lidé. Druhé slovo počítač vezme z databáze slov, které nedokázal rozpoznat při automatizované digitalizaci knihoven. To musíte přepsat také a tím ho počítači ozřejmíte. Svým malým příspěvkem tak vlastně pomáháte digitalizovat knihy do prohledatelné, čitelné databáze.

reCAPTCHA dnes provozuje společnost Google a s její pomocí digitalizuje archiv New York Times. Zobrazuje prý cca 100 milionů log denně. Archív NYT by měl být celý "přečtený" do konce roku 2013.

CAPTCHA ani její varianty nejsou přes svůj úspěch neprůstřelné. Na této stránce najdete seznam desítek způsobů, jak se ji podařilo obejít.

Když vědci z Pittsburghu roce 2000 název CAPTCHA vytvořili, předpokládalo se, že bude sloužit jako jednoduchý test pro rozlišení člověka od počítače. V různých variantách ho dnes používají například e-mailové služby nebo sociální sítě.

Nejjednoduší způsob, jak systém CAPTCHA prolomit, je najmout si na to člověka. Na internetu jsou snadno k sehnání stránky služeb, které nabízí prolomení v podstatě libovolného množství CAPTCHA kódů za malé peníze, už od jednoho dolaru za tisíc obrázků.

Stojí za nimi desítky, stovky, někdy možná i tisíce lidí u počítačů v rozvojových zemích. Ti za pro nás nepředstavitelně malé peníze věnují každému kódu několik vteřin svého času. Provozovatelé se jen starají o to, aby se práce distribuovala rychle a účinně, takže vyřízení objednávek trvá jen pár desítek sekund. Jaké to je, být odběratelem této podivné služby, si můžete v angličtině přečíst například zde.

Jak dlouho tato podivná forma zaměstnanosti ještě bude existovat? Začínající firma Vicarious oznámila, že se jí podařilo vyvinout algoritmus, který systém CAPTCHA dokáže prakticky naprosto spolehlivě prolomit. Software má uspět v devíti případech z deseti (což je dost možná lepší než u řady z nás).

Zbytečně dobrý

Z hlediska prolomení bezpečnosti systému CAPTCHA je 90procentní úspěšnost v podstatě až zbytečně vysoká. Vzhledem k tomu, jak počítače fungují, by stačila i jednoprocentní úspěšnost. Strojového času je dost a je dost levný, téměř určitě levnější než lidští "roboti" pracující za pár dolarů denně.

Úspěch je zajímavější pro vývoj na poli umělé inteligence. Luštění CAPTCHA je složitá úloha na poli rozeznávání obrazu. V podstatě jde o jednoduchou verzi tzv. Turingova testu, ve kterém počítač musí prokázat stejné schopnosti jako člověk. Pokud byste seděli někde na druhém konci zeměkoule, neměli byste nejmenší šanci poznat, že CAPTCHA nevyplnil člověk.

Rozeznávání tvarů je jeden z obtížných problémů v problematice umělé inteligence a jeho aplikace by byly mnohem širší. Dnes mohou specializované algoritmy číst například značky vozidel na mýtných branách (ne v ČR), ale tento algoritmus by jim měl umožnit identifikovat předměty, které "viděly" jen párkrát, a pohybovat se tak například plynule v neznámém prostředí.

Jeden ze zakladatelů Vicarious Scott Phoenix pro Science řekl, že závěrečnou zkouškou schopností jejich algoritmu by mělo být, že jím vybavený robot uvaří zadané jídlo v kuchyni, ve které nikdy předtím nebyl. Pak by ho mohli začít prodávat především právě pro použití v robotice. Nebude to brzy, "umělou inteligenci" prý chce firma představit za zhruba 15 let.

Vedlo se i před novinářem

Jsou to neskromné cíle, dosavadní výsledky ovšem nevypadají špatně. Když John Bohannon ze Science napsal do firmy skeptický e-mail, firma mu uspořádala prezentaci přes Skype, ve které si program vedl dobře, i když ne tak dobře, jak by se mohlo zdát z tiskové zprávy. Velmi rychle vyřešil dva CAPTCHA kódy náhodně stažené z internetu. Jeden byl za stránek platební služby PayPal, druhá reCAPTCHA od firmy Google (mimochodem aktualizovaná právě před několika dny tak, aby byla pro roboty náročnější).

Na druhou stranu neuspěl v případě CAPTCHA se znaky z azbuky a nerozluštil ani kód, ve kterém byla písmena na černobílé šachovnici. Podle autorů nejde v zásadě o neřešitelný problém. Jednoduše jejich program zatím není naučený nic jiného než latinku. V případě šachovnice by bylo možné před něj ještě nasadit "filtr", který mu umožní číst i černobílá písmena.

CAPTCHA kódy, se kterými se pogram firmy Vicarious potýkal před redaktorem časopisu Science. První dva prý rozluštil během několika sekund, spodní dva vůbec. Prý zatím neumí nic než latinku a byl nevhodně nastavený i pro čtení písmen s různými barvami. Obojí prý lze snadno napravit, tvrdí firma.

I když prezentace skeptického novináře hodně zviklala, k obezřetnosti velí fakt, že nevíme, jak to firma udělala. Pracují v ní sice vědci z renomovaných amerických univerzit, ale úspěch oznámila jen prostá tisková zpráva na stránkách Vicarious. Podle serveru Science se skupina zatím nechystá napsat ani vědeckou práci, která by úspěch popsala přesněji. Za prvé by je to prý stálo příliš mnoho času a také nechtějí navádět spammery.

Zatím se musíme spokojit s vágním sdělením, že používá nápodoby našich smyslů, respektive nervů na nich napojených. V podstatě se tedy skládá z jednoduchých prvků, které dělají jednoduché úkony (je/není tu černý pixel), a to na několika úrovních. Výsledkem je poměrně složitá síť s několika miliony prvků, která nakonec na základě shody "odhadne", co vlastně na obrazovce je.

Ale to mnoho neřekne. Podobný přístup není zdaleka nový, tzv. neuronové sítě jsou naopak jeden z nejstarších vážně míněných přístupů k vytvoření umělé inteligence. Důležité by byly jiné údaje, ty ovšem firma nezveřejnila.

V tuto chvíli nelze říct, zda se kalifornské skupině podařilo tuto snahu skutečně posunout na novou úroveň. Jeden z autorů termínu CAPTCHA, Luis von Ahn z Pittsburghu, byl například pro časopis Forbes skeptický. Podle něj se CAPTCHA může snadno změnit, například přestává být postupně založená na textu a bude spíše obrázková. "Garantuji vám, že tu nezvládnou, protože to by znamenalo na poli zpracování obrazu veliký průlom," řekl Ahn. Vicarious naproti tomu tvrdí, že jejich program zvládne i obrázkovou CAPTCHA v různých podmínkách (s barvami, ve 3D, s různým světlem atd.).

Takže zřejmě uvidíme až v roce 2028. Do té doby se "lamači" z rozvojových zemí zřejmě nemusí o zakázky bát. Těžko říct, jestli to pro ně je dobrá zpráva; podobná automatizace lidského mozku není nic, na co by jejich zaměstnavatelé i zákazníci mohli být hrdí.

Autor:
  • Nejčtenější

Šéf normalizační televize Zelenka byl oportunistický, ale vzdělaný pragmatik

v diskusi je 7 příspěvků

5. prosince 2023

Před 100 lety, 5. prosince 1923, se v Ústí nad Orlicí narodil Jan Zelenka, novinář a hlavně...

Staré weby vznikly v devadesátých letech a stále běží. Ukážou počasí i film

v diskusi je 1 příspěvek

5. prosince 2023

Ač se historie webu začala psát teprve v roce 1990, kdy se zrodila vůbec první webová stránka,...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Herec Čestmír Řanda byl nezapomenutelný v komediích i dramatických rolích

v diskusi je 7 příspěvků

4. prosince 2023

Pátého prosince 1923 se v Rokycanech narodil Čestmír Řanda, známý český herec, díky své figuře...

Vymysleli je kvůli vesmírným misím, nyní je používáme v našich domovech

v diskusi je 26 příspěvků

4. prosince 2023

Čističky vzduchu, solární články, vývoj LED technologie, sušení potravin, bateriové domácí...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

OBRAZEM: Šest nápadů, které se neujaly, byť to jejich tvůrci mysleli dobře

v diskusi je 39 příspěvků

3. prosince 2023

Velké i menší technologické firmy hýří mnoha nápady, ale ne vždy jsou jejich snahy korunovány...

Vyhráli čtvrt miliardy ve sportce, roky se schovávají. Radost nikdy nepřišla, říkají

Premium Na těle má vytetovaných šest čísel. 3, 5, 7, 8, 25 a 29. Jsou to čísla, která jemu a jeho manželce přinesla 250 milionů...

Klobásy a temná ezoterika. Jak jsem si zajel s KSČM do Polska za nákupy

Premium Ještě že jsem dorazil s předstihem. Autobus z temného náměstí v Lysé nad Labem vyráží o dvě minuty dříve, než bylo...

Nová princezna. Herečka Sára Korbelová o vánoční pohádce i intimních scénách

Premium Je jí jednadvacet, ale už má za sebou slušnou řádku rolí. A zajímavých, od těhotné studentky po slečnu trpící úzkostmi....

Šéf normalizační televize Zelenka byl oportunistický, ale vzdělaný pragmatik

v diskusi je 7 příspěvků

5. prosince 2023

Před 100 lety, 5. prosince 1923, se v Ústí nad Orlicí narodil Jan Zelenka, novinář a hlavně...

Staré weby vznikly v devadesátých letech a stále běží. Ukážou počasí i film

v diskusi je 1 příspěvek

5. prosince 2023

Ač se historie webu začala psát teprve v roce 1990, kdy se zrodila vůbec první webová stránka,...

Herec Čestmír Řanda byl nezapomenutelný v komediích i dramatických rolích

v diskusi je 7 příspěvků

4. prosince 2023

Pátého prosince 1923 se v Rokycanech narodil Čestmír Řanda, známý český herec, díky své figuře...

Vymysleli je kvůli vesmírným misím, nyní je používáme v našich domovech

v diskusi je 26 příspěvků

4. prosince 2023

Čističky vzduchu, solární články, vývoj LED technologie, sušení potravin, bateriové domácí...

Akční letáky
Akční letáky

Prohlédněte si akční letáky všech obchodů hezky na jednom místě!

Vyhráli čtvrt miliardy ve sportce, roky se schovávají. Radost nikdy nepřišla, říkají

Premium Na těle má vytetovaných šest čísel. 3, 5, 7, 8, 25 a 29. Jsou to čísla, která jemu a jeho manželce přinesla 250 milionů...

Zemřela slovenská zpěvačka Haščáková z pěveckého dua MC Erik & Barbara

Ve věku 43 let zemřela na Floridě slovenská zpěvačka Barbara Haščáková z pěveckého dua MC Erik & Barbara, které se v...

StarDance opustil cukrář Josef Maršálek. V děkovné řeči padla peprná slova

Osmé kolo StarDance bylo posledním pro cukráře Josefa Maršálka a Adrianu Maškovou. V rozstřelu byli s kajakářem...

Potvrzeno. Ceny elektřiny od ledna stoupnou kvůli regulované složce

Energetický regulační úřad potvrdil růst regulovaných cen energií od ledna 2024. Oproti před měsícem uváděnému růstu...

Přísahám, že jsem chtěl být jen pan domácí, říká Viewegh o lásce k Ukrajince

Spisovatel Michal Viewegh (61) promluvil v Show Jana Krause o tom, jak se jeho snaha pomoci ukrajinským uprchlíkům...