Premium

Získejte všechny články
jen za 89 Kč/měsíc

Most mezi papírovým a elektronickým světem

- Ceny skenerů v posledních letech neuvěřitelně klesly. Zejména jednodušší kancelářské přístroje pro načítání dokumentů do počítače nebo pro faxování pomocí modemu už se dají koupit... no, za babku ještě ne, ale lacino už ano. A tak vynalézavá česká duše vymýšlí, jak toto zařízení využít i jinak.

Leckoho asi napadne, zda by počítač neuměl načtené předlohy také přečíst - tedy převést do podoby textového souboru, kdy by je šlo běžnými způsoby dál editovat.

PÍSMO A JEHO OBRAZ
Novopečeného majitele skeneru obvykle zaskočí, že když si v tomto přístroji nasnímá třeba dopis nebo jiný text, nemůže už do něj v počítači zasahovat tak, jak je zvyklý při práci s textovým editorem: opravovat, mazat písmena či slova, přehazovat části textu a podobně. Soubor, který skener vytvoří z popsaného papíru, jímž jste jej "nakrmili", není textovým souborem, i když tak na první pohled vypadá. Zdánlivě tu sice jsou písmenka, slova i odstavce, ve skutečnosti to však je jenom obraz jejich určitého seskupení. Pro počítač je v takovém případě zcela lhostejné, zda čmáranice, kterou převedl do digitální podoby, je objednávka nového traktoru nebo Leonardova Madona ve skalách.
Je samozřejmě možné ukládat psané dokumenty i v této podobě, má to ale řadu nevýhod. Vedle již zmíněné nemožnosti editace to jsou především podstatně větší rozměry grafického souboru ve srovnání s textovým - obrázek v paměti zabere i několikanásobně víc místa, než stejně dlouhý text napsaný editorem.
Chtělo by to tedy, aby počítač uměl to, co člověk: obrázek textu přečíst, v duchu rozpoznat, že grafické značky určitého tvaru jsou symbolem pro konkrétní písmena a na jejich místa pak dosazovat počítačové kódy, které pro tato písmena používá příslušný textový editor.

OPTICKÉ ROZPOZNÁVÁNÍ ZNAKŮ
Takové programy skutečně už pár let existují. Říká se jim OCR (Optical Character Recognita - programy pro optické rozpoznávání znaků). Jedním z nejznámějších a nejrozšířenějších je produkt Recognita Select, existují ovšem i jiné (a obvykle také levnější).
Ve skutečnosti to však je s tím rozpoznáváním dost složité. Každé písmeno má téměř neomezené množství podob - vyskytuje se jako malé, velké, psací, tiskací, existují různé druhy a různé rozměry písem a co teprve, když se k tomu přidá ještě rukopis, který má každý člověk jiný. Počítačové čtení tedy klade na zařízení dost velké nároky. Skutečně pokročilý software OCR pracuje s prvky umělé inteligence a patří k nejsložitějším běžně užívaným programům vůbec.
Přesto neočekávejte, že do skeneru strčíte nečitelný rukopis podobný záznamu seizmografu a na monitoru se objeví dokonale přečtený. Úspěšnost čtení není nikdy stoprocentní, podíl správně rozpoznaných znaků je tím menší, čím vzdálenější je předloha od průměrného tiskacího písma.
V praxi to znamená chybně rozpoznané znaky ručně opravovat a doplňovat. Přestože je to pořádná otrava, zejména u dlouhých textů jde i tak o značnou úsporu času a nákladů. Krátké a ještě ke všemu špatně čitelné či jinak atypické originály je ovšem obvykle lepší si přepsat ručně.

METRÁKOVÝ ARCHIV DO KAPSY
Možnosti využití OCR jsou nepřeberné. Jen namátkou: i rozměrný a těžký archiv (technickou dokumentaci, knihovnu příruček, bedny výstřižků, skříň plnou výsledků mnoha let vlastní předchozí práce a podobně) můžete změnit v přehledný adresář počítačových souborů, který nic neváží a můžete jej tedy nosit všude sebou - ať už v notebooku, nebo v podobě CD-ROM, disku Zip, LS-120, Jaz nebo jiné "kapesní" paměti. Chtěli byste pracovat třeba v klidu na chalupě, jenže s sebou nemůžete vláčet, a pak nechávat na pospas myším a zlodějům desítky kilogramů podkladů a literatury? Žádný problém - naskenujte si je.
Kvalitní programy OCR sice lácí právě nevynikají, často však bývají dodávány bezplatně s kancelářskými skenery. U lepších přístrojů si pak může zákazník podle svého zaměření vybrat, zda mu k výrobku přibalí OCR, nebo program pro úpravy obrazu (grafický editor). Ne vždy je ovšem takto dodávaný software v plné nebo nejnovější verzi.
Zajímavou myšlenkou je dodávat OCR v rámci kancelářských balíků - tedy souborů několika vzájemně provázaných programů určených pro běžnou agendu vedenou na počítači (textový editor, tabulkový procesor, plánovací kalendář, programy pro vedení korespondence a podobně). Když je zde i OCR, máte záruku, že je kompatibilní s textovým editorem. V případě českého (a překvapivě levného) kancelářského balíku 602 pro PC pak navíc i bezpečně víte, že vyhovuje češtině. U samostatných programů OCR je potřeba si bezproblémovou kompatibilitu s vaším textovým editorem a s českým jazykem ověřit.

Autor:

Eurovolby 2024

Volby do Evropského parlamentu se v Česku uskuteční v pátek 7. a v sobotu 8. června 2024. Čeští voliči budou vybírat 21 poslanců Evropského parlamentu. Voliči v celé Evropské unii budou rozhodovat o obsazení celkem 720 křesel.

Doba míru je pryč, říká poradce premiéra Pojar

  • Nejčtenější

Studentky rozrušila přednáška psycholožky, tři dívky skončily v nemocnici

25. dubna 2024  12:40,  aktualizováno  14:38

Na kutnohorské střední škole zasahovali záchranáři kvůli skupině rozrušených studentek. Dívky...

Tři roky vězení. Soud Ferimu potvrdil trest za znásilnění, odvolání zamítl

22. dubna 2024,  aktualizováno  14:47

Městský soud v Praze potvrdil tříletý trest bývalému poslanci Dominiku Ferimu. Za znásilnění a...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Podvod století za 2,4 miliardy. Ortinskému hrozí osm let a peněžitý trest 25 milionů

29. dubna 2024  6:21,  aktualizováno  13:19

Luxusní auta, zlaté cihly, diamanty a drahé nemovitosti. To vše si kupoval osmadvacetiletý Jakub...

Školu neznaly, myly se v potoce. Živořící děti v Hluboké vysvobodili až strážníci

22. dubna 2024  10:27

Otřesný případ odhalili strážníci z Hluboké nad Vltavou na Českobudějovicku. Při jedné z kontrol...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Rusové hlásí průlom fronty. Ukrajinská minela jim přihrála klíčové město

24. dubna 2024  11:40,  aktualizováno  15:50

Premium Jako „den průlomů“ oslavují ruští vojenští blogeři pondělní události na doněcké frontě, kde se...

Hromadná nehoda u letiště zastavila Pražský okruh, jedno z aut skončilo na střeše

29. dubna 2024  16:33,  aktualizováno  20:36

Všechny složky integrovaného záchranného systému zasahovaly v pondělí na 27. kilometru Pražského...

Trojský koník v Evropě. San Marino se stalo základnou ruských špionů

29. dubna 2024

Premium Jeden z nejmenších států v Evropě vzbuzuje čím dál větší pozornost západních tajných služeb....

Jaká práce lidem zbyla? Spolupráci s OpenAI vedou z médií i Financial Times

29. dubna 2024  19:39

Financial Times (FT) se stal prvním významným britským zpravodajským médiem, které uzavřelo...

Špehovali, zpřístupňovali trezory. Jak se ruští „krtci“ ve Vrběticích činili

29. dubna 2024  19:34

Série výbuchů a incidentů v Evropě, včetně explozí v muničním areálu ve Vrběticích z roku 2014,...

Akční letáky
Akční letáky

Všechny akční letáky na jednom místě!

Bývalý fitness trenér Kavalír zrušil asistovanou sebevraždu, manželka je těhotná

Bývalý fitness trenér Jan Kavalír (33) trpí osmým rokem amyotrofickou laterální sklerózou. 19. dubna tohoto roku měl ve...

Tenistka Markéta Vondroušová se po necelých dvou letech manželství rozvádí

Sedmá hráčka světa a aktuální vítězka nejprestižnějšího turnaje světa Wimbledonu, tenistka Markéta Vondroušová (24), se...

Horňáci versus dolňáci. Víme, čemu muži dávají přednost, a je to překvapení

Ženské tělo je pro muže celkově velmi atraktivní a nabízí jejich očím mnoho zajímavých partií. Největší pozornosti se...

Hello Kitty slaví padesátiny. Celý svět si myslí, že je to kočička, jenže není

Kulatý obličej se dvěma trojúhelníkovýma ušima, drobný čumáček, vousky a červená mašle na uchu. Taková je Hello Kitty,...

KOMENTÁŘ: Z Davida Černého se stal parazit. O umění už dávno nejde

Premium Když se David Černý v televizi pohádal s kurátorkou Marií Foltýnovou, spory o jeho plastiku na obchodním domě Máj...