Extrakce textu z obrázků významně pokročila, nicméně stále je co zlepšovat. Své o tom ví podniky, vlády, či výzkumníci, kteří mají řadu dat stále v papírové podobě. Případně je naskenovali do obrazového formátu PDF a teď neví, jak je z nich vydolovat. Tyto digitální dokumenty totiž mají pevný formát. To znamená, že data v nich jsou „uzamčená“, a pro počítače je těžké je číst a analyzovat.