Odborníkům ze Západočeské univerzity v Plzni (ZČU) se podařilo zpracovat písemné a obrazové dokumenty a umístit je na web archivkgb.zcu.cz.
Dokumentaci zveřejnil Ústav pro studium totalitních režimů (ÚSTR) u příležitosti kulatého výročí sovětského útoku na Čechoslováky, který se odehrál v Charkově od 12. do 14. června 1931 a je znám také jako proces s českými učiteli.
„Jeho cílem patrně bylo zlikvidovat kontakty české menšiny v Sovětském svazu s vlastí, přinutit ji k úplné sovětizaci a pokusit se i tímto způsobem přimět československou vládu k diplomatickému uznání SSSR,“ říká Adam Hradilek z ÚSTR s tím, že šlo o do té doby největší vykonstruovaný proces proti českým krajanům v Sovětském svazu.
Z celkem jednadvaceti souzených osob bylo dvanáct učitelů. Původně však tehdejší sovětská bezpečnostní služba v rámci této akce pozatýkala od července 1930 do ledna 1931 desítky českých učitelů, vedoucích krajanských spolků, rolníků a předních činitelů českých komunit. Ti byli souzeni v navazujících procesech.
Zmuchlané, zažloutlé špatně naskenované
Uveřejněný spis obsahuje 73 svazků čítajících více než deset tisíc stran dokumentů sovětské bezpečnostní služby. Dokumenty byly zdigitalizovány ve Státním archivu Bezpečnostní služby Ukrajiny.
Kromě vyšetřovacích spisů jednotlivých osob jsou zde k dispozici přepisy soudního líčení z 12. až 14. června 1931, instruktážní brožura sestavená na základě procesu, dokumentace k rehabilitaci obětí z poloviny 60. let či zabavené dokumenty, dopisy, osobní doklady a fotografie souzených osob.
Díky zapojení desetičlenného týmu z katedry kybernetiky a výzkumného centra NTIS Fakulty aplikovaných věd je možné v rozsáhlých materiálech vyhledávat. Jejich software dokáže z naskenovaných obrazových a textových dokumentů, které jsou v ruštině, ukrajinštině a češtině, získat text, a to pomocí metody nazývané Optical Character Recognition. Tento elektronický text pak software uloží do databáze, v níž lze dobře vyhledávat.
„Výzva pro nás spočívá především v tom, jak dostat co nejvíce smysluplného textu z dokumentů, které jsou zmuchlané, zažloutlé nebo třeba naskenované nakřivo či v malém formátu a zároveň obsahují například směs strojopisu a ručně psaných poznámek, a to vše je ještě doplněno otisky razítek,“ přibližuje úskalí práce s dokumenty Marek Hrúz z katedry kybernetiky FAV.
Kromě úkolu získat co nejvíce textu z dokumentů je cílem kybernetiků uložit texty do databáze tak, aby v ní bylo možné rychle a přesně vyhledávat, a navrhnout uživatelské rozhraní, které bude intuitivní a přátelské pro odbornou i laickou veřejnost.
Databáze, v níž se bude rychle a přesně hledat
Celkem software zpracuje přes milion textových a fotografických dokumentů, které ÚSTR v rámci dokumentační činnosti digitalizoval v rozmezí let 2014 až 2020 zejména v ukrajinských a ruských archivech.
Jedná se převážně o kopie vyšetřovacích spisů osob postižených represí NKVD a KGB na území Sovětského svazu, jejichž osud se váže k československé historii.
Dokumenty se tak vztahují například k represím páchaným na krajanech od 20. do 50. let 20. století, k osudům Čechoslováků v Gulagu, sovětizaci Podkarpatské Rusi po roce 1945 nebo invazi vojsk Varšavské smlouvy do Československa v roce 1968.
Projekt Digitální archiv dokumentů NKVD/KGB vztahujících se k Československu probíhá od března 2020 do konce roku 2022 a finančně ho podpořilo Ministerstvo kultury ČR z programu aplikovaného výzkumu a experimentálního vývoje národní a kulturní identity NAKI II.