„Yandex“ išmokė neuroninius tinklus iššifruoti archyvinius įrašus naudojant sudėtingą rašybą
įvairenybės / / April 03, 2023
Istorinius rankraščius, kuriuos žmogui sunku išanalizuoti, dirbtinis intelektas beveik akimirksniu paverčia spausdintu tekstu.
„Yandex“ pristatė naują paslaugą pavadinimu Archyvų paieška, kuri naudoja neuroninius tinklus archyviniams įrašams iššifruoti su sudėtinga priešrevoliucine rašybą.
Paslauga suteikia prieigą prie daugiau nei 2,5 milijono puslapių istorinių dokumentų su tekstiniais nuorašais. Jo algoritmas, sukurtas optinės simbolių atpažinimo sistemos pagrindu, atsižvelgia į rašysenos ypatumus, atpažįsta aktualumą praradusias raides, supranta ypatingą archyvinių dokumentų struktūrą.
Bendrovės specialistai apmokė neuroninį tinklą šimtų tūkstančių ranka parašytų eilučių duomenų masyve iš tikrų XVIII–XIX amžiaus tekstų ir dešimčių milijonų sugeneruotų pavyzdžių.
Rankraščiai, kuriuos sunku išanalizuoti nepasiruošusiam žmogui, „Yandex“ technologija beveik akimirksniu virsta spausdintu tekstu. Dėl šios priežasties paslaugos duomenų bazėje galite greitai rasti dokumentus su pavarde, vietove ar kitais žodžiais.
„Paieška archyvuose“ padidins istorikų, sociologų, demografų, genealogų darbo efektyvumą ir padės ieškantiems informacijos apie savo šeimą.
Pirmasis paslaugoje pristatytas fondas buvo pagrindinis Maskvos archyvas - būtent jo medžiagoje kūrėjai apmokė neuroninį tinklą. Duomenų bazėje taip pat yra dokumentai iš Orenburgo ir Novgorodo regionų archyvų. Laikui bėgant, saugyklų ir galimų nuskaitytų failų skaičius padidės.
Galite ieškoti XVIII – XX amžiaus pradžios medžiagos, kuri yra populiariausia vartotojų. Tai parapijų metrikų knygos, išpažinties lapai ir revizijos pasakojimai su gyventojų surašymo rezultatais. Dokumentus galite rasti kataloge arba per paieškos juostą. Yra filtrai pagal metus, archyvus, fondus ir atsargas.
Šalia kiekvieno puslapio nuskaitymo rodomas neuroninių tinklų atliktas eilutės po eilutės dekodavimas. Jei užveskite pelės žymeklį virš norimo fragmento, jis iškart bus paryškintas skaitmeninėje kopijoje.