border=0

Технология »OCR

OCR анықтамасы


Тек сканердің әріптер мен типтерді тани алатындығын көре аламыз.

OCR немесе оптикалық таңбаларды тану , испан тіліне аударылған, адамның көзін еліктеуге бағытталған технология, бұл технология пиксельді пиксель таңбалары мен қаріп (қаріп) түрімен тануға тырысады. құжат Біз әдеттегі және ағымдағы сканер және өте қуатты бағдарламалық құрал туралы айтып отырмыз. Біз қуатты бағдарламалық жасақтамаға сілтеме жасағанда, әртүрлі әріптер мен олардың тиісті түрлерін тану үшін үлкен және кең дерекқорды білдіреді.


Бағдарламалық қамтамасыздандырудан басқа, сканер маңызды. Сезімтал сканер құжаттың пикселдерін жақсы оқып береді, себебі бұл сезімталдық бағдарламалық жасақтамаға қате жібереді. Бағдарламалық жасақтаманың дұрыс емес екендігі өте қиын. Кез-келген құжат сканерге орналастырылады және Word форматында немесе бағдарлама таңдауға мүмкіндік беретін пішімде шығарылады. Осыдан кейін құжат түзетілуі керек. Түзетілгеннен кейін оны бөлісу немесе мұрағаттау үшін pdf-ге қоюға болады.


OCR-ға берілетін керемет құралдардың бірі кітаптарды сканерлеу болып табылады. Мәселен, ұлттық кітапхана жинағы. Сондай-ақ, ipad және android типті планшеттерінде және электрондық кітап оқырмандарында барлық жерде оқуға болатын белгілі электронды кітап .


Кітаптың қалай сканерленетініне мысал.

OCR технологиясы шектеулерге ие. Ол ескі мәтіндер үшін жұмыс істемейді немесе қандай да бір себептермен олар физикалық бұзылуына ұшырады. Мың жылдан астам уақытқа созылатын тарихи құжаттарға қатысты бұл нашарлау қалыпты жағдай. Осы жылдар ішінде жасалынған құжаттардың бұл түрі ОКР технологиясы үшін танылмайды. Құжаттардың бұл түрлері, әдетте, фотосуреттер пішімінде жоғары ажыратылымдықты сканерлеу арқылы мұрағатталған, сондықтан жұртшылық құжаттың барлық бөлшектерін нашарлай түсіре алады.
OCR-тің рұқсаты жүйенің өзі анықтайтын қаншалықты егжей-тегжейлі екенін көрсетеді. Таза және анықталған мәтіндер үшін 300 нүкте / дюйм (нүкте / дюйм) пайдалану қалыпты жағдай. Бұл сканерден конфигурацияланған. Бір дюйм 25,400 миллиметрге тең , сондықтан мұндай шағын алаң үшін 300 пиксел жеткілікті. Газеттер немесе ұқсас жағдайларда. онда хат аз және қағаз үнемі аздап бүлінсе, оңтайлы ажыратымдылық 600 дpi болады. Егер осы соңғы ажыратымдылықты сканерлейтін болсақ, біз жақсы сканерге ие боламыз, себебі қарапайым сканерге осы ажыратымдылықтағы әрекетті аяқтау үшін көп шығындар қажет.

OCR эволюциясы бұл жүйенің жақсаруы арқылы өтеді. IMPACT деп аталатын жобадағы жақсарту . Бұл жоба бірнеше мемлекеттік мекемелер мен кейбір компаниялар арасында ақпаратты жаппай цифрландыруға қойылатын барлық талаптарды қанағаттандыратын OCR бағдарламалық жасақтамасын әзірлеуге бағытталған.

Автор: Франциско Кано | + QUOTE
OCR ішіндегі тақырыптар

Әлеуметтік желілер