Није увек могуће извући текст из ПДФ датотеке користећи конвенционално копирање. Често су странице таквих докумената скенирани садржај њихових верзија. Да бисте претворили такве датотеке у потпуно изменљиве текстуалне податке, користе се посебни програми са функцијом препознавања оптичких знакова (ОЦР).
Таква решења су веома тешка за имплементацију и, стога, коштају много новца. Ако вам редовно препознајете текст са ПДФ-ом, препоручљиво је купити одговарајући програм. За ријетке случајеве било би логичније користити једну од доступних онлине услуга с сличним функцијама.
Садржај
Наравно, функција за онлине услуге ОЦР-а је ограничена у поређењу са пуна решења за десктоп. Али можете радити са таквим ресурсима било бесплатно, или по номиналној накнади. Најважније је да се одговарајуће веб апликације баве главним задатком, односно препознавањем текста.
Компанија за развој услуга је једна од лидера у области препознавања оптичких докумената. АББИИ ФинеРеадер за Виндовс и Мац је моћно решење за претварање ПДФ-а у текст и даље рад са њим.
Веб цоунтерпарт програма, наравно, је инфериоран у функционалности. Ипак, сервис може препознати текст из скенирања и фотографија на више од 190 језика. Подржава конверзију ПДФ датотека у документе Реч , Екцел итд.
АББИИ ФинеРеадер Онлине онлине сервис
Услуга се разликује, вероватно, са најтачнијим алгоритмима за препознавање текста на сликама и ПДФ датотекама. Али, нажалост, његова слободна употреба је ограничена на пет страница обрађених месечно. Да бисте радили са обимнијим документима, морате купити једну годишњу претплату.
Међутим, ако је ОЦР функција веома ретка, АББИИ ФинеРеадер Онлине је одлична опција за извлачење текста из малих ПДФ датотека.
Једноставна и погодна услуга за дигитализацију текста. Без потребе за регистрацијом, ресурс вам омогућава да препознајете 15 потпуних ПДФ страница на сат. Бесплатан онлине ОЦР у потпуности ради са документима на 46 језика и без овлашћења подржава три формата извоза текста - ДОЦКС, КСЛСКС и ТКСТ.
Када се региструје, корисник може да обрађује вишестраничне документе, али слободан број ових страница је ограничен на 50 јединица.
Онлајн услуга Бесплатан онлине ОЦР
За овлашћене кориснике, низ активности је нешто другачији.
Ако желите да извучете текст из малог документа ПДФ-а, безбедно можете да користите алат који је описан горе. Да бисте радили са великим фајловима, морат ћете купити додатне симболе у Фрее ОЦР-у или искористити друго рјешење.
Потпуно бесплатан ОЦР-сервис који вам омогућава да извучете текст из готово било ког графичког и електронског документа попут ДјВу и ПДФ-а. Ресурс не намеће ограничења на величину и број препознатљивих датотека, не захтева регистрацију и нуди широк спектар повезаних функција.
НевОЦР подржава 106 језика и омогућава правилно руковање чак нижим квалитетним скенирањем докумената. Могуће је ручно изабрати подручје за препознавање текста на страници датотеке.
Алат је згодан и препознаје све карактере у довољно високом квалитету. Међутим, обрада сваке странице увезеног ПДФ документа мора бити покренута независно и приказана у посебном фајлу. Можете, наравно, одмах копирати резултате препознавања у клипборд и спојити их са другима.
Ипак, с обзиром на горњу нијансу, велике количине текста користећи НевОЦР је врло тешко извући. Услуга се бави малим датотекама "са бангом."
Једноставан и разумљив извор за дигитализацију текста омогућава препознавање ПДФ докумената и излазни резултат у ТКСТ датотеку. Не постоји ограничење броја страница. Једино ограничење је да величина улазног документа не смије прелазити 5 мегабита.
Ако желите само да извучете текст из ПДФ-а, а финално обликовање уопште није битно, ОЦР.Спаце је добар избор. Једини документ мора бити "монолингуалан", јер признавање два или више језика истовремено у служби није обезбеђено.
Погледајте и: Слободни аналоги ФинеРеадер
Процењујући онлине алате представљене у чланку, треба напоменути да АББИИ ФинеРеадер Онлине најједноставније и прецизније обрађује ОЦР функцију. Ако је максимална тачност препознавања текста важна за вас, најбоље је размотрити ову посебну опцију. Али плаћање за то, највероватније, такође мора.
Ако требате дигитализовати мале документе и спремни сте сами исправити грешке у услузи, препоручљиво је користити НевОЦР, ОЦР.Спаце или Фрее Онлине ОЦР.