Није увек могуће извући текст из ПДФ датотеке користећи конвенционално копирање. Често су странице таквих докумената скенирани садржај њихових верзија. Да бисте претворили такве датотеке у потпуно изменљиве текстуалне податке, користе се посебни програми са функцијом препознавања оптичких знакова (ОЦР).

Таква решења су веома тешка за имплементацију и, стога, коштају много новца. Ако вам редовно препознајете текст са ПДФ-ом, препоручљиво је купити одговарајући програм. За ријетке случајеве било би логичније користити једну од доступних онлине услуга с сличним функцијама.

Како препознати текст из ПДФ-а на мрежи

Наравно, функција за онлине услуге ОЦР-а је ограничена у поређењу са пуна решења за десктоп. Али можете радити са таквим ресурсима било бесплатно, или по номиналној накнади. Најважније је да се одговарајуће веб апликације баве главним задатком, односно препознавањем текста.

Метод 1: АББИИ ФинеРеадер Онлине

Компанија за развој услуга је једна од лидера у области препознавања оптичких докумената. АББИИ ФинеРеадер за Виндовс и Мац је моћно решење за претварање ПДФ-а у текст и даље рад са њим.

Веб цоунтерпарт програма, наравно, је инфериоран у функционалности. Ипак, сервис може препознати текст из скенирања и фотографија на више од 190 језика. Подржава конверзију ПДФ датотека у документе Реч , Екцел итд.

АББИИ ФинеРеадер Онлине онлине сервис

  1. Пре него што почнете да радите са алатом, креирајте налог на сајту или се пријавите користећи свој Фацебоок, Гоогле или Мицрософт налог.
    Региструјте се са АББИИ ФинеРеадер Онлине
    Да бисте прешли на прозор за пријављивање, кликните на дугме "Логин" на врху менија.
  2. Када се пријавите, импортирајте жељени ПДФ документ у ФинеРеадер помоћу дугмета "Уплоад Филес" .
    Препознавање текста из ПДФ документа у онлине сервису АББИИ ФинеРеадер Онлине
    Затим кликните на "Изабери бројеве страница" и одредите жељени интервал за препознавање текста.
  3. Затим изаберите језике присутне у документу, формат настале датотеке и кликните на дугме "Препознај" .
    Почните препознавање текста из ПДФ документа у АББИИ ФинеРеадер Онлине
  4. Након обраде, чије трајање зависи у потпуности од величине документа, можете готову датотеку преузети са текстуалним подацима једноставно кликом на своје име.
    Преузимање завршеног документа са онлине услуге АББИИ ФинеРеадер Онлине
    Или га извозите у једну од доступних сервиса у облаку.

Услуга се разликује, вероватно, са најтачнијим алгоритмима за препознавање текста на сликама и ПДФ датотекама. Али, нажалост, његова слободна употреба је ограничена на пет страница обрађених месечно. Да бисте радили са обимнијим документима, морате купити једну годишњу претплату.

Међутим, ако је ОЦР функција веома ретка, АББИИ ФинеРеадер Онлине је одлична опција за извлачење текста из малих ПДФ датотека.

Метод 2: ОЦР бесплатан на мрежи

Једноставна и погодна услуга за дигитализацију текста. Без потребе за регистрацијом, ресурс вам омогућава да препознајете 15 потпуних ПДФ страница на сат. Бесплатан онлине ОЦР у потпуности ради са документима на 46 језика и без овлашћења подржава три формата извоза текста - ДОЦКС, КСЛСКС и ТКСТ.

Када се региструје, корисник може да обрађује вишестраничне документе, али слободан број ових страница је ограничен на 50 јединица.

Онлајн услуга Бесплатан онлине ОЦР

  1. Да бисте препознали текст из ПДФ-а као "госта", без дозволе на ресурсу, користите одговарајући образац на главној страници сајта.
    Препознавање ПДФ-а у ОЦР онлине услугама Фрее Онлине
    Изаберите жељени документ помоћу дугмета "Филе" , изаберите главни језик текста, излазни формат, затим сачекајте да се датотека преузме и кликнете "Претвори" .
  2. На крају процеса дигитализације, кликните на "Преузмите излазну датотеку" да бисте сачували завршени документ помоћу текста на рачунару.
    Преузимање резултата за препознавање текста из ПДФ-а из бесплатне онлине ОЦР онлине услуге

За овлашћене кориснике, низ активности је нешто другачији.

  1. Користите дугме "Регистрација" или "Пријављивање" у врху менија да бисте креирали или приступили вашем бесплатном ОЦР налогу.
    Креирање налога у он-лине сервису ОЦР бесплатног Интернета
  2. Након ауторизације на панелу за препознавање, држите притиснут тастер "ЦТРЛ" и изаберите до два језика изворног документа са листе.
    Одређивање изворних језика документа за препознавање текста у бесплатном ОЦР-у
  3. Наведите додатне параметре за извлачење текста из ПДФ-а и кликните на дугме "Изабери датотеку" да бисте отпремили документ у сервис.
    Почетак препознавања ПДФ документа у онлине услугама ОЦР онлине бесплатне услуге
    Затим, за почетак препознавања, кликните на "Цонверт" .
  4. Након обраде документа, кликните на везу са именом излазне датотеке у одговарајућем ступцу.
    Преузимање завршене ДОЦКС датотеке са онлине услуге онлајн бесплатног ОЦР-а
    Резултат препознавања ће се одмах чувати у меморији вашег рачунара.

Ако желите да извучете текст из малог документа ПДФ-а, безбедно можете да користите алат који је описан горе. Да бисте радили са великим фајловима, морат ћете купити додатне симболе у ​​Фрее ОЦР-у или искористити друго рјешење.

Метод 3: НевОЦР

Потпуно бесплатан ОЦР-сервис који вам омогућава да извучете текст из готово било ког графичког и електронског документа попут ДјВу и ПДФ-а. Ресурс не намеће ограничења на величину и број препознатљивих датотека, не захтева регистрацију и нуди широк спектар повезаних функција.

НевОЦР подржава 106 језика и омогућава правилно руковање чак нижим квалитетним скенирањем докумената. Могуће је ручно изабрати подручје за препознавање текста на страници датотеке.

Онлине услуга НевОЦР

  1. Дакле, одмах можете почети да радите са ресурсом, без потребе за обављањем непотребних радњи.
    Преузимање документа за препознавање ПДФ-а на онлине услугу НевОЦР
    Директно на главној страници постоји образац за увоз документа на сајт. Да бисте отпремили датотеку у НевОЦР, користите тастер "Изабери датотеку" у одељку "Одабир датотеке" . Затим у пољу "Рецогнитион (с)" изаберите један или више језика оригиналног документа, а затим кликните на "Уплоад + ОЦР" .
  2. Подесите жељене поставке препознавања, одаберите жељену страницу да бисте извадили текст и кликните на дугме "ОЦР" .
    Подешавање и покретање препознавања текста из ПДФ-а у онлајн сервису НевОЦР
  3. Скролујте доле мало испод и пронађите дугме "Преузми" .
    Преузмите текст извучен у НевОЦР на рачунар
    Кликните на њега и одаберите тражени формат документа за преузимање на падајућој листи. Након тога, завршени фајл са екстрахованим текстом ће бити преузет на ваш рачунар.

Алат је згодан и препознаје све карактере у довољно високом квалитету. Међутим, обрада сваке странице увезеног ПДФ документа мора бити покренута независно и приказана у посебном фајлу. Можете, наравно, одмах копирати резултате препознавања у клипборд и спојити их са другима.

Ипак, с обзиром на горњу нијансу, велике количине текста користећи НевОЦР је врло тешко извући. Услуга се бави малим датотекама "са бангом."

Метод 4: ОЦР.Спаце

Једноставан и разумљив извор за дигитализацију текста омогућава препознавање ПДФ докумената и излазни резултат у ТКСТ датотеку. Не постоји ограничење броја страница. Једино ограничење је да величина улазног документа не смије прелазити 5 мегабита.

ОЦР.Спаце онлине услуга

  1. Регистрација за рад са алатом није неопходна.
    Увезите ПДФ датотеку у ОЦР.Спаце онлине услугу
    Једноставно кликните на горњи линк и отпремите ПДФ документ на веб локацију са вашег рачунара помоћу дугмета "Изабери датотеку" или из мреже тако што ћете кликнути на везу.
  2. На падајућој листи "Изаберите ОЦР језик" изаберите језик увезеног документа.
    Покретање процеса препознавања ПДФ документа у онлине сервису ОЦР.Спаце
    Затим започните процес препознавања текста кликом на дугме "Старт ОЦР!" .
  3. На крају обраде датотека, прегледајте резултат у пољу "ОЦР'ед Ресулт" и кликните на "Довнлоад" да бисте преузели завршени ТКСТ документ.
    Преузимање резултата препознавања ПДФ датотеке из онлине услуге ОЦР.Спаце

Ако желите само да извучете текст из ПДФ-а, а финално обликовање уопште није битно, ОЦР.Спаце је добар избор. Једини документ мора бити "монолингуалан", јер признавање два или више језика истовремено у служби није обезбеђено.

Погледајте и: Слободни аналоги ФинеРеадер

Процењујући онлине алате представљене у чланку, треба напоменути да АББИИ ФинеРеадер Онлине најједноставније и прецизније обрађује ОЦР функцију. Ако је максимална тачност препознавања текста важна за вас, најбоље је размотрити ову посебну опцију. Али плаћање за то, највероватније, такође мора.

Ако требате дигитализовати мале документе и спремни сте сами исправити грешке у услузи, препоручљиво је користити НевОЦР, ОЦР.Спаце или Фрее Онлине ОЦР.