Bilang isang patakaran, pagdating sa mga programa para sa pagkilala sa mga naka-scan na teksto (OCR, pagkilala sa optical character), ang karamihan sa mga gumagamit ay naaalala ang nag-iisang produkto - ABBYY FineReader, na, walang alinlangan, ay namumuno sa naturang software sa Russia at isa sa mga pinuno sa mundo.
Gayunpaman, ang FineReader ay hindi lamang ang ganoong solusyon: may mga libreng programa para sa pagkilala sa teksto, mga serbisyo sa online para sa parehong mga layunin, at, bukod dito, ang mga naturang pag-andar ay naroroon din sa ilang mga programa na alam mo na maaaring mai-install sa iyong computer . Susubukan kong isulat ang tungkol sa lahat ng ito sa artikulong ito. Lahat ng mga nasuri na programa ay gumagana sa Windows 7, 8 at XP.
Lider ng Pagkilala sa Teksto - ABBYY Finereader
Karamihan sa inyo marahil ay narinig ang tungkol sa FineReader (binibigkas na Fine Reader). Ang program na ito ay ang pinakamahusay o isa sa pinakamahusay para sa mataas na kalidad na pagkilala ng mga teksto sa Ruso. Ang programa ay binabayaran at ang presyo ng isang lisensya para sa paggamit ng bahay ay bahagyang mas mababa sa 2000 rubles. Posible ring mag-download ng isang bersyon ng pagsubok ng FineReader o gumamit ng online na pagkilala sa teksto sa ABBYY Fine Reader Online (makikilala mo ang ilang mga pahina nang libre, pagkatapos ay sa isang bayad). Ang lahat ng ito ay magagamit sa opisyal na website ng developer //www.abbyy.ru.
Ang pag-install ng isang bersyon ng pagsubok ng FineReader ay hindi naging sanhi ng anumang mga problema. Ang software ay maaaring pagsamahin sa Microsoft Office at Windows Explorer upang gawing mas madali ang pagpapatakbo ng pagkilala. Sa mga limitasyon ng libreng bersyon ng pagsubok - 15 araw ng paggamit at kakayahang makilala ang hindi hihigit sa 50 mga pahina.
Snapshot para sa mga programa sa pagkilala sa pagsubok
Dahil wala akong scanner, gumamit ako ng isang snapshot mula sa camera ng isang mababang kalidad na telepono upang suriin, kung saan medyo na-edit ko ang kaibahan. Ang kalidad ay walang halaga, tingnan natin kung sino ang makakaya nito.
FineReader Menu
Ang FineReader ay maaaring makatanggap ng isang graphic na imahe ng teksto nang direkta mula sa scanner, mula sa mga file ng imahe o sa camera. Sa aking kaso, sapat na upang buksan ang file ng imahe. Ang resulta ay nalulugod - ilang mga pagkakamali lamang. Dapat kong sabihin na ito ay ang pinakamahusay na resulta ng lahat ng mga nasubok na programa kapag nagtatrabaho sa halimbawang ito - ang katulad na kalidad ng pagkilala ay lamang sa libreng serbisyo sa online na Libreng Online OCR (ngunit sa pagsusuri na ito ay pinag-uusapan lamang namin ang tungkol sa mga tool ng software, hindi online pagkilala).
Ang resulta ng pagkilala sa teksto sa FineReader
Prangka na nagsasalita, ang FineReader ay marahil ay walang mga katunggali para sa mga teksto ng Cyrillic. Ang mga bentahe ng programa ay hindi lamang ang kalidad ng pagkilala sa teksto, kundi pati na rin ang malawak na pag-andar, suporta sa pag-format, karampatang pag-export sa maraming mga format, kasama ang Word docx, pdf at iba pang mga tampok. Kaya, kung ang mga gawain ng OCR ay isang bagay na palagi mong nakatagpo, huwag mag-ekstrang medyo maliit na halaga ng pera at babayaran ito: makakatipid ka ng malaking oras sa pamamagitan ng mabilis na pagkuha ng isang mataas na kalidad na resulta sa FineReader. Sa pamamagitan ng paraan, hindi ako nag-aanunsyo ng anuman - sa palagay ko talaga na ang mga kinakailangang makilala ang higit sa isang dosenang pahina ay dapat isaalang-alang ang pagbili ng naturang software.
CuneiForm - Isang Libreng Programa ng Pagkilala sa Teksto
Sa palagay ko, ang pangalawang pinakatanyag na programa ng OCR sa Russia ay ang libreng CuneiForm, na maaaring mai-download mula sa opisyal na website //cognitiveforms.ru/produkto/cuneiform/.
Ang pag-install ng programa ay napaka-simple din, hindi nito subukang mag-install ng anumang software na third-party (tulad ng maraming libreng software). Ang interface ay maigsi at malinaw. Sa ilang mga kaso, ang pinakamadaling paraan upang magamit ang wizard, kung saan ang una sa mga icon sa menu.
Ang programa na hindi ko nakayanan ang halimbawang ginamit ko sa FineReader, o, mas tiyak, ay gumawa ng isang bagay na hindi mababasa at balangkas ng mga salita. Ang pangalawang pagtatangka ay ginawa gamit ang isang screenshot ng teksto mula sa site ng program na ito mismo, na, gayunpaman, ay dapat na tumaas (kailangan niya ang mga pag-scan ng isang resolusyon na 200dpi at mas mataas, hindi niya basahin ang mga screenshot na may kapal ng isang linya ng font na 1-2 mga pixel). Narito siya ay mahusay na (bahagi ng teksto ay hindi kinikilala, dahil ang Russian lamang ang napili).
Pagkilala sa Teksto sa CuneiForm
Sa gayon, maaari nating ipalagay na ang CuneiForm ay ang dapat mong subukan, lalo na kung mayroon kang mataas na kalidad na mga na-scan na pahina at nais mong makilala ang mga ito nang libre.
Ang Microsoft OneNote ay ang programa na maaaring mayroon ka
Ang Microsoft Office, simula sa bersyon 2007 at nagtatapos sa kasalukuyang isa, 2013, ay may isang programa para sa pagkuha ng mga tala - OneNote. Mayroon din itong mga tampok ng pagkilala sa teksto. Upang magamit ito, ipasok lamang ang na-scan o anumang iba pang imahe ng teksto sa tala, mag-click sa kanan at gamitin ang menu ng konteksto. Pansin ko na ang default na wika ng pagkilala ay nakatakda sa Ingles.
Pagkilala sa Microsoft OneNote
Hindi ko masasabi na ang teksto ay kinikilala nang perpekto, ngunit, sa aking masasabi, medyo mas mahusay ito kaysa sa CuneiForm. Ang pagdaragdag ng programa, tulad ng nabanggit na, ay na may isang malaking posibilidad na naka-install na ito sa iyong computer. Bagaman, siyempre, hindi malamang na maginhawang gamitin ito kung kinakailangan upang gumana sa isang malaking bilang ng mga na-scan na dokumento, mas angkop ito para sa mabilis na pagkilala sa mga kard ng negosyo.
OmniPage Ultimate, OmniPage 18 - Dapat Maging Isang bagay na Lubhang cool
Hindi ko alam kung gaano kahusay ang programa para sa pagkilala sa teksto ng OmniPage: walang mga bersyon ng pagsubok, hindi ko nais na mag-download sa kung saan. Ngunit, kung ang presyo nito ay nabigyang-katwiran, at nagkakahalaga ng halos 5,000 rubles sa bersyon para sa indibidwal na paggamit at hindi Ultimate, kung gayon dapat itong maging isang kahanga-hanga. Pahina ng Programa: //www.nuance.com/for-individuals/by-product/omnipage/index.htm
Presyo ng OmniPage Software
Kung pamilyar ka sa iyong mga katangian at mga pagsusuri, kabilang ang mga edisyon na wikang Russian, nabanggit sa kanila na ang OmniPage ay talagang nagbibigay ng mataas na kalidad at tumpak na pagkilala, kabilang ang sa Russian, inihahambing nito ang medyo mababang kalidad na mga pag-scan na medyo madali at nagbibigay ng isang hanay ng mga karagdagang tool. Sa mga pagkukulang, ang interface ay hindi ang pinaka-maginhawa, lalo na para sa isang baguhan na gumagamit. Sa isang paraan o sa iba pa, sa kanlurang merkado ang OmniPage ay isang direktang kakumpitensya sa FineReader at sa mga rating ng Ingles na nakikipaglaban sila nang tumpak sa kanilang sarili, at samakatuwid, sa palagay ko, ang programa ay dapat maging karapat-dapat.
Hindi ito lahat ng mga programa ng ganitong uri, mayroon ding iba't ibang mga bersyon ng maliliit na libreng programa, ngunit habang ang pag-eksperimento sa kanila ay natagpuan ko ang dalawang pangunahing kakulangan na likas sa kanila: kakulangan ng suporta ng Cyrillic, o iba't ibang, hindi masyadong kapaki-pakinabang na software sa pag-install kit, at samakatuwid ay nagpasya na huwag banggitin ang mga ito dito.