Pagkilala sa teksto. Libreng programa - analogue ng FineReader

Pin
Send
Share
Send

Di-nagtatagal, ang lahat na madalas na nagtatrabaho sa mga programa sa opisina ay nahaharap sa isang karaniwang gawain - upang mai-scan ang teksto mula sa isang libro, magazine, pahayagan, mga leaflet lamang, at pagkatapos isalin ang mga larawang ito sa format ng teksto, halimbawa, sa isang dokumento ng Salita.

Upang gawin ito, kailangan mo ng isang scanner at isang espesyal na programa para sa pagkilala sa teksto. Tatalakayin ng artikulong ito ang libreng counterpart ng FineReader -Cuneiform (tungkol sa pagkilala sa FineReader - tingnan ang artikulong ito).

Magsimula tayo ...

Mga nilalaman

  • 1. Mga Tampok ng CuneiForm programa, mga tampok
  • 2. Halimbawa ng pagkilala sa teksto
  • 3. Pagkilala sa teksto ng Batch
  • 4. Konklusyon

1. Mga Tampok ng CuneiForm programa, mga tampok

Cuneiform

Maaari mong i-download ito mula sa site ng nag-develop: //cognitiveforms.com/

Isang bukas na programa ng pagkilala sa mapagkukunan ng teksto. Bilang karagdagan, gumagana ito sa lahat ng mga bersyon ng Windows: XP, Vista, 7, 8, na nais. Dagdag pa, idagdag ang buong pagsasalin ng Ruso ng programa!

Mga kalamangan:

- Ang pagkilala sa teksto sa 20 pinakasikat na mga wika sa buong mundo (Ingles at Ruso sa pamamagitan nito mismo ay kasama sa bilang na ito);

- Malaking suporta para sa iba't ibang mga font ng pag-print;

- suriin ang diksyunaryo ng kinikilalang teksto;

- ang kakayahang makatipid ng mga resulta ng trabaho sa maraming paraan;

- pagpapanatili ng istraktura ng dokumento;

- Mahusay na suporta at pagkilala sa mesa.

Cons:

- ay hindi sumusuporta sa napakalaking dokumento at mga file (higit sa 400 dpi);

- Hindi direktang sumusuporta sa ilang mga uri ng mga scanner (mabuti, hindi ito isang malaking deal, ang isang espesyal na programa ng scanner ay kasama sa mga driver ng scanner);

- ang disenyo ay hindi lumiwanag (ngunit kung sino ang nangangailangan nito kung ang programa ay ganap na malulutas ang problema).

2. Halimbawa ng pagkilala sa teksto

Ipinapalagay namin na natanggap mo na ang mga kinakailangang larawan para sa pagkilala (na-scan doon, o nag-download ng isang libro sa pdf / djvu na format sa Internet at tinanggal ang mga kinakailangang larawan mula sa kanila. Paano ito gawin, tingnan ang artikulong ito).

1) Buksan ang ninanais na larawan sa programa ng CuineForm (file / bukas o "Cntrl + O").

2) Upang simulan ang pagkilala - kailangan mo munang pumili ng iba't ibang mga lugar: teksto, larawan, talahanayan, atbp Sa Cuneiform program, maaari itong gawin hindi lamang manu-mano, ngunit din awtomatiko! Upang gawin ito, mag-click sa pindutan ng "layout" sa tuktok na panel ng window.

3) Pagkatapos ng 10-15 segundo. Awtomatikong i-highlight ng programa ang lahat ng mga lugar na may iba't ibang kulay. Halimbawa, ang isang lugar ng teksto ay naka-highlight sa asul. Sa pamamagitan ng paraan, ipinakita niya nang tama at medyo mabilis ang lahat ng mga lugar. Sa totoo lang, hindi ko inaasahan ang gayong mabilis at tamang reaksyon mula sa kanya ...

4) Para sa mga hindi nagtitiwala sa awtomatikong layout, maaari mong gamitin ang manu-manong. Upang gawin ito, mayroong isang toolbar (tingnan ang larawan sa ibaba), salamat sa kung saan maaari mong piliin ang: teksto, talahanayan, larawan. Ilipat, palakihin / bawasan ang paunang imahe, i-crop ang mga gilid. Sa pangkalahatan, isang mahusay na hanay.

5) Matapos ang lahat ng mga lugar ay minarkahan, maaari kaming magpatuloy pagkilala. Upang gawin ito, mag-click lamang sa pindutan na may parehong pangalan, tulad ng sa larawan sa ibaba.

6) Literally sa 10-20 segundo. Makakakita ka ng isang dokumento sa Microsoft Word na may kinikilalang teksto. Kapansin-pansin, sa teksto para sa halimbawang ito, siyempre, may mga pagkakamali, ngunit kakaunti ang mga ito! Bukod dito, isinasaalang-alang kung ano ang kalidad na hindi nakahanda na mapagkukunan ng materyal - isang larawan.

Ang bilis at kalidad ay medyo maihahambing sa FineReader!

3. Pagkilala sa teksto ng Batch

Ang function ng program na ito ay maaaring madaling magamit kung kailangan mong kilalanin hindi isang larawan, ngunit maraming nang sabay-sabay. Ang shortcut para sa pagsisimula ng pagkilala sa batch ay karaniwang nakatago sa menu ng pagsisimula.

1) Matapos buksan ang programa, kailangan mong lumikha ng isang bagong pakete, o magbukas ng isang nai-save na isa. Sa aming halimbawa, lumikha ng bago.

2) Sa susunod na hakbang binibigyan namin ito ng isang pangalan, mas mabuti na ang isa ay naaalala kung ano ang naka-imbak sa loob nito anim na buwan mamaya.

3) Susunod, piliin ang wika ng dokumento (Ruso-Ingles), ipahiwatig kung mayroong mga larawan at mga talahanayan sa iyong na-scan na materyal.

4) Ngayon ay kailangan mong tukuyin ang folder kung saan matatagpuan ang mga file para sa pagkilala. Sa pamamagitan ng paraan, kung ano ang kawili-wili, ang programa mismo ay makahanap ng lahat ng mga larawan at iba pang mga graphic file na maaari itong makilala at idagdag ang mga ito sa proyekto. Kailangan mo lamang alisin ang labis.

5) Ang susunod na hakbang ay hindi mahalaga - pumili kung ano ang gagawin sa mga mapagkukunang file, pagkatapos ng pagkilala. Inirerekumenda ko na pipiliin mo ang checkbox na "walang ginagawa".

6) Nananatili lamang itong piliin ang format kung saan mai-save ang kinikilalang dokumento. Mayroong maraming mga pagpipilian:

- rtf - isang file mula sa isang dokumento ng salita, binuksan ng lahat ng mga tanyag na tanggapan (kabilang ang mga libre, isang link sa mga programa);

- txt - format ng teksto, mai-save mo lamang ang teksto dito, ang mga larawan at mga talahanayan ay hindi maaaring;

- htm - isang pahina ng hypertext, maginhawa kung nag-scan ka at nakikilala ang mga file para sa site. Pipili tayo nito sa aming halimbawa.

7) Matapos ang pag-click sa pindutan na "Tapos na", magsisimula ang proseso ng pagproseso ng iyong proyekto.

8) Ang programa ay gumagana medyo mabilis. Matapos ang pagkilala, isang tab na may mga file na htm ay lilitaw sa harap mo. Kung nag-click ka sa naturang file, magsisimula ang isang browser, kung saan makikita mo ang mga resulta. Sa pamamagitan ng paraan, ang pakete ay maaaring mai-save para sa karagdagang trabaho kasama nito.

9) Tulad ng nakikita mo, ang mga resulta ang gawain ay napaka-kahanga-hanga. Ang programa ay madaling nakilala ang larawan, at sa ibaba nito ang teksto ay madaling nakilala. Sa kabila ng katotohanan na ang programa ay libre, sa pangkalahatan ito ay sobrang!

4. Konklusyon

Kung madalas na hindi mo mai-scan at kinikilala ang mga dokumento, kung gayon ang pagbili ng programang FineReader ay marahil ay hindi magkaroon ng kahulugan. Karamihan sa mga gawain ay madaling hawakan ng CuneiForm.

Sa kabilang banda, mayroon din siyang mga kawalan.

Una, napakakaunting mga tool para sa pag-edit at pagsuri sa resulta. Pangalawa, kung kailangan mong kilalanin ang maraming mga larawan, mas maginhawa sa FineReader upang makita agad ang lahat na idinagdag sa proyekto sa haligi sa kanan: mabilis na alisin ang mga hindi kinakailangan, gumawa ng mga pagwawasto, atbp At pangatlo, ang CuneiForm ay nawala bilang pagkilala sa mga dokumento: Kailangan kong isipin ang dokumento - mag-edit ng mga error, maglagay ng mga marka ng bantas, mga marka ng sipi, atbp.

Iyon lang. May kilala ka bang ibang karapat-dapat na libreng programa sa pagkilala sa teksto?

Pin
Send
Share
Send