A karakterfelismerő szoftverek eszméletlenül drágák. A leghíresebb Abbyy Fine Reader például 40'000 ft. Ha van Office 2007 vagy 2010 installálva a gépeden, akkor van ingyen  karakterfelismerő szoftvered is! Csak eddig nem tudtál róla... :D

Az Office 2007 és 2010 programcsomag része az Office OneNote jegyzetkészítő és -kezelő program, amivel egy helyen gyűjthetjük össze a fontos gondolatainkat, kereshetünk rá, és megoszthatjuk az eredményt másokkal is. Én speciel (és szerintem sokan mások) nem nagyon használták ezt a programot. Gondoltam egyet és kipróbáltam. Nem állapot, hogy folgalja a helyet, itt porosodik a meghajtón és még egyszer sem futtattam. Mindig csak a Vör'd meg az Ek'szel... Egy érdekes OCR funkciót fedeztem föl benne:

Bármilyen képről, amin van szöveges rész és megnyitjuk a programban "lelophatjuk" a szöveget. Legyen szó egy képernyőfotóról, amit a PrintScreen gomb megnyomásával készítettünk, vagy egy a szkennerünkből beolvasott képről vagy egy pdf dokumentumról, amiből nem tudjuk kimásolni a szöveget.

1. Nyissunk egy új jegyzetet ( Fájl>Létrehozás>Lap. ) Hívjunk be egy képet a programba. Ezt többféleképpen tehetjük:

  • Beszúrás>Kép>Fájlból....
  • Beszúrás>Kép>Képolvasóból vagy fényképezőből, ha szkennelni akarunk.
  • Printscreen gombbal készítünk egy képernyőfotót, majd a programban Ctrl+V gombbal beillesztjük.
  • Beszúrás>Képernyőrész kivágása - nagyon pöpec kis funkció, csak kijelölünk valamit a képernyőnkön, és az már ott is van a programban képként. Itt egyből a szöveget is kijelölhetjük a képernyőről, lényegében az előző PrintScreen-es megoldás továbbfejlesztett változata (ahol ugye a teljes képernyőről készíthetünk csak képet mindenestül).
  • Ha egy pdf doksit akarunk felismertetni, akkor a pdfolvasó programunkban menjünk a nyomtatás menüpontra, és ott válasszuk a nyomtatók közül a "Küldés a OneNote programba" pontot!

 2. Ezután Jobbklikk a képre>Képbeli szöveg kereshetővé tétele>Válasszuk ki a szöveg nyelvét!

 

3. Végül másoljuk ki a "Jobbklikk>Szöveg másolása"  menüponttal a szöveget, majd illesszük be a nekünk kellő helyre, szövegszerkesztőbe stb...

Tapasztalatok: Minél vastagabb  a képen lévő karakter, annál nagyobb bizonyossággal ismeri fel a program azokat. Például egy beszkennelt képnél egész szép eredményeket érhetünk el, viszont a fenti szövegben van 1 db hiba. Nem sok! Íme a kép és a felismert szöveg:

 - 

 És a felismert szöveg:A Microsoft Office programok csomagja a Microsofttól, mely mára a sarokköve a Microsoft Office Rendszernek, melybe a Microsoft Office csomagokon kívül közé bizonyos kiszolgálók és webalapú szolgáatások is beletartoznak Az Office csomagok Microsoft Windows, illetve Apple Macintosh operációs rendszereken való futtatásra lettek tervezve. Mivel az Office Rendszer nem egy egyszerű termék vagy termékcsomag, nem vásárolható olyan, hogy Microsoft Office Rendszer

A bejegyzés trackback címe:

http://numlockholmes.blog.hu/api/trackback/id/tr131909758

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben.

Kontárblog · http://kontar.blog.hu/ 2010.04.10. 16:00:01

ez nagyon hasznos, főleg egyetemistáknak, illetve olyanoknak, akik lusták gépelni:D

köszi!

numlockholmes · http://napigeek.blog.hu/ 2010.04.10. 16:13:57

Ha pedig nem otthon vagy, akkor rapidocr.com/ :D - bár ez nem tud magyarul...

Celtic 2010.10.10. 15:58:24

baszki... Meg a vegen felrakom a 2007-es Officet. Miota keresek mar egy aranylag jol mukodo OCR programot.

házibölcs 2010.11.07. 12:52:00

PDF-ekből az ultrakönnyű és free Foxit Reader is szépen felismer. Még csúnya szkennelésnél is.

ilyennevmegnincsremelem 2011.07.18. 20:38:45

nálam nem engedi a magyar nyelv választását. Beszéltem az MS információs vonalával, ott azt mondták, hogy nem is tudja a 2007. (megj. enteprise).... mit kell hozzá beállítani? van ötleted?

Rbu 2012.02.21. 16:46:37

Sziasztok!
Köszönöm a tippet, nagyon jól működik a program, de sajnos nekem az ékezeteket nem ismeri fel. Van erre valami megoldás?
Az a baj, hogy egyenként átírni nagyon hosszú idő, mert 100 oldal körüli szöveget kell így átalakítanom. (Igen, tudom, begépelni még hosszabb lenne...)
Kérlek segítsetek!
Köszönöm, R

Revolutionist 2013.12.18. 20:50:27

Aha...szép és jó leírás, csak éppen magyar nyelvre nem lehet állítani, holott vicces hogy magyar nyelvű a szoftver...

numlockholmes · http://napigeek.blog.hu/ 2013.12.18. 20:54:43

@Revolutionist: Akkor csak nálad, ami azért lehet, mert nem a teljes programcsomagot telepítetted mindennel együtt, hanem csak minimális telepítést végeztél.

Revolutionist 2013.12.19. 23:26:28

@numlockholmes: Kösz a választ! Hát elvileg az Onenote ugyebár magával rántja a telepítőből a neki kellő egyébb komponenseket, ha hiányoznak... és valami nyelvi pakk amúgy fel is ment amikor telepítettem (mert valóban minimális telepítés volt és utólag telepítettem ezt, mivel eredetileg nem láttam szükségét hogy az office pack-ból ezt a számomra ismeretlen és haszontalan alkalmazást feltegyem - így hogy tud ocr-t már más a véleményem róla persze.. :) )
Közben utánaolvasgattam szakfórumokban és ismert a jelenség. Ez egy bug. Rá kellett telepíteni legalább a 2-es, de mégjobb ha a 3-as szervízcsomagot, melyek korrigálják; és valóban: onnantól már működött is a dolog szépen... (már meg is csináltam vele sikerrel gyorsan tegnap a szöveget, amit akartam) Köszi...