Tekst inscannen met OCR

tekst inscannen met OCR
OCR is een techniek om tekst uit ingescande documenten te halen. Teksten zijn dan weer te bewerken, en worden doorzoekbaar met zoekmachines. Deze OCR-websites, software en apps zijn handig in gebruik.
Wat is OCR?
OCR staat voor Optical Character Recognition, of in het Nederlands: optische tekenherkenning. Deze techniek maakt het mogelijk om tekst uit een afbeelding te halen. Hierbij wordt gebruik gemaakt van patroonherkenning: de letters worden door de software herkend en één voor één opgeslagen. Het resultaat van OCR is een document dat bewerkt kan worden, en doorzoekbaar is voor zoekmachines.

Meegeleverde scanner software
Vaak wordt bij aanschaf van een scanner ook een OCR-programma meegeleverd. Kijk hiervoor op de CD's die je bij de scanner hebt gekregen.

Online OCR tekstherkenning

Google Documenten
De online tekstverwerker van Google kan tekst herkennen in PDF's en foto's.
Klik hiervoor op Uploaden en vink aan: Tekst converteren uit PDF- of afbeeldingsbestanden naar Google Documenten. Als de tekstherkenning succesvol is wordt de tekst opgeslagen als een nieuw document. Het werkt prima met gewone letters - latijns schrift - maar niet goed met ingewikkeld opgemaakte documenten.
Platform: Online
Taal: Nederlands.
Registreren: Google account nodig.
Gratis: Ja.

OnlineOCR
Ingescande bestanden worden op deze website geanalyseerd en omgezet in tekst. Je kunt afbeeldingen uploaden, maar ook PDF's die meerdere pagina's bevatten. Na enkele minuten is een tekstbestand klaar om te downloaden: Microsoft Wordt (docx), Excel (xlsx) of tekstbestand (txt). OnlineOCR herkent tekst in verschillende talen.
Platform: Online.
Taal: Engels.
Registreren: Nee.
Gratis: Ja, tot 15 pagina's per uur.

OCR software en apps

Microsoft OneNote
OneNote is het notitie-programma van Microsoft, dat samenwerkt met Office-software. Als je OneNote hebt geïnstalleerd in Office 365, dan kun je hiermee ook tekst herkennen. Dit is handig om een enkele keer een tekst over te nemen, maar het is geen volwaardig OCR-programma. Het werkt als volgt: scan het document in als een afbeelding met OneNote. Klik met de rechtermuisknop op de afbeelding en kies "Kopieer tekst uit foto". De tekst wordt nu op het klembord gezet, en je kunt het - bijvoorbeeld - inplakken in Word.

ABBYY Finereader
Krachtig, professioneel OCR-programma dat uitstekende resultaten biedt met lastige documenten, in vele talen. De opmaak van het document blijft daarbij behouden, en ABBYY kan ook omgaan met tabellen en grafieken. Er zijn apps voor Android en iOS om documenten in te scannen.
Platform: Windows (alle versies).
Taal: Engels. Er is Nederlandse taalherkenning en spellingcontrole.
Gratis: Nee. Er is wel een gratis probeerversie.

Scanbot Pro (Android) | Scanbot Pro (iOS)
Elke smartphone is uitgerust met een camera, en in plaats van een scanner kun je ook een scan-app gebruiken. Scanbot is een uitstekende app, die er voor zorgt dat je documenten uit de losse hand toch recht inscant. De resolutie van de scans is 200 dpi. De Pro versie heeft ook OCR aan boord. Dit werkt goed voor gewone documenten zonder complexe opmaak. Een scan-app is vooral handig in gebruik als je maar een paar documenten wilt inscannen. Let op: wel fotograferen bij goed licht.
Platform: Android en iOS.
Taal: Nederlands.
Gratis: Nee, € 7,99 of in-app aankoop.

Text Fairy
Text Fairy is een handige OCR app voor Android toestellen die prima resultaten biedt met verschillende documenten. Let op: wel fotograferen bij goed licht.
Platform: Android.
Taal: Engels. Wel Nederlandse taalherkenning.
Gratis: Ja. Open Source software.

OCR tips

Bij het omzetten van documenten met OCR kunnen fouten in de tekst ontstaan, vooral bij documenten met een complexe opmaak. Moderne documenten met alleen tekst zijn goed herkenbaar, maar het wordt moeilijker als je te maken hebt met oude documenten, tabellen, grafieken, symbolen en bijzondere lettertypen. Voor een optimaal resultaat is het belangrijk om een document zo goed mogelijk in te scannen:
  1. Leg het boek of document plat en kaarsrecht op de scanner.
  2. Scan op hoge resolutie, bij voorkeur 300 dpi.
  3. Zorg voor een goed contrast.
  4. Bij het fotograferen met een scan-app: zorg voor veel, gelijkmatig licht.
  5. Om fouten uit een tekst te halen kun je gebruik maken van spellingcontrole (sommige OCR-software doet dit automatisch).