Definisjon
Tekstgjenkjenning refererer til identifisering av teksttegn i bilder eller skannede dokumenter. Det inkluderer gjenkjenning av trykte og håndskrevne tegn.
Formål
Hensikten er å gjøre tekst i visuelle formater tilgjengelig og søkbar.
Viktigheten
- Muliggjør digitalisering av arkiver.
- Kritisk for tilgjengelighet og automatisering.
- Nøyaktigheten avhenger av bildekvaliteten.
- Relatert til OCR-teknologier.
Slik fungerer det
- Ta opp skannede eller fotograferte dokumenter.
- Forhåndsbehandle bilder for å forbedre klarheten.
- Oppdag tekstområder.
- Bruk gjenkjenningsmodeller.
- Skriv ut maskinlesbar tekst.
Eksempler (den virkelige verden)
- Google Lens: gjenkjenner tekst i bilder.
- ABBYY FineReader: digitaliserer skannede dokumenter.
- Tesseract OCR: tekstgjenkjenningsmotor med åpen kildekode.
Referanser / Videre lesning
- Smith, R. «En oversikt over Tesseract OCR-motoren.» ICDAR.
- ISO/IEC 15938-4-standarden.
- IEEE-transaksjoner om mønsteranalyse og maskinintelligens.


