Definisjon
Optisk tegngjenkjenning (OCR) er prosessen med å konvertere trykt eller håndskrevet tekst i bilder til maskinlesbar digital tekst.
Formål
Formålet er å digitalisere dokumenter for søk, redigering og analyse. OCR støtter applikasjoner innen digitalisering, tilgjengelighet og automatisering av dataregistrering.
Viktigheten
- Muliggjør konvertering av papir til søkbar tekst.
- Forbedrer effektiviteten i bransjer som bank og helsevesen.
- Sliter med skanninger av dårlig kvalitet eller uvanlige fonter.
- Danner grunnlaget for tekstutvinning i skannede arkiver.
Slik fungerer det
- Skann eller ta bilde av tekst.
- Forhåndsbehandle bildet for å fjerne støy.
- Oppdag og segmenter tegn eller ord.
- Gjenkjenn tekst ved hjelp av ML-modeller.
- Skriv ut redigerbar digital tekst.
Eksempler (den virkelige verden)
- Google Cloud Vision OCR: tekstgjenkjenningstjeneste.
- ABBYY FineReader: kommersiell OCR-programvare.
- Digitalisering av Project Gutenberg: OCR for bøker.
Referanser / Videre lesning
- Smith, R. «En oversikt over Tesseract OCR-motoren.» ICDAR.
- ISO/IEC 15938-4: Grensesnitt for beskrivelse av multimedieinnhold.
- IEEE-transaksjoner om mønsteranalyse og maskinintelligens.
- Hva er OCR?


