Shaip er nå en del av Ubiquity-økosystemet: Samme team – nå støttet av utvidede ressurser for å støtte kunder i stor skala. |

Optisk tegngjenkjenning (OCR)

Optisk tegngjenkjenning (OCR)

Definisjon

Optisk tegngjenkjenning (OCR) er prosessen med å konvertere trykt eller håndskrevet tekst i bilder til maskinlesbar digital tekst.

Formål

Formålet er å digitalisere dokumenter for søk, redigering og analyse. OCR støtter applikasjoner innen digitalisering, tilgjengelighet og automatisering av dataregistrering.

Viktigheten

  • Muliggjør konvertering av papir til søkbar tekst.
  • Forbedrer effektiviteten i bransjer som bank og helsevesen.
  • Sliter med skanninger av dårlig kvalitet eller uvanlige fonter.
  • Danner grunnlaget for tekstutvinning i skannede arkiver.

Slik fungerer det

  1. Skann eller ta bilde av tekst.
  2. Forhåndsbehandle bildet for å fjerne støy.
  3. Oppdag og segmenter tegn eller ord.
  4. Gjenkjenn tekst ved hjelp av ML-modeller.
  5. Skriv ut redigerbar digital tekst.

Eksempler (den virkelige verden)

  • Google Cloud Vision OCR: tekstgjenkjenningstjeneste.
  • ABBYY FineReader: kommersiell OCR-programvare.
  • Digitalisering av Project Gutenberg: OCR for bøker.

Referanser / Videre lesning

  • Smith, R. «En oversikt over Tesseract OCR-motoren.» ICDAR.
  • ISO/IEC 15938-4: Grensesnitt for beskrivelse av multimedieinnhold.
  • IEEE-transaksjoner om mønsteranalyse og maskinintelligens.
  • Hva er OCR?

Fortell oss hvordan vi kan hjelpe med ditt neste AI -initiativ.