Shaip er nå en del av Ubiquity-økosystemet: Samme team – nå støttet av utvidede ressurser for å støtte kunder i stor skala. |

Tekstgjenkjenning

Tekstgjenkjenning

Definisjon

Tekstgjenkjenning refererer til identifisering av teksttegn i bilder eller skannede dokumenter. Det inkluderer gjenkjenning av trykte og håndskrevne tegn.

Formål

Hensikten er å gjøre tekst i visuelle formater tilgjengelig og søkbar.

Viktigheten

  • Muliggjør digitalisering av arkiver.
  • Kritisk for tilgjengelighet og automatisering.
  • Nøyaktigheten avhenger av bildekvaliteten.
  • Relatert til OCR-teknologier.

Slik fungerer det

  1. Ta opp skannede eller fotograferte dokumenter.
  2. Forhåndsbehandle bilder for å forbedre klarheten.
  3. Oppdag tekstområder.
  4. Bruk gjenkjenningsmodeller.
  5. Skriv ut maskinlesbar tekst.

Eksempler (den virkelige verden)

  • Google Lens: gjenkjenner tekst i bilder.
  • ABBYY FineReader: digitaliserer skannede dokumenter.
  • Tesseract OCR: tekstgjenkjenningsmotor med åpen kildekode.

Referanser / Videre lesning

  • Smith, R. «En oversikt over Tesseract OCR-motoren.» ICDAR.
  • ISO/IEC 15938-4-standarden.
  • IEEE-transaksjoner om mønsteranalyse og maskinintelligens.

Fortell oss hvordan vi kan hjelpe med ditt neste AI -initiativ.