OCR

OCR – Definisjon, fordeler, utfordringer og brukstilfeller [Infographic]

Hva er ocr?

Hva er OCR?

OCR er en teknologi som lar maskiner lese trykt tekst og bilder. Det brukes ofte i forretningsapplikasjoner, for eksempel digitalisering av dokumenter for lagring eller behandling, og i forbrukerapplikasjoner, for eksempel skanning av en kvittering for utgiftsrefusjon.

OCR står for Optical Character Recognition. Begrepet "karakter" refererer til både bokstaver og tall. OCR-programvare kan gjenkjenne om et gitt bilde inneholder tegn eller ikke, og deretter identifisere tegnene i det.

Ocr markedsstørrelse

OCR-omfang

Det globale markedet for optisk tegngjenkjenning forventes å vokse raskt i de kommende årene. Markedsstørrelsen på OCR ble verdsatt til 8.93 milliarder dollar i 2021. Det forventes å vokse med en CAGR på 15.4 % mellom 2022 og 2030. Denne veksten er drevet av den økende etterspørselen etter OCR i ulike sluttbruksindustrier, som helsevesen, bilindustri og andre.

Prosess av ocr

Prosessen med OCR

Optisk tegngjenkjenning er en detaljert prosess som hjelper til med å trekke ut tekst fra bilder ved hjelp av NLP.

  • Det første trinnet i OCR er å behandle inndatabildet. Dette innebærer å rydde opp i bildet og gjøre det egnet for videre behandling.
  • Deretter søker OCR-motoren etter regioner som inneholder tekst i bildet. Motoren segmenterer disse områdene i individuelle tegn eller ord, slik at de senere kan identifiseres under tekstgjenkjenning.
  • Ved å bruke resultatene fra tekstgjenkjenning identifiserer OCR-motoren hvert tegn etter form og størrelse. Du vil ofte se konvolusjonelle og tilbakevendende nevrale nettverk, noen ganger i kombinasjon, brukes til denne oppgaven. 
  •  Når OCR-programvaren er ferdig med å gjenkjenne tekst i en bildefil, må den bekreftes som nøyaktig før den kan brukes.
Ocr fordeler

Fordeler med automatiserte OCR-arbeidsflyter

De viktigste fordelene med automatiserte arbeidsflyter for optisk tegngjenkjenning inkluderer:

  • Raskere, mer nøyaktige, automatiserte resultater samtidig som menneskelige feil elimineres.
  • Lavere inngangskostnader for små bedrifter på grunn av raskere databehandling og effektiv datautnyttelse.
  • Mer konsistente resultater på tvers av flere brukere og prosjekter.
  • Forbedret datalagring og datasikkerhet.
  • Stort muligheter for skalerbarhet.
Utfordringer

OCR-utfordringer

Hovedproblemet med OCR er at det ikke er perfekt. Hvis du forestiller deg å lese teksten på denne siden gjennom et kamera og deretter konvertere disse bildene til ord, vil du få en ide om hvorfor OCR kan være problematisk. Noen av utfordringene for OCR inkluderer:

  • Uskarp tekst forvrengt av skygger.
  • Fargen på bakgrunnen og teksten har lignende farger.
  • Deler av bildet kuttes av eller beskjæres helt (for eksempel den nederste delen av "dette").
  • Svake merker på toppen av noen bokstaver (som "i") kan forvirre OCR-programvare til å tro at de er en del av bokstaven i stedet for merker på toppen.
  • Ulike skrifttyper og størrelser kan være vanskelig å identifisere.
  • Lysforholdene når du tar bildet eller skanner dokumentet.
Bruksmåter

OCR Brukssaker

  • Automatisering av dataregistrering: OCR kan brukes til å automatisere prosessen med å legge inn data i en database.
  • Strekkodeskanning: OCR lar en datamaskin skanne strekkoder på produkter og hente informasjon om dem fra databaser.
  • Nummerskiltgjenkjenning: OCR analyserer skilt og trekker ut informasjon som registreringsnummer og navn fra dem.
  • Passbekreftelse: OCR kan brukes til å verifisere ektheten av pass, visum og andre reisedokumenter.
  • Gjenkjenne butikketiketter: Butikker kan bruke OCR til å automatisk lese produktetikettene og sammenligne dem med produktkatalogene deres for å finne ut hvilke produkter som for øyeblikket er i butikkhyllene, utsolgte varer eller lagerfeil.
  • Behandling av forsikringsskader: OCR-programvare kan skanne papirarbeid og verifisere signaturer, datoer, adresser og annen informasjon på skjemaer som sendes inn av kunder som har sendt inn krav for skade forårsaket av naturkatastrofer, branner eller tyveri.
  • Lese trafikklys: Et OCR-system kan brukes til å lese fargene på trafikklys og bestemme om de er røde eller grønne.
  • Avlesing av verktøymålere: Energiselskaper bruker OCR for å lese av elektriske, gass- og vannmålere for å fakturere kundene for riktige beløp.
  • Overvåking av sosiale medier – Bedrifter bruker OCR for å identifisere og klassifisere omtaler av et selskap eller merke i innlegg på sosiale medier, tweets og til og med Facebook-oppdateringer
  • Verifisering av juridiske dokumenter: Et advokatkontor kan skanne dokumenter som kontrakter, leiekontrakter og avtaler for å sikre at de er leselige og nøyaktige før de sendes ut til klienter.
  • Flerspråklige dokumenter: Et selskap som selger produkter i andre land kan trenge å oversette markedsføringsmateriellet sitt til flere språk og deretter OCR for å brukes som maler for fremtidige prosjekter.
  • Medisinske etiketter: OCR brukes mye for å trekke ut meningsfull informasjon fra legemiddeletiketter slik at datasystemer kan analysere og behandle dem.
Industri

Industri

  • Detaljhandel: Detaljhandelen bruker OCR for å skanne strekkoder, kredittkortinformasjon, kvitteringer osv.
  • BSFI: Banker bruker OCR til å lese sjekker, innskuddsslipper og kontoutskrifter for å bekrefte signaturer og legge til transaksjoner på kontoer. De kan også analysere store mengder data for å ta beslutninger om kundekontoer, investeringer, lån og mer med OCR.
  • Regjering: OCR kan brukes til å skanne og digitalisere juridiske dokumenter, som fødselsattester, førerkort og andre offisielle poster.
  • Utdanning: Lærere kan bruke OCR til å lage digitale kopier av bøker og andre elevdokumenter. Lærere kan også skanne dokumenter inn på datamaskinene sine og bruke OCR-teknologi for å lage en elektronisk kopi som elevene kan få tilgang til når som helst.
  • Helsevesen: Leger må ofte legge inn pasientinformasjon i et datasystem raskt. Helsesektoren kan bruke OCR for forretningsprosesser som fakturering og behandling av krav.
  • produksjon – Produksjonsanlegg må ofte skanne dokumenter som fakturaer eller innkjøpsordrer. OCR kan brukes til å "lese" serienumrene på produktkomponenter når de passerer på et transportbånd eller gjennom et samlebånd.
  • Teknologi: OCR-programvare brukes i mange innstillinger relatert til IT, inkludert datautvinning, bildeanalyse, talegjenkjenning og mer. I programvareutvikling brukes OCR til å konvertere skannede dokumenter tilbake til digitale filer.
  • Transport og logistikk: OCR kan brukes til å lese fraktetiketter eller overvåke lagerbeholdning. Den kan også oppdage svindel når leverandører sender inn fakturaer for betaling.

Kjennelse

OCR-prosessen er relativt enkel, og krever bare noen få trinn for å transformere et bilde til tekst. Det er noen feil og inkonsekvenser, men teknologien er unektelig imponerende, gitt hvordan det hele fungerer.

Sosial Share