Definisjon
Bildegjenkjenning er prosessen med å identifisere objekter, personer eller funksjoner i et bilde. I motsetning til klassifisering involverer det ofte lokalisering og deteksjon.
Formål
Hensikten er å la maskiner «se» og tolke visuell informasjon for beslutningstaking. Det brukes i sikkerhet, produksjon og forbrukerenheter.
Viktigheten
- Kjerneteknologi for overvåking og biometri.
- Brukes i selvkjørende biler og avbildning innen helsevesenet.
- Nøyaktigheten avhenger av store, merkede datasett.
- Reiser bekymringer om personvern og skjevhet.
Slik fungerer det
- Inndatabildet blir tatt og forhåndsbehandlet.
- Modellen trekker ut visuelle funksjoner.
- Objekter blir oppdaget og klassifisert.
- Resultatene sammenlignes med referansekategorier.
- Utdata brukes til applikasjoner som autentisering eller navigasjon.
Eksempler (den virkelige verden)
- Facebook: bildegjenkjenning for fototagging.
- Tesla Autopilot: gjenkjenner kjørefelt, kjøretøy og fotgjengere.
- Google Lens: identifiserer objekter gjennom smarttelefonkameraer.
Referanser / Videre lesning
- Datasyn: Algoritmer og applikasjoner — Szeliski. Springer.
- PASCAL VOC-utfordringen — Universitetet i Oxford.
- IEEE-transaksjoner om mønsteranalyse og maskinintelligens.
- Hvordan fungerer AI-bildegjenkjenning?


