Definisjon
Bildeklassifisering er oppgaven med å tilordne etiketter til et bilde som helhet, for eksempel «katt», «bil» eller «svulst». Det er et av kjerneproblemene innen datasyn.
Formål
Hensikten er å automatisere gjenkjenning av objekter eller kategorier i bilder for søk, analyse eller beslutningstaking.
Viktigheten
- Grunnleggende oppgave innen datasyn.
- Brukes i helsevesen, detaljhandel og sikkerhetsovervåking.
- Begrenset i å fange flere objekter i ett bilde.
- Relatert til objektdeteksjon og segmentering.
Slik fungerer det
- Samle og merk et datasett med bilder.
- Trekk ut funksjoner (tradisjonelt) eller bruk CNN-er for representasjon.
- Tren klassifikatorer på merkede eksempler.
- Evaluer på grunnlag av usynlige testdata.
- Distribuer for å klassifisere nye bilder i virkelige omgivelser.
Eksempler (den virkelige verden)
- ImageNet Challenge: referansepunkt for forskning på bildeklassifisering.
- Google Foto: klassifiserer bilder for søk og organisering.
- Medisinsk AI: klassifiserer røntgenbilder i kategorier som «normal» eller «sykdom».
Referanser / Videre lesning
- Krizhevsky et al. «ImageNet-klassifisering med dype konvolusjonelle nevrale nettverk.» NeurIPS 2012.
- Stanford CS231n-kurs om CNN-er.
- IEEE-transaksjoner om mønsteranalyse og maskinintelligens.


