Bildemerking og merking for datasyn

Den ultimate kjøperveiledningen 2023

Datasyn er et stort tema, og det er ikke mulig for teknologer og ambisiøse gründere å vite helt om dem på kort tid. Spesielt når de utvikler et produkt basert på datasyn og har begrenset tid til markedet, trenger de noe omfattende og betydelig for å kjenne til det grunnleggende om datasyn og bildekommentarer for å ha funksjonell kunnskap og ta informerte beslutninger.

Denne guiden håndplukker konsepter og presenterer dem på enklest mulige måter slik at du har god klarhet i hva det handler om. Det hjelper deg å ha en klar visjon om hvordan du kan gå frem for å utvikle produktet ditt, prosessene som ligger bak det, de tekniske detaljene som er involvert og mer. Så denne veiledningen er ekstremt ressurssterk hvis du er:

Bildekommentar

Introduksjon

Har du brukt Google Lens nylig? Vel, hvis du ikke har det, vil du innse at fremtiden vi alle har ventet på, endelig er her når du begynner å utforske dens vanvittige evner. Utviklingen av Google Lens er en enkel, tilleggsfunksjon som er en del av Android-økosystemet, og viser hvor langt vi har kommet når det gjelder teknologisk fremskritt og utvikling.

Fra den gang vi bare stirret på enhetene våre og bare opplevde enveiskommunikasjon – fra mennesker til maskiner, har vi nå banet vei for ikke-lineær interaksjon, der enheter kan stirre rett tilbake på oss, analysere og behandle det de ser i sanntid.

Bildekommentar

De kaller det datasyn, og det handler om hva en enhet kan forstå og gi mening om elementer fra det den ser gjennom kameraet. For å komme tilbake til det fantastiske med Google Lens, lar den deg finne informasjon om tilfeldige objekter og produkter. Hvis du bare retter enhetskameraet mot en mus eller et tastatur, vil Google Lens fortelle deg merke, modell og produsent av enheten.

Dessuten kan du også peke den til en bygning eller et sted og få detaljer om det i sanntid. Du kan skanne matematikkproblemet ditt og ha løsninger på det, konvertere håndskrevne notater til tekst, spore pakker ved å skanne dem og gjøre mer med kameraet ditt uten noe grensesnitt overhodet.

Datasyn slutter ikke der. Du ville ha sett det på Facebook når du prøver å laste opp et bilde til profilen din, og Facebook oppdager og merker automatisk ansikter til deg og dine venner og familie. Datasyn er å heve folks livsstil, forenkle komplekse oppgaver og gjøre livet til mennesker enklere.

Men hvorfor sier vi alt dette?

Det er enkelt. Det har ikke vært så enkelt å komme til det punktet vi er på akkurat nå. Hvis Google Lens umiddelbart kunne oppdage et bilde og hente ut alt som finnes på internett om det, har det tatt år med utvikling og trening. Suksessen til datasyn koker fullstendig ned til det vi kaller bildekommentarer – den grunnleggende prosessen bak teknologien som får datamaskiner og enheter til å ta intelligente og ideelle beslutninger.

Det kan ikke være noe datasyn og dets allierte fordeler uten bildekommentarer, og det er akkurat dette vi skal diskutere og utforske i denne omfattende veiledningen. Fra det grunnleggende om hva bildekommentarer handler om, til hvordan du kan finne de riktige leverandørene, vil vi utforske alle aspekter. Dette vil hjelpe deg med å utvikle et bedre produkt og til slutt utvide kunnskapen din om maskinlæring og dyplæringsmoduler.

Bildekommentar

Hva er bildekommentar

La oss være ærlige. Datamaskiner er grunnleggende og ganske dumme. De må skje-mates instruksjoner om hvordan de skal utføre oppgaver. Det er først nylig at fremskritt har gjort det mulig for maskiner å utvikle evnen til å tenke autonomt gjennom kunstig intelligens, maskinlæring og dyp læring og komme opp med de beste måtene å løse et problem på.

Når en utrent enhet ser på bildet av et palmetre, vet det ikke hva det er. Kunnskapen dens er nesten lik den til et spedbarn, som ikke har lært hva et tre er. Maskiner må læres hva et tre er og de forskjellige typer trær i verden.

Bildekommentarer er en undergruppe av datamerking som også er kjent under navnet bildemerking, transkribering eller merking som involverer mennesker på baksiden, som utrettelig merker bilder med metadatainformasjon og attributter som vil hjelpe maskiner å identifisere objekter bedre. Med tanke på det samme eksempelet på trær, bruker maskinlæringseksperter en stor del av tiden sin til å kommentere bilder av trær, spesifisere hva et palmetre er og hvordan det ser ut. Dette vil tillate en enhet å oppdage palmer nøyaktig.

Prosessen er imidlertid ikke fullført ennå. Det kan se ut til at maskiner nå har mestret prosessen med å oppdage palmetrær, men først når du viser dem bildet av et piletre vil du innse at maskinen ikke er klar ennå. Så, eksperter må kommentere bilder for å instruere maskiner hva palmer er "ikke" også. Gjennom kontinuerlig opplæring over år lærer maskiner å oppdage og identifisere objekter sømløst avhengig av deres nisje, formål og datasett.

Bildekommentar for Computer Vision 

BildekommentarBildekommentarer er en undergruppe av datamerking som også er kjent under navnet bildemerking, transkribering eller merking av at Bildemerking involverer mennesker i bakenden, og utrettelig merker bilder med metadatainformasjon og attributter som vil hjelpe maskiner å identifisere objekter bedre.

Bildedata

  • 2D-bilder
  • 3D-bilder

Typer merknader

  • Bildeklassifisering
  • Objektdeteksjon
  • Bildesegmentering
  • Objektsporing
  • Bildetranskripsjon

Annoteringsteknikker

  • Avgrensningsboks
  • polylinje
  • polygon
  • Merkemerke

Hva slags bilder kan kommenteres?

  • Bilder og multi-frame bilder, dvs. videoer, kan merkes for maskinlæring. De vanligste typene er:
    • 2-D & multi-frame bilder (video), dvs. data fra kameraer eller speilreflekskameraer eller et optisk mikroskop, etc.
    • 3D- og multi-frame-bilder (video), dvs. data fra kameraer eller elektron-, ion- eller skanningsprobemikroskoper osv.

Hvilke detaljer legges til et bilde under merknader?

All informasjon som lar maskiner få en bedre forståelse av hva et bilde inneholder, kommenteres av eksperter. Dette er en ekstremt arbeidskrevende oppgave som krever utallige timer med manuell innsats.

Når det gjelder detaljene, avhenger det av prosjektspesifikasjoner og krav. Hvis prosjektet krever at sluttproduktet bare klassifiserer et bilde, legges passende informasjon til. For eksempel, hvis datasynsproduktet ditt handler om å fortelle brukerne at det de skanner er et tre og skille det fra en slyngplante eller en busk, vil kommenterte detaljer bare være et tre.

Men hvis prosjektkravene er komplekse og krever mer innsikt som skal deles med brukerne, vil merknader innebære inkludering av detaljer som navnet på treet, dets botaniske navn, jord- og værkrav, ideell veksttemperatur og mer.

Med denne informasjonen analyserer og behandler maskiner input og leverer nøyaktige resultater til sluttbrukere.

Bildekommentar

Typer bildekommentarer 

Et bilde inneholder vanligvis flere elementer. Du kan fokusere på et bestemt motiv eller et objekt, men du vil fortsatt ha andre elementer i bildet ditt. Noen ganger kreves disse objektene for analyse, og andre ganger må de elimineres for å holde forekomster av skjevheter eller dataskjevheter til side. Uavhengig av tilfellet, trenger maskiner å kjenne alle elementene i et bilde for å ta sine egne beslutninger. Bildekommentarer innebærer også å identifisere andre objekter. Selv om dette er forskjellig fra prosjekt til prosjekt, er det greit å ha en ide om forskjellige bildekommentarfunksjoner.

For å få det visuelle av hvordan det gjøres, la oss bruke følgende bilde som referanse. Hvis du legger merke til det, ser bildet enkelt og klart ut, men vær oppmerksom på antall forskjellige elementer i det. Du har biler, bygninger, fotgjengerfelt, trafikklys og mer. Hvis du foredler det ytterligere, er det taxier og private kjøretøy, bygninger og skyskrapere, skilt og mer. Bildekommentarer handler om å gå inn i detaljene.

Typer bildekommentarer

Bildeklassifisering

Bildeklassifisering

Den mest grunnleggende typen, hvor objekter er bredt klassifisert. Så her involverer prosessen bare å identifisere elementer som kjøretøy, bygninger og trafikklys.

Objektdeteksjon

Objektdeteksjon

En litt mer spesifikk funksjon, hvor ulike objekter identifiseres og kommenteres. Kjøretøy kan være biler og drosjer, bygninger og skyskrapere, og kjørefelt 1, 2 eller flere.

Bildesegmentering

Bildesegmentering

Dette går inn på detaljene til hvert bilde. Det innebærer å legge til informasjon om et objekt, f.eks. farge, plasseringsutseende, etc. for å hjelpe maskiner med å differensiere. For eksempel vil kjøretøyet i sentrum være en gul taxi på bane 2.

Objektsporing

Objektsporing

Dette innebærer å identifisere et objekts detaljer som plassering og andre attributter på tvers av flere rammer i samme datasett. Opptak fra videoer og overvåkingskameraer kan spores for objektbevegelser og studere mønstre.

Teknikker for bildekommentarer

Bildekommentarer gjøres gjennom ulike teknikker og prosesser. For å komme i gang med bildekommentarer trenger man en programvareapplikasjon som tilbyr de spesifikke funksjonene og funksjonalitetene, og verktøyene som kreves for å kommentere bilder basert på prosjektkrav.

For de uinnvidde er det flere kommersielt tilgjengelige bildekommentarverktøy som lar deg endre dem for din spesifikke brukssituasjon. Det finnes også verktøy som er åpen kildekode også. Men hvis kravene dine er nisje og du føler at modulene som tilbys av kommersielle verktøy er for grunnleggende, kan du få et tilpasset bildekommentarverktøy utviklet for prosjektet ditt. Dette er selvsagt dyrere og mer tidkrevende.

Uavhengig av verktøyet du bygger eller abonnerer på, er det visse bildekommentarteknikker som er universelle. La oss se på hva de er.

Avgrensende bokser

Avgrensende bokser

Den mest grunnleggende bildekommentarteknikken innebærer at eksperter eller kommentatorer tegner en boks rundt et objekt for å tilskrive objektspesifikke detaljer. Denne teknikken er mest ideell for å kommentere objekter som er symmetriske i form.

En annen variant av avgrensningsbokser er cuboids. Dette er 3D-varianter av grensebokser, som vanligvis er todimensjonale. Cuboids sporer objekter på tvers av deres dimensjoner for mer nøyaktige detaljer. Hvis du vurderer bildet ovenfor, kan kjøretøyene lett kommenteres gjennom avgrensningsbokser.

For å gi deg en bedre idé gir 2D-bokser deg detaljer om et objekts lengde og bredde. Den kubiske teknikken gir deg imidlertid også detaljer om objektets dybde. Å kommentere bilder med cuboider blir mer belastende når et objekt bare er delvis synlig. I slike tilfeller tilnærmer annotatorer et objekts kanter og hjørner basert på eksisterende grafikk og informasjon.

Landemerking

Landemerking

Denne teknikken brukes til å få frem forviklingene i bevegelsene til objekter i et bilde eller opptak. De kan også brukes til å oppdage og kommentere små gjenstander. Landemerking brukes spesielt i ansiktsgjenkjenning til kommenterte ansiktstrekk, gester, uttrykk, stillinger og mer. Det innebærer å identifisere ansiktstrekk og deres egenskaper individuelt for nøyaktige resultater.

For å gi deg et ekte eksempel på hvor landemerking er nyttig, tenk på Instagram- eller Snapchat-filtrene dine som nøyaktig plasserer hatter, briller eller andre morsomme elementer basert på ansiktstrekk og uttrykk. Så neste gang du poserer for et hundefilter, forstå at appen har markert ansiktstrekkene dine for presise resultater.

polygoner

polygoner

Objekter i bilder er ikke alltid symmetriske eller regelmessige. Det er tonnevis av tilfeller der du vil finne at de er uregelmessige eller bare tilfeldige. I slike tilfeller bruker kommentatorer polygonteknikken for nøyaktig å kommentere uregelmessige former og objekter. Denne teknikken innebærer å plassere prikker over et objekts dimensjoner og tegne linjer manuelt langs objektets omkrets eller omkrets.

Linjer

Linjer

Bortsett fra grunnleggende former og polygoner, brukes enkle linjer også for å kommentere objekter i bilder. Denne teknikken lar maskiner sømløst identifisere grenser. For eksempel trekkes linjer over kjørefelt for maskiner i autonome kjøretøy for bedre å forstå grensene de må manøvrere innenfor. Linjer brukes også til å trene disse maskinene og systemene for ulike scenarier og omstendigheter og hjelpe dem å ta bedre kjøreavgjørelser.

Bruke tilfeller for bildekommentarer

Denne delen snakker om hvordan bildekommentarer eller bildemerking kan brukes til å trene ML-modeller til å utføre spesifikke oppgaver basert på deres respektive bransjer.

Detaljhandel

Detaljhandel: I et kjøpesenter eller en dagligvarebutikk kan 2D bounding box-teknikk brukes til å merke bilder av butikkprodukter som skjorter, bukser, jakker, personer osv. for å effektivt trene ML-modeller på ulike attributter som pris, farge, design osv

Helsevesen: Polygonteknikk kan brukes til å kommentere/merke menneskelige organer i medisinsk røntgen for å trene ML-modeller til å identifisere deformiteter i menneskelig røntgen. Dette er en av de mest kritiske brukssakene, som revolusjonerer helsetjenester industrien ved å identifisere sykdommer, redusere kostnader og forbedre pasientopplevelsen.

Helsevesen
Selvbilende biler

Selvkjørende biler: Vi har allerede sett suksessen med autonom kjøring, men vi har en lang vei å gå. Mange bilprodusenter har ennå ikke tatt i bruk den nevnte teknologien som er avhengig av semantisk segmentering som merker hver piksel på et bilde for å identifisere veien, bilene, trafikklysene, stolpene, fotgjengere osv., slik at kjøretøy kan være oppmerksomme på omgivelsene og kan føler hindringer i veien.

Følelsesgjenkjenning: Landmark-kommentarer brukes til å oppdage menneskelige følelser (glade, triste eller nøytrale) for å måle motivets emosjonelle sinnstilstand ved et gitt innhold. Følelsesgjenkjenning eller sentiment analyse kan brukes til produktanmeldelser, tjenesteanmeldelser, filmanmeldelser, e-postklager/tilbakemeldinger, kundeanrop og møter, etc.

Følelsesgjenkjenning
Forsyningskjede

Forsyningskjede: Linjer og splines brukes til å merke baner i et lager for å identifisere stativer basert på deres leveringssted, dette vil igjen hjelpe robotene til å optimalisere banen og automatisere leveringskjeden og dermed minimere menneskelig inngripen og feil.

Hvordan nærmer du deg bildekommentarer: internt vs outsource?

Bildekommentarer krever investeringer ikke bare i form av penger, men også tid og krefter. Som vi nevnte er det arbeidskrevende som krever grundig planlegging og iherdig involvering. Hva bildeannotatorer attributter er hva maskinene vil behandle og levere resultater. Så, bildekommentarfasen er ekstremt avgjørende.

Nå, fra et forretningsperspektiv, har du to måter å gå frem for å kommentere bildene dine – 

  • Du kan gjøre det internt
  • Eller du kan sette ut prosessen

Begge er unike og tilbyr sin egen del av fordeler og ulemper. La oss se objektivt på dem. 

In-house 

I dette tar din eksisterende talentmasse eller teammedlemmer seg av bildekommentaroppgaver. Den interne teknikken innebærer at du har en datagenereringskilde på plass, har riktig verktøy eller datanotering plattform, og det riktige teamet med tilstrekkelig kompetanse til å utføre merknadsoppgaver.

Dette er perfekt hvis du er en bedrift eller en kjede av selskaper, som er i stand til å investere i dedikerte ressurser og team. Som en bedrift eller en markedsaktør ville du heller ikke ha mangel på datasett, som er avgjørende for at treningsprosessene dine skal begynne.

Outsourcing

Dette er en annen måte å utføre bildekommentaroppgaver på, der du gir jobben til et team som har den nødvendige erfaringen og ekspertisen til å utføre dem. Alt du trenger å gjøre er å dele kravene dine med dem og en tidsfrist, og de vil sikre at du har leveransene dine i tide.

Det outsourcede teamet kan være i samme by eller nabolag som bedriften din eller på en helt annen geografisk plassering. Det som betyr noe ved outsourcing er den praktiske eksponeringen for jobben og kunnskapen om hvordan man kommenterer bilder.

Bildekommentar: Outsourcing vs interne team – alt du trenger å vite

OutsourcingIn-house
Ytterligere lag med klausuler og protokoller må implementeres ved outsourcing av prosjekt til et annet team for å sikre dataintegritet og konfidensialitet.Oppretthold konfidensialiteten til data sømløst når du har dedikerte interne ressurser som jobber med datasettene dine.
Du kan tilpasse slik du vil at bildedataene dine skal være.Du kan skreddersy datagenereringskildene dine for å møte dine behov.
Du trenger ikke å bruke ekstra tid på å rense data og deretter begynne å jobbe med å kommentere dem.Du må be de ansatte om å bruke flere timer på å rense rådata før du merker dem.
Det er ingen overbelastning av ressurser som er involvert, siden du har prosessen, kravene og planen fullstendig kartlagt før du samarbeider.Du ender opp med å overarbeide ressursene dine fordi datakommentarer er et tilleggsansvar i deres eksisterende roller.
Tidsfrister overholdes alltid uten at det går på bekostning av datakvalitet.Tidsfrister kan bli forlenget hvis du har færre teammedlemmer og flere oppgaver.
Outsourcede team er mer tilpasningsdyktige til nye retningslinjerendringer.Senker moralen til teammedlemmer hver gang du pivoterer fra dine krav og retningslinjer.
Du trenger ikke å vedlikeholde datagenereringskilder. Det endelige produktet når deg i tide.Du er ansvarlig for å generere dataene. Hvis prosjektet ditt krever millioner av bildedata, er det opp til deg å skaffe relevante datasett.
Skalerbarhet av arbeidsmengde eller teamstørrelse er aldri en bekymring.Skalerbarhet er et stort problem ettersom raske beslutninger ikke kan tas sømløst.

Bunnlinjen

Som du tydelig kan se, selv om det virker mer praktisk å ha et internt bilde-/dataannoteringsteam, er outsourcing av hele prosessen mer lønnsomt i det lange løp. Når du samarbeider med dedikerte eksperter, avlaster du deg selv med flere oppgaver og ansvar du ikke trengte å bære i utgangspunktet. Med denne forståelsen, la oss innse hvordan du kan finne de riktige leverandørene eller teamene for datakommentarer.

Faktorer å vurdere når du velger en leverandør av datakommentarer

Dette er et stort ansvar, og hele ytelsen til maskinlæringsmodulen din avhenger av kvaliteten på datasettene levert av leverandøren og tidspunktet. Derfor bør du være mer oppmerksom på hvem du snakker med, hva de lover å tilby, og vurdere flere faktorer før du signerer kontrakten.

For å hjelpe deg i gang, her er noen avgjørende faktorer du bør vurdere.Leverandør av datakommentarer

Kompetanse

En av de primære faktorene å vurdere er ekspertisen til leverandøren eller teamet du har tenkt å ansette for maskinlæringsprosjektet ditt. Teamet du velger bør ha mest praktisk eksponering for datanotering verktøy, teknikker, domenekunnskap og erfaring fra å jobbe på tvers av flere bransjer.

I tillegg til tekniske detaljer, bør de også implementere arbeidsflytoptimaliseringsmetoder for å sikre jevnt samarbeid og konsistent kommunikasjon. For mer forståelse, spør dem om følgende aspekter:

  • De tidligere prosjektene de har jobbet med som ligner på ditt
  • De mange års erfaring de har 
  • Arsenalet av verktøy og ressurser de distribuerer for merknader
  • Deres måter å sikre konsistent datakommentarer og levering til rett tid
  • Hvor komfortable eller forberedt de er når det gjelder prosjektskalerbarhet og mer

Datakvalitet

Datakvalitet påvirker prosjektresultatet direkte. Alle årene med sliting, nettverksbygging og investering kommer ned til hvordan modulen din presterer før lansering. Så sørg for at leverandørene du har tenkt å jobbe med leverer datasett av høyeste kvalitet for prosjektet ditt. For å hjelpe deg med å få en bedre idé, her er et raskt jukseark du bør se nærmere på:

  • Hvordan måler leverandøren din datakvalitet? Hva er standardberegningene?
  • Detaljer om deres kvalitetssikringsprotokoller og prosesser for klagebehandling
  • Hvordan sikrer de overføring av kunnskap fra ett teammedlem til et annet?
  • Kan de opprettholde datakvaliteten hvis volumene senere økes?

Kommunikasjon og samarbeid

Levering av utskrifter av høy kvalitet fører ikke alltid til jevnt samarbeid. Det innebærer sømløs kommunikasjon og utmerket vedlikehold av rapport også. Du kan ikke jobbe med et team som ikke gir deg noen oppdatering under hele samarbeidsløpet eller holder deg utenfor loopen og plutselig leverer et prosjekt på tidspunktet for fristen. 

Det er derfor en balanse blir viktig og du bør følge nøye med på deres modus operandi og generelle holdning til samarbeid. Så still spørsmål om deres kommunikasjonsmetoder, tilpasning til retningslinjer og kravendringer, nedskalering av prosjektkrav og mer for å sikre en jevn reise for begge involverte parter. 

Avtalevilkår og -betingelser

Utenom disse aspektene er det noen vinklinger og faktorer som er uunngåelige med tanke på lover og regler. Dette innebærer prisbetingelser, varighet av samarbeid, foreningsvilkår og betingelser, tildeling og spesifikasjon av stillingsroller, klart definerte grenser med mer. 

Få dem sortert før du signerer en kontrakt. For å gi deg en bedre ide, her er en liste over faktorer:

  • Spør om betalingsbetingelsene og prismodellen deres – om prisen er for arbeidet utført per time eller per merknad
  • Er utbetalingen månedlig, ukentlig eller hver fjortende dag?
  • Påvirkning av prismodeller når det skjer endringer i prosjektretningslinjer eller arbeidsomfang

skalerbarhet 

Virksomheten din kommer til å vokse i fremtiden, og prosjektets omfang kommer til å utvide seg eksponentielt. I slike tilfeller bør du være trygg på at leverandøren din kan levere volumene av merkede bilder virksomheten din krever i stor skala.

Har de nok talent i huset? Uttømmer de alle datakildene sine? Kan de tilpasse dataene dine basert på unike behov og brukstilfeller? Aspekter som disse vil sikre at leverandøren kan gå over når større datamengder er nødvendig.

Innpakning Up

Når du har tatt i betraktning disse faktorene, kan du være sikker på at samarbeidet ditt vil være sømløst og uten hindringer, og vi anbefaler å sette ut bildekommentaroppgavene dine til spesialistene. Se opp for fremste selskaper som Shaip, som krysser av for alle boksene som er nevnt i veiledningen.

Etter å ha vært i kunstig intelligens i flere tiår, har vi sett utviklingen av denne teknologien. Vi vet hvordan det startet, hvordan det går og fremtiden. Så vi holder oss ikke bare oppdatert på de siste fremskrittene, men forbereder oss også på fremtiden.

Dessuten håndplukker vi eksperter for å sikre at data og bilder blir kommentert med høyeste presisjonsnivå for prosjektene dine. Uansett hvor nisje eller unikt prosjektet ditt er, vær alltid trygg på at du vil få upåklagelig datakvalitet fra oss.

Bare ta kontakt med oss ​​og diskuter dine behov, så kommer vi i gang med det umiddelbart. Kontakt oss hos oss i dag.

La oss snakke

  • Ved å registrere meg godtar jeg Shaip Personvernserklæring og Våre vilkår og gi mitt samtykke til å motta B2B-markedsføringskommunikasjon fra Shaip.

Ofte stilte spørsmål (FAQ)

Bildekommentarer er et undersett av datamerking som også er kjent under navnet bildemerking, transkribering eller merking som involverer mennesker i bakenden, som utrettelig merker bilder med metadatainformasjon og attributter som vil hjelpe maskiner å identifisere objekter bedre.

An bildekommentar/merkeverktøy er en programvare som kan brukes til å merke bilder med metadatainformasjon og attributter som vil hjelpe maskiner å identifisere objekter bedre.

Bildemerking/kommentartjenester er tjenester som tilbys av tredjepartsleverandører som merker eller merker et bilde på dine vegne. De tilbyr den nødvendige ekspertisen, kvalitetssmidigheten og skalerbarheten når og når det er nødvendig.

En merket/kommentert bilde er en som har blitt merket med metadata som beskriver bildet som gjør det forståelig av maskinlæringsalgoritmer.

Bildekommentar for maskinlæring eller dyp læring er prosessen med å legge til etiketter eller beskrivelser eller klassifisere et bilde for å vise datapunktene du vil at modellen skal gjenkjenne. Kort sagt, det er å legge til relevante metadata for å gjøre det gjenkjennelig av maskiner.

Bildekommentar innebærer å bruke en eller flere av disse teknikkene: avgrensningsbokser (2-d, 3-d), landemerking, polygoner, polylinjer, etc.