Datamaskin syn

22+ mest ettertraktede datasett med åpen kildekode for datasyn

En AI-algoritme er bare så god som dataene du mater den.

Det er verken et dristig eller ukonvensjonelt utsagn. AI kunne ha virket ganske langsøkt for et par tiår siden, men kunstig intelligens og maskinlæring har kommet veldig langt siden den gang.

Datasyn hjelper datamaskiner med å forstå og tolke etiketter og bilder. Når du trener datamaskinen din ved å bruke riktig type bilder, kan den få muligheten til å oppdage, forstå og identifisere ulike ansiktstrekk, oppdage sykdommer, kjøre autonome kjøretøy og også redde liv ved hjelp av flerdimensjonal organskanning.

Computer Vision Market er spådd å nå $ 144.46 milliarder innen 2028 fra beskjedne 7.04 milliarder dollar i 2020, vokst med en CAGR på 45.64 % mellom 2021 og 2028.

Noen av brukssakene for datasyn er:

  • Medisinsk bildebehandling
  • Autonomt kjøretøy
  • Ansikts- og objektgjenkjenning
  • Feilidentifikasjon
  • Scenedeteksjon

De bildedatasett du mater og trener dine maskinlærings- og datasynoppgaver er avgjørende for suksessen til AI-prosjektet ditt. Et kvalitetsdatasett er ganske vanskelig å få tak i. Avhengig av kompleksiteten til prosjektet ditt, kan det ta alt fra noen dager til noen uker å få pålitelige og relevante datasett for datasynsformål.

Her gir vi deg en rekke (kategorisert for enkelhets skyld) med åpen kildekode-datasett du kan bruke med en gang.

Omfattende liste over datasett for datasyn

Generell:

  1. IMAGEnet (Link)

    ImageNet er et mye brukt datasett, og det kommer med forbløffende 1.2 millioner bilder kategorisert i 1000 kategorier. Dette datasettet er organisert i henhold til WorldNet-hierarkiet og kategorisert i tre deler - treningsdata, bildeetiketter og valideringsdata.

  2. Kinetikk 700 (Link)

    Kinetics 700 er et enormt høykvalitets datasett med mer enn 650,000 700 klipp av 700 forskjellige menneskelige handlingsklasser. Hver av gruppesøksmålene har rundt XNUMX videoklipp. Klippene i datasettet har menneske-objekt og menneske-menneske-interaksjoner, som viser seg å være ganske nyttige når man gjenkjenner menneskelige handlinger i videoer.

  3. CIFAR-10 (Link)

    CIFAR 10 er et av de største datasynsdatasettene med 60000 32 32 x 6000 fargebilder som representerer ti forskjellige klasser. Hver klasse har rundt XNUMX bilder som brukes til å trene datasynsalgoritmer og maskinlæring.

Ansiktsgjenkjenning:

ansiktsgjenkjenning

  1. Merkede Faces in the Wild (Link)

    Merket Faced in the Wild er et enormt datasett som inneholder mer enn 13,230 5,750 bilder av nesten XNUMX XNUMX personer oppdaget fra internett. Dette datasettet med ansikter er designet for å gjøre det enklere å studere ubegrenset ansiktsdeteksjon.

  2. CASIA WebFace (Link)

    CASIA Web face er et godt designet datasett som hjelper maskinlæring og vitenskapelig forskning på ubegrenset ansiktsgjenkjenning. Med mer enn 494,000 10,000 bilder av nesten XNUMX XNUMX ekte identiteter, er den ideell for ansiktsidentifikasjon og verifiseringsoppgaver.

  3. UMD Faces Datasett (Link)

    UMD står overfor et godt kommentert datasett som inneholder to deler – stillbilder og videorammer. Datasettet har mer enn 367,800 3.7 ansiktsannoteringer og XNUMX millioner kommenterte videorammer av motiver.

Håndskriftgjenkjenning:

  1. MNIST-database (Link)

    MNIST er en database som inneholder eksempler på håndskrevne sifre fra 0 til 9, og den har 60,000 10,000 og 1999 XNUMX trenings- og testbilder. Utgitt i XNUMX, gjør MNIST det enklere å teste bildebehandlingssystemer i Deep Learning.

  2. Datasett med kunstige tegn (Link)

    Artificial Characters Dataset er, som navnet antyder, kunstig genererte data som beskriver den engelske språkstrukturen med ti store bokstaver. Den kommer med mer enn 6000 bilder.

La oss diskutere AI Training Data-kravet i dag.

Objektgjenkjenning:

  1. MS COCO (Link)

    MS COCO eller Common Objects in Context er et datasett for gjenkjenning og teksting av objekter.

    Den har mer enn 328,000 80 bilder med nøkkelpunktdeteksjon, multiobjektgjenkjenning, teksting og segmenteringsmaskekommentarer. Den kommer med XNUMX objektkategorier og fem bildetekster per bilde.

  2. LSUN(Link)

    LSUN, forkortelse for Large-scale Scene Understanding, har mer enn en million merkede bilder i 20 objekt- og 10 scenekategorier. Noen kategorier har nærmere 300,000 300 bilder, med 1000 bilder spesifikt for validering og XNUMX bilder for testdata.

  3. Hjem Objekter(Link)

    Home Objects-datasettet inneholder kommenterte bilder av tilfeldige objekter fra hele huset – kjøkken, stue og bad. Dette datasettet har også noen få kommenterte videoer og 398 uannoterte bilder designet for testing.

Automotive:

  1. Bybilde datasett (Link)

    Bybilde er datasettet du skal gå til når du ser etter ulike videosekvenser tatt opp fra flere sitaters gatescener. Disse bildene ble tatt over lang tid og under forskjellige vær- og lysforhold. Merknadene er for 30 bildeklasser fordelt på åtte forskjellige kategorier.

  2. Barkley Deep Drive (Link)

    Barkley DeepDrive er spesielt designet for opplæring i autonome kjøretøy, og den har mer enn 100 tusen kommenterte videosekvenser. Det er en av de mest nyttige treningsdataene for autonome kjøretøy etter skiftende vei- og kjøreforhold.

  3. mapillær (Link)

    Mapillary har over 750 millioner gatescener og trafikkskilt over hele verden, noe som er veldig nyttig for å trene visuelle persepsjonsmodeller i maskinlæring og AI-algoritmer. Den lar deg utvikle autonome kjøretøy som passer til ulike lys- og værforhold og utsiktspunkter.

Medisinsk bildebehandling:

  1. Covid-19 åpent forskningsdatasett (Link)

    Dette originale datasettet har omtrent 6500 piksel-polygonale lungesegmenteringer om AP/PA-røntgenstråler. I tillegg er 517 bilder av Covid-19 pasientrøntgenbilder med tags som inneholder navn, plassering, innleggelsesdetaljer, utfall og mer tilgjengelig.

  2. NIH-database med 100,000 XNUMX røntgenbilder (Link)

    NIH-databasen er en av de mest omfattende offentlig tilgjengelige datasettene som inneholder 100,000 XNUMX røntgenbilder av thorax og relaterte data som er nyttige for vitenskaps- og forskningsmiljøet. Den har til og med bilder av pasienter med avanserte lungesykdommer.

  3. Atlas for digital patologi (Link)

    Atlas of Digital Pathology tilbyr flere histopatologiske lappbilder, mer enn 17,000 100 totalt, fra nærmere XNUMX kommenterte lysbilder av forskjellige organer. Dette datasettet er nyttig for å utvikle programvare for datasyn og mønstergjenkjenning.

Scenegjenkjenning:

Scenegjenkjenning

  1. Innendørs scenegjenkjenning (Link)

    Innendørs Scene Recognition er et høyt kategorisert datasett med nesten 15620 bilder av objekter og innendørs landskap som skal brukes i maskinlæring og datatrening. Den kommer med over 65 kategorier, og hver kategori har minimum 100 bilder.

  2. xView (Link)

    Som et av de mest kjente offentlig tilgjengelige datasettene, inneholder xView tonnevis av kommenterte overheadbilder fra forskjellige komplekse og store scener. Med rundt 60 klasser og mer enn en million objektforekomster, er formålet med dette datasettet å gi bedre katastrofehjelp ved hjelp av satellittbilder.

  3. steder (Link)

    Places, et datasett bidratt av MIT, har over 1.8 millioner bilder fra 365 forskjellige scenekategorier. Det er omtrent 50 bilder i hver av disse kategoriene for validering og 900 bilder for testing. Det er mulig å lære dype scenefunksjoner for å etablere scenegjenkjenning eller visuelle gjenkjenningsoppgaver.

Underholdning:

  1. IMDB WIKI-datasett (Link)

    IMDB – Wiki er en av de mest populære offentlige databasene over ansikter merket med alder, kjønn og navn. Den har også rundt 20 tusen ansikter av kjendiser og 62 tusen fra Wikipedia.

  2. Kjendis ansikter (Link)

    Celeb Faces er en storskala database med 200,000 XNUMX kommenterte bilder av kjendiser. Bildene kommer med bakgrunnsstøy og poseringsvariasjoner, noe som gjør dem verdifulle for treningstestsett i datasynsoppgaver. Det er svært fordelaktig for å oppnå høyere nøyaktighet i ansiktsgjenkjenning, redigering, lokalisering av ansiktsdeler og mer.

Nå som du har en enorm liste over åpen kildekode-bildedatasett for å gi drivstoff til kunstig intelligens-maskineriet ditt. Resultatet av AI- og maskinlæringsmodellene dine avhenger først og fremst av kvaliteten på datasettene du mater og trener dem på. Hvis du vil at AI-modellen din skal gi nøyaktige spådommer, trenger den kvalitetsdatasett som er aggregert, merket og merket til perfeksjon. For å forsterke datasynssystemets suksess, må du bruke kvalitetsbildedatabaser som er relevante for prosjektvisjonen. Hvis du ser etter flere slike datasett Klikk her

Sosial Share

Kan hende du også liker