Åpne datasett

Oppdag datasett med åpen kildekode som får deg til å trene ML-modeller

Åpne datasett

Datasett med åpen kildekode for å komme i gang med AI/ML-modeller

Utdataene fra AI- og ML-modellene dine er bare like gode som dataene du bruker for å trene dem – så presisjonen du bruker på dataaggregering og tagging og identifisering av disse dataene er viktig!

Så hvis du ønsker å starte et nytt AI/ML-initiativ og nå innser du raskt at det å finne treningsdata av høy kvalitet vil være en av de mer utfordrende aspektene ved prosjektet ditt, siden høykvalitets datasett er drivstoffet som holder AI/ ML-motor i gang. Vi har samlet en liste over åpne datasett som er gratis å bruke og trene dine AI/ML-modeller for fremtiden.

Spesialisering Data-type Datasettnavn Industri / Avd. Merknad/brukstilfelle link
+NLP tekst Amazon Anmeldelser E-handel Sentiment Analyse link
+NLP tekst Wikipedia lenker data Informasjon link
+NLP tekst Standford Sentiment Treebank Entertainment Sentiment Analyse link
+NLP tekst Twitter US Airline Sentiment Flyselskap Sentiment Analyse link
+CV Bilde Imagenet Informasjon link
+CV Bilde Googles åpne bilder Informasjon link
+NLP tekst Cornell-filmdialoger Entertainment dialoger link
+NLP tekst MS MARCO Informasjon Spørsmål svar link
+NLP tekst Naturlige spørsmålsdatasett Informasjon Spørsmål svar link
+NLP tekst DBPedia Informasjon Kunnskap Graph link
+NLP tekst YAGO Informasjon Kunnskap Graph link
+NLP tekst FreeBase Informasjon Kunnskap Graph link
+NLP tekst Ontonotes Informasjon Semantisk rollemerking link
+CV Bilde COCO Informasjon Objektdeteksjon link
+CV Bilde PASCAL VOC Informasjon Objektdeteksjon link
+CV Bilde Skyskrapere Autonom kjøring Semantisk segmentering link
+CV Bilde MNIST Informasjon Sifferklassifisering link
+CV Bilde Mote-MNIST Detaljhandel Bildeklassifisering link
+NLP lyd LibriSpeech Informasjon ASR link
+NLP lyd TED-LIUM Informasjon ASR link
+NLP lyd TIMIT Informasjon Fonemgjenkjenning link
+NLP lyd Vanlig stemme Informasjon ASR link
+NLP lyd VoxCeleb Informasjon Høyttalergjenkjenning link
+NLP tekst Wikipedia-dump Informasjon Språkmodellering link
+NLP tekst Gigaword Nyheter Språkmodellering link
+NLP tekst IMDB-anmeldelser Entertainment Sentiment Analyse link
+CV Video Kinetikk-700 Informasjon Handlingsgjenkjenning link
+CV Video UCF101 Informasjon Handlingsgjenkjenning link
+CV Video HMDB51 Informasjon Handlingsgjenkjenning link
+CV Bilde CASIA-WebFace Informasjon Face Recognition link
+NLP tekst SQUAD Informasjon Leseforståelse link
+NLP tekst MultiNLI Informasjon Naturlig språkslutning link
+NLP tekst SNLI Informasjon Naturlig språkslutning link
+CV Bilde Oxford Blomster 102 Botany Finkornet klassifisering link
+CV Bilde CIFAR-10 Informasjon Bildeklassifisering link
+CV Bilde CIFAR-100 Informasjon Bildeklassifisering link
+CV Bilde VOC-personoppsett Informasjon Pose Estimering link
+CV Bilde MPII Menneskelig positur Informasjon Pose Estimering link
+NLP tekst 20 nyhetsgrupper Informasjon Tekstklassifisering link