Hindi datasett
हिंदी डेटासेट
Høykvalitets hindi-datasett for callsenter, generell samtale og podkaster for AI- og ASR-modeller
Oversikt
Tittel (språk)
Datasett for hindi-språk
Datasetttyper
Kundesenter, Generell samtale, Media (podkast), Skrevet monolog
Land
India
Tekniske beskrivelser
Uskriptede telefonsamtaler mellom to personer er tilgjengelige med varigheter på 15 til 60 minutter, sammen med lisensierbare lyd- eller videofiler som er offentlig eiendom, for eksempel intervjuer og podkaster med 1 til 5 deltakere i samme område. I tillegg varer opptak av enkeltstående ytringer vanligvis 5 til 30 sekunder, og skriptede monologdata er også tilgjengelig.
Bruk sak
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasettdetaljer
| Datasettype | Sampling Rate | Høyttalere | Kanal | Totalt antall timer | Totalt antall høyttalere |
|---|---|---|---|---|---|
| Call Center | 8 kHz | 2 høyttalere | dual | 70:45:51 | På forespørsel |
| Call Center | 8 kHz | 2 høyttalere | Mono | 20,000:00:00 | På forespørsel |
| Call Center | 16 kHz | 2 høyttalere | Mono | 29:17:20 | 261 |
| Call Center | 16 kHz | 2 høyttalere | dual | 400:27:10 | 1200 |
| Generell samtale | 8 kHz | 2 høyttalere | dual | 47:48:40 | 224 |
| Mediedata | 16 kHz | Flere høyttalere | Mono | 227:57:43 | 438 |
| Manuskriptmonolog | 48 kHz | Enkelt høyttaler | Mono | 2,866:00:00 | 3,988 |
| Manuskriptmonolog | 24 kHz | Enkelt høyttaler | Mono | 29,000:00:00 | På forespørsel |
Utvalgte klienter
Gir teamene mulighet til å bygge verdensledende AI-produkter.
Finner du ikke det du leter etter?
Nye hylledatasett samles inn på tvers av alle datatyper
Kontakt oss nå for å gi slipp på bekymringene for innsamling av lyd-/taletreningsdata