Marathi-datasett
मराठी डेटासेट
Høykvalitets datasett for callsenter, generelle samtaler, manusbaserte monologer og media (podkaster) på marathi for AI og talemodeller
Oversikt
Tittel (språk)
Marathi-språkdatasett
Datasetttyper
Kundesenter, Generell samtale, Media (podkast), Skrevet monolog
Land
India
Tekniske beskrivelser
Dette datasettet inkluderer uskriptede syntetiske telefonsamtaler mellom agent og kunde (5–15 minutter), naturlige telefonsamtaler mellom mennesker (15–60 minutter) og sanglyd med transkripsjoner, og gir varierte taledata for trening og evaluering av tale- og språkteknologier.
Bruk sak
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasettdetaljer
| Datasettype | Sampling Rate | Høyttalere | Kanal | Totalt antall timer | Totalt antall høyttalere |
|---|---|---|---|---|---|
| Call Center | 8 kHz | 2 høyttalere | dual | 70:28:58 | 634 |
| Generell samtale | 8 kHz | 2 høyttalere | dual | 159:21:13 | 298 |
| Mediedata | 16 kHz | Multipal-høyttalere | Mono | 24:09:24 | 94 |
| Manuskriptmonolog | 24 kHz | Enkelt høyttaler | Mono | 3,900:00:00 | På forespørsel |
Utvalgte klienter
Gir teamene mulighet til å bygge verdensledende AI-produkter.
Finner du ikke det du leter etter?
Nye hylledatasett samles inn på tvers av alle datatyper
Kontakt oss nå for å gi slipp på bekymringene for innsamling av lyd-/taletreningsdata