Telugu-datasett
తెలుగు డేటాసెట్లు
Høykvalitets telugu-kundesenter, generelle samtaler, manusbaserte monologer og mediedatasett (podkaster) for AI og talemodeller
Oversikt
Tittel (språk)
Telgu-språkdatasett
Datasetttyper
Kundesenter, Generell samtale, Musikk, Manusmonolog
Land
India
Tekniske beskrivelser
Dette datasettet inkluderer uskriptede syntetiske agent-kunde-samtaler (5–15 minutter), naturlige telefonsamtaler mellom mennesker (15–60 minutter) og mediedata med transkripsjoner, og tilbyr varierte taledata for trening og evaluering av tale- og språkteknologier.
Bruk sak
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasettdetaljer
| Datasettype | Sampling Rate | Høyttalere | Kanal | Totalt antall timer | Totalt antall høyttalere |
|---|---|---|---|---|---|
| Call Center | 8 kHz | 2 høyttalere | dual | 62:32:27 | 496 |
| Generell samtale | 8 kHz | 2 høyttalere | dual | 654:08:03 | 1,601 |
| Mediedata | 16 kHz | Flere høyttalere | Mono | 666:24:29 | 1,230 |
| Manuskriptmonolog | 24 kHz | Enkelt høyttaler | Mono | 1,700:00:00 | På forespørsel |
Utvalgte klienter
Gir teamene mulighet til å bygge verdensledende AI-produkter.
Finner du ikke det du leter etter?
Nye hylledatasett samles inn på tvers av alle datatyper
Kontakt oss nå for å gi slipp på bekymringene for innsamling av lyd-/taletreningsdata