Oversikt
Tittel (språk)
Kinesisk språkdatasett
Datasetttyper
Kundesenter, musikk, manusbasert monolog, mediedata (podkastdata)
Land
Kina
Tekniske beskrivelser
Dette datasettet inkluderer uskriptede syntetiske telefonsamtaler mellom agent og kunde (5–15 minutter), naturlige telefonsamtaler mellom mennesker (15–60 minutter) og sanglyd med transkripsjoner, og gir varierte taledata for trening og evaluering av tale- og språkteknologier.
Bruk sak
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasettdetaljer
| Språk | Datasettype | Sampling Rate | Høyttalere | Kanal | Totalt antall timer | Totalt antall høyttalere |
|---|---|---|---|---|---|---|
| Kinesisk sang | musikk | 48 kHz | Enkelt høyttaler | Mono | 06:11:32 | 10 |
| Kinesisk (tradisjonell) | Manuskriptmonolog | 48 kHz | Enkelt høyttaler | Mono | 1,499:00:00 | 1,805 |
| Kinesisk aksent engelsk | Mediedata | 16 kHz | Flere høyttalere | Mono | 306:04:58 | 2,130 |
| Kinesisk med enkle tegn | Manuskriptmonolog | 48 kHz | Enkelt høyttaler | Mono | 2,761:00:00 | 3,725 |
| Kinesisk med amerikansk aksent og engelsk | Call Center | 8 kHz | 2 høyttalere | dual | 152:18:33 | 2,058 |
| Kinesisk med amerikansk aksent og engelsk | Mediedata | 16 kHz | Flere høyttalere | Mono | 245:55:15 | 468 |
Utvalgte klienter
Gir teamene mulighet til å bygge verdensledende AI-produkter.
Finner du ikke det du leter etter?
Nye hylledatasett samles inn på tvers av alle datatyper
Kontakt oss nå for å gi slipp på bekymringene for innsamling av lyd-/taletreningsdata