Thai datasett
ชุดข้อมูลภาษาไทย
Høykvalitets thailandske generelle samtaler, manusbaserte monologer og mediedatasett (podkaster) for AI og talemodeller
Oversikt
Tittel (språk)
Datasett for thailandsk språk
Datasetttyper
Generell samtale, media (podkast), manusbasert monolog
Land
Thailand
Tekniske beskrivelser
Dette datasettet inkluderer uskriptede telefonsamtaler mellom to personer på hebraisk fra Israel (15–60 minutter), lisensierbare lyd- eller videofiler som er offentlig eiendom med 1 til 5 deltakere (15–60 minutter), og skriptede monologer der én enkelt taler leverer forhåndsdefinert innhold for trening og evaluering av tale- og språkmodeller.
Bruk sak
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasettdetaljer
| Datasettype | Sampling Rate | Høyttalere | Kanal | Totalt antall timer | Totalt antall høyttalere |
|---|---|---|---|---|---|
| Generell samtale | 8 kHz | 2 høyttalere | dual | 211:48:42 | 170 |
| Mediedata | 16 kHz | Enkelt høyttaler | Mono | 249:14:31 | 670 |
| Manuskriptmonolog | 24 kHz | Enkelt høyttaler | Mono | 500:00:00 | På forespørsel |
Utvalgte klienter
Gir teamene mulighet til å bygge verdensledende AI-produkter.
Finner du ikke det du leter etter?
Nye hylledatasett samles inn på tvers av alle datatyper
Kontakt oss nå for å gi slipp på bekymringene for innsamling av lyd-/taletreningsdata