Thai datasett
ชุดข้อมูลภาษาไทย
Oversikt
Tittel
Thailandsk Språkdatasett
Datasettype
Generell samtale
Beskrivelse
Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) – 15-60 minutter, et uformelt register som brukes mellom venner.
Bruk sak
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasettdetaljer
Totalt antall timer
183
Eksempelfrekvens
8 kHz
Audio Channel
dual
Opptaksplattform
desktop
Lydformat
. Wav
Transkripsjonsformat
.json
Wer (%)
5
Datasett demografi
Land
Thailandsk
Språk
Thailandsk
Kjønn
Kvinne 338, Mann 96, Ukjent 8
Antall høyttalere
442
Alder
18-50
Oversikt
Tittel
Thailandsk Språkdatasett
Datasettype
Media -lyd
Beskrivelse
Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. – 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter.
Bruk sak
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasettdetaljer
Totalt antall timer
173
Eksempelfrekvens
16 kHz
Audio Channel
Mono
Opptaksplattform
Nettkilde
Lydformat
. Wav
Transkripsjonsformat
.json
Wer (%)
5
Datasett demografi
Land
Thailandsk
Språk
Thailandsk
Kjønn
Kvinne 143, Mann 502, Ukjent 26
Antall høyttalere
671
Alder
18-50
Utvalgte klienter
Gir teamene mulighet til å bygge verdensledende AI-produkter.
Finner du ikke det du leter etter?
Nye hylledatasett samles inn på tvers av alle datatyper
Kontakt oss nå for å gi slipp på bekymringene for innsamling av lyd-/taletreningsdata