Malayisk datasett
Angi data Melayu
Høykvalitets malaysisk callsenter, generell samtale og podcastdatasett for AI og talemodeller
Oversikt
Tittel (språk)
malayisk språkdatasett
Datasetttyper
Kundesenter, generell samtale, mediedata (podkastdata)
Land
Malaysia, Indonesia, Brunei og Singapore
Tekniske beskrivelser
Uskriptede telefonsamtaler mellom to personer på malayisk fra Malaysia er tilgjengelige med varigheter på 15 til 60 minutter, sammen med lisensierbare lyd- eller videofiler i offentlig eiendom, for eksempel intervjuer og podkaster med 1 til 5 deltakere, også fra 15 til 60 minutter.
Bruk sak
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasettdetaljer
| Datasettype | Sampling Rate | Høyttalere | Kanal | Totalt antall timer | Totalt antall høyttalere |
|---|---|---|---|---|---|
| Generell samtale | 8 kHz | 2 høyttalere | dual | 239:49:43 | 432 |
| Generell samtale | 48 kHz | 2 høyttalere | Mono | 90:19:23 | 140 |
| Mediedata | 16 kHz | Multipal-høyttalere | Mono | 343:57:16 | 907 |
| Call Center | 8 kHz | 2 høyttalere | Mono | 2,000:00:00 | På forespørsel |
Utvalgte klienter
Gir teamene mulighet til å bygge verdensledende AI-produkter.
Finner du ikke det du leter etter?
Nye hylledatasett samles inn på tvers av alle datatyper
Kontakt oss nå for å gi slipp på bekymringene for innsamling av lyd-/taletreningsdata