Arabisk datasett
مجموعة البيانات العربية
Høykvalitets arabisk generell samtale og tekst-til-tale (TTS) for AI og talemodeller
Oversikt
Tittel (språk)
Arabisk språkdatasett
Datasetttyper
Kundesenter, Generell samtale, Musikk, Manusmonolog
Land
Arabisk
Tekniske beskrivelser
Dette datasettet inkluderer uskriptede syntetiske agent-kunde-telefonsamtaler (5–15 minutter), naturlige menneske-til-menneske-telefonsamtaler på gulf-arabisk (15–60 minutter) og sanglyd med transkripsjoner, og gir varierte taledata for trening og evaluering av tale- og språkteknologier.
Bruk sak
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasettdetaljer
| Datasettype | Sampling Rate | Høyttalere | Kanal | Totalt antall timer | Totalt antall høyttalere |
|---|---|---|---|---|---|
| Call Center | 8 kHz | 2 høyttalere | dual | 62:52:19 | På forespørsel |
| Call Center | 8 kHz | 2 høyttalere | Mono | 1,025:09:19 | På forespørsel |
| Generell samtale | 8 kHz | 2 høyttalere | dual | 254:16:34 | 626 |
| musikk | 48 kHz | Enkelt høyttaler | Mono | 03:17:21 | 10 |
| Manuskriptmonolog | 48 kHz | Enkelt høyttaler | Mono | 4,249:00:00 | 2,125 |
| Manuskriptmonolog | 24 kHz | Enkelt høyttaler | Mono | 2,300:00:00 | På forespørsel |
Utvalgte klienter
Gir teamene mulighet til å bygge verdensledende AI-produkter.
Finner du ikke det du leter etter?
Nye hylledatasett samles inn på tvers av alle datatyper
Kontakt oss nå for å gi slipp på bekymringene for innsamling av lyd-/taletreningsdata