Swahili-datasett
Hifadhidata ya Kiswahili
Swahili Call-Center og Podcast-datasett av høy kvalitet for AI- og talemodeller
Oversikt
Tittel
swahili Språkdatasett
Datasettype
Callcenter
Beskrivelse
Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5-15 minutter.
Bruk sak
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasettdetaljer
Totalt antall timer
230
Eksempelfrekvens
8 kHz
Audio Channel
dual
Opptaksplattform
desktop
Lydformat
. Wav
Transkripsjonsformat
.json
Wer (%)
5
Datasett demografi
Land
swahili
Språk
swahili
Kjønn
Kvinne 611, Mann 833, Ukjent 0
Antall høyttalere
1,444
Alder
18-50
Oversikt
Tittel
swahili Språkdatasett
Datasettype
Podcast
Beskrivelse
Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. – 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter.
Bruk sak
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasettdetaljer
Totalt antall timer
265
Eksempelfrekvens
16 kHz
Audio Channel
Mono
Opptaksplattform
Nettkilde
Lydformat
. Wav
Transkripsjonsformat
.json
Wer (%)
5
Datasett demografi
Land
swahili
Språk
swahili
Kjønn
Kvinne 118, Mann 493, Ukjent 25
Antall høyttalere
636
Alder
18-50
Utvalgte klienter
Gir teamene mulighet til å bygge verdensledende AI-produkter.

Finner du ikke det du leter etter?
Nye hylledatasett samles inn på tvers av alle datatyper
Kontakt oss nå for å gi slipp på bekymringene for innsamling av lyd-/taletreningsdata