Engelsk Deep South Datasett
Høykvalitets engelsk Deep South Call-Center, generell samtale og podcast-datasett for AI- og talemodeller
Oversikt
Tittel (språk)
Engelsk Deep South språkdatasett
Datasetttyper
Kundesenter, generell samtale, mediedata (podkast)
Land
Sør-USA
Tekniske beskrivelser
Uskriptede syntetiske telefonsamtaler mellom en agent og en kunde er tilgjengelige med varigheter på 5 til 15 minutter, mens uskriptede telefonsamtaler mellom to personer vanligvis varierer fra 15 til 60 minutter. I tillegg er lisensierbare lyd- eller videofiler som er offentlig eiendom, for eksempel intervjuer eller podkaster med 1 til 5 deltakere, også tilgjengelige i området 15 til 60 minutter.
Bruk sak
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasettdetaljer
| Datasettype | Sampling Rate | Høyttalere | Kanal | Totalt antall timer | Totalt antall høyttalere |
|---|---|---|---|---|---|
| Call Center | 8 kHz | 2 høyttalere | dual | 266:44:22 | 634 |
| Generell samtale | 8 kHz | 2 høyttalere | dual | 197:25:07 | 1,490 |
| Mediedata | 16 kHz | Flere høyttalere | Mono | 261:20:58 | 565 |
Utvalgte klienter
Gir teamene mulighet til å bygge verdensledende AI-produkter.
Finner du ikke det du leter etter?
Nye hylledatasett samles inn på tvers av alle datatyper
Kontakt oss nå for å gi slipp på bekymringene for innsamling av lyd-/taletreningsdata
Oversikt
Tittel
Engelsk Deep South Språkdatasett
Datasettype
Callcenter
Tekniske beskrivelser
Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5-15 minutter.
Bruk sak
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasettdetaljer
Totalt antall timer
151
Eksempelfrekvens
8 kHz
Audio Channel
dual
Opptaksplattform
desktop
Lydformat
. Wav
Transkripsjonsformat
.json
Wer (%)
5
Datasett demografi
Land
Engelsk Deep South
Språk
Engelsk Deep South
Kjønn
Kvinne 221, Mann 1004, Ukjent 7
Antall høyttalere
1,232
Alder
18-50
Oversikt
Tittel
Engelsk Deep South Språkdatasett
Datasettype
Generell samtale
Tekniske beskrivelser
Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (rekkevidde) – 15-60 minutter.
Bruk sak
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasettdetaljer
Totalt antall timer
56
Eksempelfrekvens
8 kHz
Audio Channel
dual
Opptaksplattform
desktop
Lydformat
. Wav
Transkripsjonsformat
.json
Wer (%)
5
Datasett demografi
Land
Engelsk Deep South
Språk
Engelsk Deep South
Kjønn
Kvinne 99, Mann 31, Ukjent 0
Antall høyttalere
130
Alder
18-50
Oversikt
Tittel
Engelsk Deep South Språkdatasett
Datasettype
Podcast
Tekniske beskrivelser
Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. – 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter.
Bruk sak
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasettdetaljer
Totalt antall timer
266
Eksempelfrekvens
16 kHz
Audio Channel
Mono
Opptaksplattform
Nettkilde
Lydformat
. Wav
Transkripsjonsformat
.json
Wer (%)
5
Datasett demografi
Land
Engelsk Deep South
Språk
Engelsk Deep South
Kjønn
Kvinne 204, Mann 356, Ukjent 21
Antall høyttalere
581
Alder
18-50