Dansk Datasett
Dansk Datasæt
Dansk generell samtale-, TTS- og podcastdatasett av høy kvalitet for AI- og talemodeller
Oversikt
Tittel (språk)
Dansk språkdatasett
Datasetttyper
Kundesenter, generell samtale, mediedata (podkastdata), manusbasert monolog
Land
Danmark
Tekniske beskrivelser
Uskriptede telefonsamtaler mellom to personer er tilgjengelige med en omtrentlig varighet på 15 til 60 minutter. Lisenserbare lyd- eller videofiler som er offentlig eiendom, for eksempel intervjuer eller podkaster med 1 til 5 deltakere, varierer også fra 15 til 60 minutter. I tillegg varierer opptak av enkeltstående ytringer på dansk fra Danmark vanligvis fra 5 til 30 sekunder.
Bruk sak
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasettdetaljer
| Datasettype | Sampling Rate | Høyttalere | Kanal | Totalt antall timer | Totalt antall høyttalere |
|---|---|---|---|---|---|
| Call Center | 8 kHz | 2 høyttalere | Mono | 2,000:00:00 | På forespørsel |
| Generell samtale | 8 kHz | 2 høyttalere | dual | 356:29:47 | 700 |
| Mediedata | 16 kHz | Flere høyttalere | Mono | 665:16:30 | 1,261 |
| Manuskriptmonolog | 48 kHz | Enkelt høyttaler | Mono | 2,496:00:00 | 2,825 |
Utvalgte klienter
Gir teamene mulighet til å bygge verdensledende AI-produkter.
Finner du ikke det du leter etter?
Nye hylledatasett samles inn på tvers av alle datatyper
Kontakt oss nå for å gi slipp på bekymringene for innsamling av lyd-/taletreningsdata