Dansk Datasett

Dansk Datasæt

Dansk generell samtale-, TTS- og podcastdatasett av høy kvalitet for AI- og talemodeller

Oversikt

Tittel (språk)

Dansk språkdatasett

Datasetttyper

Kundesenter, generell samtale, mediedata (podkastdata), manusbasert monolog

Land

Danmark

Tekniske beskrivelser

Uskriptede telefonsamtaler mellom to personer er tilgjengelige med en omtrentlig varighet på 15 til 60 minutter. Lisenserbare lyd- eller videofiler som er offentlig eiendom, for eksempel intervjuer eller podkaster med 1 til 5 deltakere, varierer også fra 15 til 60 minutter. I tillegg varierer opptak av enkeltstående ytringer på dansk fra Danmark vanligvis fra 5 til 30 sekunder.

Bruk sak

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datasettdetaljer

Datasettype Sampling Rate Høyttalere Kanal Totalt antall timer Totalt antall høyttalere
Call Center 8 kHz 2 høyttalere Mono 2,000:00:00 På forespørsel
Generell samtale 8 kHz 2 høyttalere dual 356:29:47 700
Mediedata 16 kHz Flere høyttalere Mono 665:16:30 1,261
Manuskriptmonolog 48 kHz Enkelt høyttaler Mono 2,496:00:00 2,825

Utvalgte klienter

Gir teamene mulighet til å bygge verdensledende AI-produkter.

Amazon
Google
Microsoft
Shaip kontakt oss

Finner du ikke det du leter etter?

Nye hylledatasett samles inn på tvers av alle datatyper

Kontakt oss nå for å gi slipp på bekymringene for innsamling av lyd-/taletreningsdata

  • Dette feltet er for validering formål og bør stå uendret.
  • Ved å registrere meg godtar jeg Shaip Personvernerklæring og Våre vilkår og gi mitt samtykke til å motta B2B-markedsføringskommunikasjon fra Shaip.