Vietnamesisk datasett
Bộ dữ liệu tiếng Việt
Oversikt
Tittel
vietnamesisk Språkdatasett
Datasettype
Generell samtale
Beskrivelse
Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, nordlig (f.eks. Hanoi), sentral og sørlig (f.eks. Ho Chi Minh-byen).
Bruk sak
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasettdetaljer
Totalt antall timer
295
Eksempelfrekvens
8 kHz
Audio Channel
dual
Opptaksplattform
desktop
Lydformat
. Wav
Transkripsjonsformat
.json
Wer (%)
5
Datasett demografi
Land
vietnamesisk
Språk
vietnamesisk
Kjønn
Kvinne 400, mann 380, Ukjente 2
Antall høyttalere
782
Alder
18-50
Oversikt
Tittel
vietnamesisk Språkdatasett
Datasettype
Media -lyd
Beskrivelse
Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. – 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter
Bruk sak
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasettdetaljer
Totalt antall timer
257
Eksempelfrekvens
16 kHz
Audio Channel
Mono
Opptaksplattform
Nettkilde
Lydformat
. Wav
Transkripsjonsformat
.json
Wer (%)
5
Datasett demografi
Land
vietnamesisk
Språk
vietnamesisk
Kjønn
Kvinne 249, mann 200, Ukjente 45
Antall høyttalere
494
Alder
18-50
Utvalgte klienter
Gir teamene mulighet til å bygge verdensledende AI-produkter.
Finner du ikke det du leter etter?
Nye hylledatasett samles inn på tvers av alle datatyper
Kontakt oss nå for å gi slipp på bekymringene for innsamling av lyd-/taletreningsdata