Indonesisk datasett
Kumpulan Data Indonesia
Oversikt
Tittel
Indonesisk Språkdatasett
Datasettype
Generell samtale
Beskrivelse
Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (rekkevidde) – 15–60 minutter, indonesisk.
Bruk sak
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasettdetaljer
Totalt antall timer
496
Eksempelfrekvens
8 kHz
Audio Channel
dual
Opptaksplattform
desktop
Lydformat
. Wav
Transkripsjonsformat
.json
Wer (%)
5
Datasett demografi
Land
Indonesia
Språk
Indonesisk
Kjønn
Kvinne 524, Mann 454, Ukjent 2
Antall høyttalere
980
Alder
18-50
Oversikt
Tittel
Indonesisk Språkdatasett
Datasettype
Media -lyd
Beskrivelse
Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. – 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter.
Bruk sak
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasettdetaljer
Totalt antall timer
643
Eksempelfrekvens
16 kHz
Audio Channel
Mono
Opptaksplattform
Nettkilde
Lydformat
. Wav
Transkripsjonsformat
.json
Wer (%)
5
Datasett demografi
Land
Indonesia
Språk
Indonesisk
Kjønn
Kvinne 746, Mann 1507, Ukjent 129
Antall høyttalere
2,382
Alder
18-50
Utvalgte klienter
Gir teamene mulighet til å bygge verdensledende AI-produkter.
Finner du ikke det du leter etter?
Nye hylledatasett samles inn på tvers av alle datatyper
Kontakt oss nå for å gi slipp på bekymringene for innsamling av lyd-/taletreningsdata