Koreansk datasett
한국어 데이터셋
Høykvalitets koreansk callsenter, skriptbasert monolog og mediedatasett (podkast) for AI og talemodeller
Oversikt
Tittel (språk)
Koreansk språkdatasett
Datasetttyper
Kundesenter, mediedata, manusmonolog
Land
Korea
Tekniske beskrivelser
Dette datasettet inkluderer uskriptede telefonsamtaler mellom syntetiske agenter og kunder (5–15 minutter), lisensierbare lyd-/videofiler i det offentlige domene, som intervjuer og podkaster med 1 til 5 deltakere (15–60 minutter), og skriptede monologer med én enkelt taler som leverer forhåndsdefinert innhold for trening i tale- og språkmodeller.
Bruk sak
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasettdetaljer
| Datasettype | Sampling Rate | Høyttalere | Kanal | Totalt antall timer | Totalt antall høyttalere |
|---|---|---|---|---|---|
| Call Center | 8 kHz | 2 høyttalere | dual | 102:27:55 | 1,244 |
| Mediedata | 16 kHz | Flere høyttalere | Mono | 203:46:54 | 397 |
| Manuskriptmonolog | 24 kHz | Enkelt høyttaler | Mono | 500:00:00 | På forespørsel |
| Manuskriptmonolog | 48 kHz | Enkelt høyttaler | Mono | 1,955:00:00 | På forespørsel |
Utvalgte klienter
Gir teamene mulighet til å bygge verdensledende AI-produkter.
Finner du ikke det du leter etter?
Nye hylledatasett samles inn på tvers av alle datatyper
Kontakt oss nå for å gi slipp på bekymringene for innsamling av lyd-/taletreningsdata