Koreansk datasett

한국어 데이터셋

Høykvalitets koreansk callsenter, skriptbasert monolog og mediedatasett (podkast) for AI og talemodeller

Oversikt

Tittel (språk)

Koreansk språkdatasett

Datasetttyper

Kundesenter, mediedata, manusmonolog

Land

Korea

Tekniske beskrivelser

Dette datasettet inkluderer uskriptede telefonsamtaler mellom syntetiske agenter og kunder (5–15 minutter), lisensierbare lyd-/videofiler i det offentlige domene, som intervjuer og podkaster med 1 til 5 deltakere (15–60 minutter), og skriptede monologer med én enkelt taler som leverer forhåndsdefinert innhold for trening i tale- og språkmodeller.

Bruk sak

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datasettdetaljer

Datasettype Sampling Rate Høyttalere Kanal Totalt antall timer Totalt antall høyttalere
Call Center 8 kHz 2 høyttalere dual 102:27:55 1,244
Mediedata 16 kHz Flere høyttalere Mono 203:46:54 397
Manuskriptmonolog 24 kHz Enkelt høyttaler Mono 500:00:00 På forespørsel
Manuskriptmonolog 48 kHz Enkelt høyttaler Mono 1,955:00:00 På forespørsel

Utvalgte klienter

Gir teamene mulighet til å bygge verdensledende AI-produkter.

Amazon
Google
Microsoft
Shaip kontakt oss

Finner du ikke det du leter etter?

Nye hylledatasett samles inn på tvers av alle datatyper

Kontakt oss nå for å gi slipp på bekymringene for innsamling av lyd-/taletreningsdata

  • Dette feltet er for validering formål og bør stå uendret.
  • Ved å registrere meg godtar jeg Shaip Personvernerklæring og Våre vilkår og gi mitt samtykke til å motta B2B-markedsføringskommunikasjon fra Shaip.