Kinesisk datasett

简体中文数据集

Høykvalitets kinesisk datasett for AI og talemodeller

Oversikt

Tittel (språk)

Kinesisk språkdatasett

Datasetttyper

Kundesenter, musikk, manusbasert monolog, mediedata (podkastdata)

Land

Kina

Tekniske beskrivelser

Dette datasettet inkluderer uskriptede syntetiske telefonsamtaler mellom agent og kunde (5–15 minutter), naturlige telefonsamtaler mellom mennesker (15–60 minutter) og sanglyd med transkripsjoner, og gir varierte taledata for trening og evaluering av tale- og språkteknologier.

Bruk sak

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datasettdetaljer

Språk Datasettype Sampling Rate Høyttalere Kanal Totalt antall timer Totalt antall høyttalere
Kinesisk sang musikk 48 kHz Enkelt høyttaler Mono 06:11:32 10
Kinesisk (tradisjonell) Manuskriptmonolog 48 kHz Enkelt høyttaler Mono 1,499:00:00 1,805
Kinesisk aksent engelsk Mediedata 16 kHz Flere høyttalere Mono 306:04:58 2,130
Kinesisk med enkle tegn Manuskriptmonolog 48 kHz Enkelt høyttaler Mono 2,761:00:00 3,725
Kinesisk med amerikansk aksent og engelsk Call Center 8 kHz 2 høyttalere dual 152:18:33 2,058
Kinesisk med amerikansk aksent og engelsk Mediedata 16 kHz Flere høyttalere Mono 245:55:15 468

Utvalgte klienter

Gir teamene mulighet til å bygge verdensledende AI-produkter.

Shaip kontakt oss

Finner du ikke det du leter etter?

Nye hylledatasett samles inn på tvers av alle datatyper

Kontakt oss nå for å gi slipp på bekymringene for innsamling av lyd-/taletreningsdata

  • Dette feltet er for validering formål og bør stå uendret.
  • Ved å registrere meg godtar jeg Shaip Personvernerklæring og Våre vilkår og gi mitt samtykke til å motta B2B-markedsføringskommunikasjon fra Shaip.