Thai datasett

ชุดข้อมูลภาษาไทย

Høykvalitets thailandske generelle samtaler, manusbaserte monologer og mediedatasett (podkaster) for AI og talemodeller

Oversikt

Tittel (språk)

Datasett for thailandsk språk

Datasetttyper

Generell samtale, media (podkast), manusbasert monolog

Land

Thailand

Tekniske beskrivelser

Dette datasettet inkluderer uskriptede telefonsamtaler mellom to personer på hebraisk fra Israel (15–60 minutter), lisensierbare lyd- eller videofiler som er offentlig eiendom med 1 til 5 deltakere (15–60 minutter), og skriptede monologer der én enkelt taler leverer forhåndsdefinert innhold for trening og evaluering av tale- og språkmodeller.

Bruk sak

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datasettdetaljer

Datasettype Sampling Rate Høyttalere Kanal Totalt antall timer Totalt antall høyttalere
Generell samtale 8 kHz 2 høyttalere dual 211:48:42 170
Mediedata 16 kHz Enkelt høyttaler Mono 249:14:31 670
Manuskriptmonolog 24 kHz Enkelt høyttaler Mono 500:00:00 På forespørsel

Utvalgte klienter

Gir teamene mulighet til å bygge verdensledende AI-produkter.

Amazon
Google
Microsoft
Shaip kontakt oss

Finner du ikke det du leter etter?

Nye hylledatasett samles inn på tvers av alle datatyper

Kontakt oss nå for å gi slipp på bekymringene for innsamling av lyd-/taletreningsdata

  • Dette feltet er for validering formål og bør stå uendret.
  • Ved å registrere meg godtar jeg Shaip Personvernerklæring og Våre vilkår og gi mitt samtykke til å motta B2B-markedsføringskommunikasjon fra Shaip.