Telugu-datasett

తెలుగు డేటాసెట్‌లు

Høykvalitets telugu-kundesenter, generelle samtaler, manusbaserte monologer og mediedatasett (podkaster) for AI og talemodeller

Oversikt

Tittel (språk)

Telgu-språkdatasett

Datasetttyper

Kundesenter, Generell samtale, Musikk, Manusmonolog

Land

India

Tekniske beskrivelser

Dette datasettet inkluderer uskriptede syntetiske agent-kunde-samtaler (5–15 minutter), naturlige telefonsamtaler mellom mennesker (15–60 minutter) og mediedata med transkripsjoner, og tilbyr varierte taledata for trening og evaluering av tale- og språkteknologier.

Bruk sak

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datasettdetaljer

Datasettype Sampling Rate Høyttalere Kanal Totalt antall timer Totalt antall høyttalere
Call Center 8 kHz 2 høyttalere dual 62:32:27 496
Generell samtale 8 kHz 2 høyttalere dual 654:08:03 1,601
Mediedata 16 kHz Flere høyttalere Mono 666:24:29 1,230
Manuskriptmonolog 24 kHz Enkelt høyttaler Mono 1,700:00:00 På forespørsel

Utvalgte klienter

Gir teamene mulighet til å bygge verdensledende AI-produkter.

Amazon
Google
Microsoft
Shaip kontakt oss

Finner du ikke det du leter etter?

Nye hylledatasett samles inn på tvers av alle datatyper

Kontakt oss nå for å gi slipp på bekymringene for innsamling av lyd-/taletreningsdata

  • Dette feltet er for validering formål og bør stå uendret.
  • Ved å registrere meg godtar jeg Shaip Personvernerklæring og Våre vilkår og gi mitt samtykke til å motta B2B-markedsføringskommunikasjon fra Shaip.