Hindi datasett

हिंदी डेटासेट

Høykvalitets hindi-datasett for callsenter, generell samtale og podkaster for AI- og ASR-modeller

Oversikt

Tittel (språk)

Datasett for hindi-språk

Datasetttyper

Kundesenter, Generell samtale, Media (podkast), Skrevet monolog

Land

India

Tekniske beskrivelser

Uskriptede telefonsamtaler mellom to personer er tilgjengelige med varigheter på 15 til 60 minutter, sammen med lisensierbare lyd- eller videofiler som er offentlig eiendom, for eksempel intervjuer og podkaster med 1 til 5 deltakere i samme område. I tillegg varer opptak av enkeltstående ytringer vanligvis 5 til 30 sekunder, og skriptede monologdata er også tilgjengelig.

Bruk sak

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datasettdetaljer

Datasettype Sampling Rate Høyttalere Kanal Totalt antall timer Totalt antall høyttalere
Call Center 8 kHz 2 høyttalere dual 70:45:51 På forespørsel
Call Center 8 kHz 2 høyttalere Mono 20,000:00:00 På forespørsel
Call Center 16 kHz 2 høyttalere Mono 29:17:20 261
Call Center 16 kHz 2 høyttalere dual 400:27:10 1200
Generell samtale 8 kHz 2 høyttalere dual 47:48:40 224
Mediedata 16 kHz Flere høyttalere Mono 227:57:43 438
Manuskriptmonolog 48 kHz Enkelt høyttaler Mono 2,866:00:00 3,988
Manuskriptmonolog 24 kHz Enkelt høyttaler Mono 29,000:00:00 På forespørsel

Utvalgte klienter

Gir teamene mulighet til å bygge verdensledende AI-produkter.

Amazon
Google
Microsoft
Shaip kontakt oss

Finner du ikke det du leter etter?

Nye hylledatasett samles inn på tvers av alle datatyper

Kontakt oss nå for å gi slipp på bekymringene for innsamling av lyd-/taletreningsdata

  • Dette feltet er for validering formål og bør stå uendret.
  • Ved å registrere meg godtar jeg Shaip Personvernerklæring og Våre vilkår og gi mitt samtykke til å motta B2B-markedsføringskommunikasjon fra Shaip.