Punjabi-datasett

ਪੰਜਾਬੀ ਡਾਟਾਸੈਟ

Høykvalitets datasett for punjabisk callsenter, generell samtale og media (podkast) for AI- og talemodeller

Oversikt

Tittel (språk)

Punjabi-språkdatasett

Datasetttyper

Kundesenter, generell samtale, mediedata (podkastdata)

Land

India

Tekniske beskrivelser

Uskriptede, syntetiske telefonsamtaler mellom en agent og en kunde er tilgjengelige med en omtrentlig varighet fra 5 til 15 minutter. I tillegg er lisensierbare lyd- eller videofiler i offentlig eiendom, for eksempel intervjuer, podkaster og lignende innhold som involverer 1 til 5 deltakere, tilgjengelige med en omtrentlig varighet fra 15 til 60 minutter.

Bruk sak

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datasettdetaljer

Datasettype Sampling Rate Høyttalere Kanal Totalt antall timer Totalt antall høyttalere
Call Center 48 kHz 2 høyttalere dual 66:04:45 788
Generell samtale 8 kHz 2 høyttalere dual 64:31:42 310
Mediedata 16 kHz Flere høyttalere Mono 11:27:33 44

Utvalgte klienter

Gir teamene mulighet til å bygge verdensledende AI-produkter.

Amazon
Google
Microsoft
Shaip kontakt oss

Finner du ikke det du leter etter?

Nye hylledatasett samles inn på tvers av alle datatyper

Kontakt oss nå for å gi slipp på bekymringene for innsamling av lyd-/taletreningsdata

  • Dette feltet er for validering formål og bør stå uendret.
  • Ved å registrere meg godtar jeg Shaip Personvernerklæring og Våre vilkår og gi mitt samtykke til å motta B2B-markedsføringskommunikasjon fra Shaip.