Punjabi-datasett
ਪੰਜਾਬੀ ਡਾਟਾਸੈਟ
Høykvalitets datasett for punjabisk callsenter, generell samtale og media (podkast) for AI- og talemodeller
Oversikt
Tittel (språk)
Punjabi-språkdatasett
Datasetttyper
Kundesenter, generell samtale, mediedata (podkastdata)
Land
India
Tekniske beskrivelser
Uskriptede, syntetiske telefonsamtaler mellom en agent og en kunde er tilgjengelige med en omtrentlig varighet fra 5 til 15 minutter. I tillegg er lisensierbare lyd- eller videofiler i offentlig eiendom, for eksempel intervjuer, podkaster og lignende innhold som involverer 1 til 5 deltakere, tilgjengelige med en omtrentlig varighet fra 15 til 60 minutter.
Bruk sak
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasettdetaljer
| Datasettype | Sampling Rate | Høyttalere | Kanal | Totalt antall timer | Totalt antall høyttalere |
|---|---|---|---|---|---|
| Call Center | 48 kHz | 2 høyttalere | dual | 66:04:45 | 788 |
| Generell samtale | 8 kHz | 2 høyttalere | dual | 64:31:42 | 310 |
| Mediedata | 16 kHz | Flere høyttalere | Mono | 11:27:33 | 44 |
Utvalgte klienter
Gir teamene mulighet til å bygge verdensledende AI-produkter.
Finner du ikke det du leter etter?
Nye hylledatasett samles inn på tvers av alle datatyper
Kontakt oss nå for å gi slipp på bekymringene for innsamling av lyd-/taletreningsdata