Marathi-datasett

मराठी डेटासेट

Høykvalitets datasett for callsenter, generelle samtaler, manusbaserte monologer og media (podkaster) på marathi for AI og talemodeller

Oversikt

Tittel (språk)

Marathi-språkdatasett

Datasetttyper

Kundesenter, Generell samtale, Media (podkast), Skrevet monolog

Land

India

Tekniske beskrivelser

Dette datasettet inkluderer uskriptede syntetiske telefonsamtaler mellom agent og kunde (5–15 minutter), naturlige telefonsamtaler mellom mennesker (15–60 minutter) og sanglyd med transkripsjoner, og gir varierte taledata for trening og evaluering av tale- og språkteknologier.

Bruk sak

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datasettdetaljer

Datasettype Sampling Rate Høyttalere Kanal Totalt antall timer Totalt antall høyttalere
Call Center 8 kHz 2 høyttalere dual 70:28:58 634
Generell samtale 8 kHz 2 høyttalere dual 159:21:13 298
Mediedata 16 kHz Multipal-høyttalere Mono 24:09:24 94
Manuskriptmonolog 24 kHz Enkelt høyttaler Mono 3,900:00:00 På forespørsel

Utvalgte klienter

Gir teamene mulighet til å bygge verdensledende AI-produkter.

Amazon
Google
Microsoft
Shaip kontakt oss

Finner du ikke det du leter etter?

Nye hylledatasett samles inn på tvers av alle datatyper

Kontakt oss nå for å gi slipp på bekymringene for innsamling av lyd-/taletreningsdata

  • Dette feltet er for validering formål og bør stå uendret.
  • Ved å registrere meg godtar jeg Shaip Personvernerklæring og Våre vilkår og gi mitt samtykke til å motta B2B-markedsføringskommunikasjon fra Shaip.