Arabisk datasett

مجموعة البيانات العربية

Høykvalitets arabisk generell samtale og tekst-til-tale (TTS) for AI og talemodeller

Oversikt

Tittel (språk)

Arabisk språkdatasett

Datasetttyper

Kundesenter, Generell samtale, Musikk, Manusmonolog

Land

Arabisk

Tekniske beskrivelser

Dette datasettet inkluderer uskriptede syntetiske agent-kunde-telefonsamtaler (5–15 minutter), naturlige menneske-til-menneske-telefonsamtaler på gulf-arabisk (15–60 minutter) og sanglyd med transkripsjoner, og gir varierte taledata for trening og evaluering av tale- og språkteknologier.

Bruk sak

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datasettdetaljer

Datasettype Sampling Rate Høyttalere Kanal Totalt antall timer Totalt antall høyttalere
Call Center 8 kHz 2 høyttalere dual 62:52:19 På forespørsel
Call Center 8 kHz 2 høyttalere Mono 1,025:09:19 På forespørsel
Generell samtale 8 kHz 2 høyttalere dual 254:16:34 626
musikk 48 kHz Enkelt høyttaler Mono 03:17:21 10
Manuskriptmonolog 48 kHz Enkelt høyttaler Mono 4,249:00:00 2,125
Manuskriptmonolog 24 kHz Enkelt høyttaler Mono 2,300:00:00 På forespørsel

Utvalgte klienter

Gir teamene mulighet til å bygge verdensledende AI-produkter.

Amazon
Google
Microsoft
Shaip kontakt oss

Finner du ikke det du leter etter?

Nye hylledatasett samles inn på tvers av alle datatyper

Kontakt oss nå for å gi slipp på bekymringene for innsamling av lyd-/taletreningsdata

  • Dette feltet er for validering formål og bør stå uendret.
  • Ved å registrere meg godtar jeg Shaip Personvernerklæring og Våre vilkår og gi mitt samtykke til å motta B2B-markedsføringskommunikasjon fra Shaip.