Arabisk datasett

مجموعة البيانات العربية

Arabisk generell samtale av høy kvalitet og podcastdatasett for AI- og talemodeller

Oversikt

Tittel

Arabisk språkdatasett

Datasettype

Generell samtale

Beskrivelse

Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) – 15-60 minutter, arabisk fra Gulf-landene.

Bruk sak

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datasettdetaljer

Totalt antall timer

292

Eksempelfrekvens

8 kHz

Audio Channel

dual

Opptaksplattform

desktop

Lydformat

. Wav

Transkripsjonsformat

.json

Wer (%)

5

Datasett demografi

Land

Arabisk

Språk

Arabisk

Kjønn

Kvinne 838 Mann 1209 Ukjent 78

Antall høyttalere

706

Alder

18-50

Oversikt

Tittel

Arabisk språkdatasett

Datasettype

TTS

Beskrivelse

Enkelttaleopptak, som har en tendens til å falle i området 5 til 30 sekunder.

Bruk sak

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datasettdetaljer

Totalt antall timer

1,947

Eksempelfrekvens

48 kHz

Audio Channel

Mono

Opptaksplattform

Mobile App

Lydformat

. Wav

Transkripsjonsformat

.json

Wer (%)

5

Datasett demografi

Land

Arabisk

Språk

Arabisk

Kjønn

Kvinne 838 Mann 1209 Ukjent 78

Antall høyttalere

2,125

Alder

18-50

Utvalgte klienter

Gir teamene mulighet til å bygge verdensledende AI-produkter.

Amazon
Google
Microsoft
Shaip kontakt oss

Finner du ikke det du leter etter?

Nye hylledatasett samles inn på tvers av alle datatyper

Kontakt oss nå for å gi slipp på bekymringene for innsamling av lyd-/taletreningsdata

  • Ved å registrere meg godtar jeg Shaip Personvernerklæring og Våre vilkår og gi mitt samtykke til å motta B2B-markedsføringskommunikasjon fra Shaip.
  • Dette feltet er for validering formål og bør stå uendret.