Hebraisk datasett
Norsk data
Høykvalitets hebraisk generell samtale- og podcastdatasett for AI- og talemodeller
Oversikt
Tittel (språk)
Datasett for hebraisk språk
Datasetttyper
Generell samtale, mediedata
Land
Israel
Tekniske beskrivelser
Uskriptede telefonsamtaler mellom to personer på hebraisk fra Israel er tilgjengelige med varigheter på 15 til 60 minutter, sammen med lisensierbare lyd- eller videofiler som er offentlig eiendom, for eksempel intervjuer og podkaster med 1 til 5 deltakere, også fra 15 til 60 minutter.
Bruk sak
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasettdetaljer
| Datasettype | Sampling Rate | Høyttalere | Kanal | Totalt antall timer | Totalt antall høyttalere |
|---|---|---|---|---|---|
| Generell samtale | 8 kHz | 2 høyttalere | dual | 398:47:10 | 814 |
| Mediedata | 16 kHz | Flere høyttalere | Mono | 426:14:16 | 885 |
Utvalgte klienter
Gir teamene mulighet til å bygge verdensledende AI-produkter.
Finner du ikke det du leter etter?
Nye hylledatasett samles inn på tvers av alle datatyper
Kontakt oss nå for å gi slipp på bekymringene for innsamling av lyd-/taletreningsdata
Oversikt
Tittel
hebraisk Språkdatasett
Datasettype
Generell samtale
Tekniske beskrivelser
Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) – 15-60 minutter, hebraisk i Israel.
Bruk sak
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasettdetaljer
Totalt antall timer
399
Eksempelfrekvens
8 kHz
Audio Channel
dual
Opptaksplattform
desktop
Lydformat
. Wav
Transkripsjonsformat
.json
Wer (%)
5
Datasett demografi
Land
Israel
Språk
hebraisk
Kjønn
Kvinne 414, Mann 399, Ukjent 1
Antall høyttalere
814
Alder
18-50
Oversikt
Tittel
hebraisk Språkdatasett
Datasettype
Podcast
Tekniske beskrivelser
Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. – 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter.
Bruk sak
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasettdetaljer
Totalt antall timer
427
Eksempelfrekvens
16 kHz
Audio Channel
Mono
Opptaksplattform
Nettkilde
Lydformat
. Wav
Transkripsjonsformat
.json
Wer (%)
5
Datasett demografi
Land
Israel
Språk
hebraisk
Kjønn
Kvinne 361, Mann 513, Ukjent 13
Antall høyttalere
887
Alder
18-50