Polsk datasett
Polsk datasett
Høykvalitets polske mediedata og manusbasert monolog for AI og talemodeller
Oversikt
Tittel (språk)
Polsk språkdatasett
Datasetttyper
Media (podkast), manusbasert monolog
Land
Polen
Tekniske beskrivelser
Dette datasettet inkluderer lisensierbare lyd- eller videofiler i det offentlige domene, som intervjuer og podkaster med 1 til 5 deltakere (15–60 minutter), sammen med manusbaserte monologer der én enkelt taler leverer forhåndsdefinert innhold for trening og evaluering av tale- og språkmodeller.
Bruk sak
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasettdetaljer
| Datasettype | Sampling Rate | Høyttalere | Kanal | Totalt antall timer | Totalt antall høyttalere |
|---|---|---|---|---|---|
| Mediedata | 16 kHz | Multipal-høyttalere | Mono | 268:56:51 | 532 |
| Manuskriptmonolog | 48 kHz | Enkelt høyttaler | Mono | 2,348:00:00 | 2,699 |
Utvalgte klienter
Gir teamene mulighet til å bygge verdensledende AI-produkter.
Finner du ikke det du leter etter?
Nye hylledatasett samles inn på tvers av alle datatyper
Kontakt oss nå for å gi slipp på bekymringene for innsamling av lyd-/taletreningsdata