Polsk datasett

Polsk datasett

Høykvalitets polske mediedata og manusbasert monolog for AI og talemodeller

Oversikt

Tittel (språk)

Polsk språkdatasett

Datasetttyper

Media (podkast), manusbasert monolog

Land

Polen

Tekniske beskrivelser

Dette datasettet inkluderer lisensierbare lyd- eller videofiler i det offentlige domene, som intervjuer og podkaster med 1 til 5 deltakere (15–60 minutter), sammen med manusbaserte monologer der én enkelt taler leverer forhåndsdefinert innhold for trening og evaluering av tale- og språkmodeller.

Bruk sak

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datasettdetaljer

Datasettype Sampling Rate Høyttalere Kanal Totalt antall timer Totalt antall høyttalere
Mediedata 16 kHz Multipal-høyttalere Mono 268:56:51 532
Manuskriptmonolog 48 kHz Enkelt høyttaler Mono 2,348:00:00 2,699

Utvalgte klienter

Gir teamene mulighet til å bygge verdensledende AI-produkter.

Amazon
Google
Microsoft
Shaip kontakt oss

Finner du ikke det du leter etter?

Nye hylledatasett samles inn på tvers av alle datatyper

Kontakt oss nå for å gi slipp på bekymringene for innsamling av lyd-/taletreningsdata

  • Dette feltet er for validering formål og bør stå uendret.
  • Ved å registrere meg godtar jeg Shaip Personvernerklæring og Våre vilkår og gi mitt samtykke til å motta B2B-markedsføringskommunikasjon fra Shaip.