amerikansk engelsk datasett

Høykvalitets amerikansk engelsk datasett for AI og talemodeller

Oversikt

Tittel (språk)

Datasett for amerikansk engelsk språk

Datasetttyper

Kundesenter, Media (Podcast), Medisinsk

Land

Forente Stater

Tekniske beskrivelser

Dette datasettet inkluderer uskriptede syntetiske agent-kunde-samtaler (5–15 minutter), lisensierbare lyd- eller videofiler i offentlig eiendom, for eksempel intervjuer og podkaster med 1 til 5 deltakere (15–60 minutter), samt medie- og medisinske datasetttyper for omfattende forskning på tale og språk.

Bruk sak

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datasettdetaljer

Datasettype Sampling Rate Høyttalere Kanal Totalt antall timer Totalt antall høyttalere
Call Center 8 kHz 2 høyttalere Mono 10,196:00:00 1,052
Call Center 8 kHz 2 høyttalere dual 597:26:43 På forespørsel
Mediedata 16 kHz Flere høyttalere Mono 620:23:43 5,466
Medisinsk 8 kHz 2 høyttalere Mono 1,480:30:33 697

Utvalgte klienter

Gir teamene mulighet til å bygge verdensledende AI-produkter.

Amazon
Google
Microsoft
Shaip kontakt oss

Finner du ikke det du leter etter?

Nye hylledatasett samles inn på tvers av alle datatyper

Kontakt oss nå for å gi slipp på bekymringene for innsamling av lyd-/taletreningsdata

  • Dette feltet er for validering formål og bør stå uendret.
  • Ved å registrere meg godtar jeg Shaip Personvernerklæring og Våre vilkår og gi mitt samtykke til å motta B2B-markedsføringskommunikasjon fra Shaip.