Få nå 50% AV* på Conversational AI Off-the-Shelf Datasett

Tale- og lyddatasett for chatbots, taleassistenter, taleaktiverte enheter.

*Begrenset periodetilbud

  • Ved Ã¥ registrere meg godtar jeg Shaip Personvernserklæring og VÃ¥re vilkÃ¥r og gi mitt samtykke til Ã¥ motta B2B-markedsføringskommunikasjon fra Shaip.

Godkjent av industriledere

DetaljerHyllevare språkdatasettCall Center-samtaler 8khz*Generiske samtaler 8khz*Media og podcaster 16khz*Ytring/ scripted monolog 16khz*Totalt volum i timerDialekter dekketLydformatTeksttranskripsjonsformatBruk sakkildeCTA
TaleafrikaansAfrikaans lyddatasett6009001500Afrikaans snakket i Afrika. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleArabiskArabisk lyddatasett80015002300Arabisk fra Gulf-landene. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TalekinesiskKinesisk lyddatasett20002000kinesere fra Kina. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleDanskDansk lyddatasett40060020003000Dansk fra Danmark. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleDutchNederlandsk lyddatasett20002000nederlandsk fra Nederland. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleEngelsk - AAVE AccentEngelsk - AAVE (African American Vernacular English) lyddatasett5005001000Den folkelige varianten (noen ganger kjent som AAVE, vanligvis snakket av det store flertallet av afroamerikanere i arbeider- og middelklassen) og den mer standard varianten (vanligvis snakket av middelklasse afroamerikanere i formelle og offentlige situasjoner), men med sterkere vekt på folkemunne.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleEngelsk - Boston/New York AccentEngelsk - Boston/New York lyddatasett225225350800Dette er en samling av flere regionale aksenter som snakkes i og rundt byene Boston, New York og Philadelphia. Disse aksentene kan høres ut som ikke-lokalbefolkningen, men er forskjellige fra andre amerikanske aksenter. Til tross for noe lokalt vokabular som er forskjellig fra andre deler av den engelsktalende verden, er disse aksentene gjensidig forståelige med engelsk som snakkes andre steder.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleEngelsk - kinesisk aksentEngelsk - kinesisk aksent lyddatasett150300450Høyttalere som snakker kinesisk som førstespråk og som flyttet/immigrerte til USA som tenåringer/voksne og lærte engelsk som andrespråk.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleEngelsk - Deep South AccentEngelsk - Deep South Audio Dataset2752754501000Høyttalere fra (i) Texas; (ii) North Carolina, South Carolina, Georgia; (iii) New Orleans; (iv) Florida panhandle; (v) Tennessee, Arkansas, Michigan.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleEngelsk - Hispanic AccentEngelsk - Hispanic Accented Audio Dataset400400800Hispanic English refererer til variantene av amerikansk engelsk som snakkes av latinamerikanske amerikanere med ulik nasjonal arv. Hovedfokuset var på meksikanske amerikanere, foredragsholdere av ulik nasjonal opprinnelse (f.eks. Mexico, Puerto Rico, Den dominikanske republikk, Ecuador, Cuba, etc.) og fra forskjellige regioner (f.eks. California, New York, Florida) også. Inkluderte foredragsholdere var som snakker spansk som førstespråk, så vel som talere av latinamerikansk opprinnelse som snakker spansk har et arvespråk.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleEngelsk - New Zealand aksentEngelsk - New Zealand lyddatasett2507501000Høyttalere på begge øyene, inkludert en blanding av yngre høyttalere (<40 år) og eldre høyttalere (>40 år) i like proporsjoner.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleEngelsk - Singapore aksentEngelsk - Singapore lyddatasett4006001000Både Standard Singapore English og Colloquial Singapore English. Singaporeanere med forskjellig etnisk bakgrunn (f.eks. kinesisk, malaysisk, indisk, osv.) og med forskjellig utdanningsnivå.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleEngelsk - Sør-Afrika aksentEngelsk - Sør-Afrika lyddatasett4006001000Representanter fra ulike sosioøkonomiske klasser og etnologisk bakgrunn (f.eks. sørafrikanere med europeisk, afrikansk, indisk eller blandet bakgrunn).. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleEngelsk - irsk aksentEngelsk - irsk lyddatasett500500Engelsk snakket i Irland. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleEngelsk - skotsk aksentEngelsk - skotsk lyddatasett800800Engelsk snakket av skotsk. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleEngelsk - walisisk aksentEngelsk - walisisk lyddatasett800800walisisk engelsk. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleFransk kanadiskFransk kanadisk lyddatasett10001000Kanadisk fransk. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TalehebraiskHebraisk lyddatasett7507501500hebraisk i Israel. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleIndonesiskIndonesisk lyddatasett100010002000Bahasa indonesisk. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleJapanskJapansk lyddatasett20002000Japansk fra Japan. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleKoreanskKoreansk lyddatasett10020015001800Høyttalere spredt over hele Sør-Korea.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleMalayMalayisk lyddatasett5005001000Malayisk i Malaysia. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleMeksikansk spanskMeksikansk spansk lyddatasett12501250Meksikansk fra Mexico. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TalepolskPolsk lyddatasett25020002250polsk fra Polen. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleRussiskRussisk lyddatasett20002000Russisk fra Russland. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleswahiliSwahili lyddatasett3506501000sørafrikansk og kenyansk swahili. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleSvenskSvensk lyddatasett3506501000svensk i Sverige. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleTaiwan kinesiskTaiwan kinesisk lyddatasett10001000kinesisk fra Taiwan. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleThailandskThai lyddatasett350450800Et uformelt register brukt mellom venner,. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaletyrkiskTyrkisk lyddatasett20002000Tyrkisk fra Tyrkia. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TalevietnamesiskVietnamesisk lyddatasett6004001000Nordlige (f.eks. Hanoi), sentrale og sørlige (f.eks. Ho Chi Minh-byen).. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleHindiHindi lyddatasett80020002800Hindi i India, spesielt i nord-, øst- og vest-regioner. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleHinglishIndisk engelsk lyddatasett300500800Samlet fra urbane indiske byer som er økonomiske knutepunkter i landet på grunn av økende økonomiske muligheter. Slike steder kan være Noida, Delhi, Dehradun, Chandigarh, Mumbai, Kolkata, Bangalore, Pune, Chennai, Hyderabad, etc.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleEngelskEngelsk lyddatasett700700. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TalekannadaKannada lyddatasett6010040200Kannada fra Karnataka, India. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TalemalayalamMalayalam lyddatasett6010040200Malayalam fra Kerala, Lakshadweep og Puducherry. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleOriyaOriya lyddatasett6010040200Oriya fra deler av Odisha, Vest-Bengal, Jharkhand og Chhattisgarh. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TalepunjabiPunjabi lyddatasett6010040200Punjabi fra Punjab, India. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleTamilskTamil lyddatasett60100240400Tamil fra Tamil Nadu, India. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleteluguTelugu lyddatasett1009509502000Telugu fra Andhra Pradesh, India. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleBengalskBengalsk lyddatasett6010040200Bengali fra Vest-Bengal, India. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TalegujaratiGujarati lyddatasett6010040200Gujarati fra Gujarat, India. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TalemarathiMarathi lyddatasett6010040200Marathi fra Maharashtra, India. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
TaleAssamesiskAssamisk lyddatasett6010040200Assamisk fra Asssam, India. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip

Dyp ekspertise innen Conversational AI

Conversational AI eller Chatbots eller Virtual / Digital Assistants er bare like smarte som teknologien og dataene bak dem. Hos Shaip tilbyr vi deg et bredt sett av det diversifiserte lyddatasettet for Natural Language Processing (NLP) som etterligner samtaler med ekte mennesker som lar deg bringe AI til live. Med vår dype forståelse hjelper vi deg med å bygge og lokalisere AI-aktiverte talemodeller, med ytterste presisjon med rike og strukturerte datasett på flere språk fra hele verden. Vi tilbyr flerspråklig lydinnsamling, lydtranskripsjon og lydkommentartjenester basert på dine krav, mens vi fullt ut tilpasser ønsket hensikt, ytringer og demografisk distribusjon.

Skriftlig talesamling

Spontane talesamling

Transkripsjon av lyddata

Datamerking og merking

Shaip lar deg trene din Conversational AI-plattform nøyaktig slik at den kan:

  • Snakk, tekst og chat sømløst pÃ¥ tvers av flere kanaler.
  • Lær av eksisterende interaksjoner i form av chat, stemmetranskripsjoner, transaksjoner osv. og foreslÃ¥ og snakke, basert pÃ¥ disse læringene.
  • ForstÃ¥ intensjonen bak menneskelig tale og fjern tvetydighet i forstÃ¥elsen av menneskelig sprÃ¥k.
  • Samhandle med deg pÃ¥ en-til-en-basis og kan bli opplært til Ã¥ identifisere brukere og huske tidligere samtaler.

En verdensleder innen samtale-AI-treningsdata

Timer med lyddata på over 100 språk – hentet, transkribert og kommentert

Taledatalisensiering

20 40 timer med taledata på over 55 språk og dialekter som dekker en rekke av XNUMX+ emner fra forskjellige domener, f.eks. Call-center, debatter, generelle samtaler, taler, podcaster, etc.

Innsamling av taledata

Samle lyd- og taledata (monolog, 2-personers samtale, menneske-bot-chat) på over 100 språk fra hele verden, tilpasset dine AI-krav.

Transkripsjon av taledata

Kostnadseffektiv lydtranskripsjon eller lydkommentarer gjennom en sterk arbeidsstyrke på 30,000 XNUMX samarbeidspartnere med garantert TAT, nøyaktighet og besparelser

Fremskynd utviklingen av Conversational AI-appen din med Audio Collection & Audio Annotation Services

Shaip-fordelen

Skala

Vi kan hente, skalere og levere lyddata fra hele verden på flere språk og dialekter basert på dine behov.

Kompetanse

Vi har den rette ekspertisen angående nøyaktig og objektiv datainnsamling, transkripsjon og annotering av gullstandard.

Network

Et nettverk av 30,000 XNUMX+ kvalifiserte bidragsytere, som raskt kan bli tildelt datainnsamlingsoppgaver for å bygge AI-treningsmodeller og oppskaleringstjenester.

Teknologi

Vi har en fullstendig AI-basert plattform med proprietære verktøy og prosesser for å utnytte arbeidsflytadministrasjonen 24*7 døgnet rundt.

Agility

Vi tilpasser oss endringer i kundekrav veldig raskt og hjelper til med å akselerere AI-utvikling med kvalitetstaledata 5-10 ganger raskere enn konkurrentene.

Sikkerhet

Vi legger stor vekt på datasikkerhet og personvern og er også sertifisert for å håndtere svært regulerte sensitive data.

Hva vi gjør best

Treningsdata

Få merket data av høyeste kvalitet på en brøkdel av tiden. Den er gullstandard, pålitelig og klar til å trene AI- og ML-modellene dine for å oppnå de høyeste ytelsesnivåene.

lær MER

Datainnsamling, merking og merknad

Med Shaip får du 15+ års dokumentert ekspertise i å samle inn, transkribere og kommentere kvalitetsdata. Med vår globale arbeidsstyrke kan vi samle inn data fra hele verden, og deretter tilby merkings- og merknadstjenester med den perfekte mengden ferdighetsnivå og ekspertise som kreves for dataene dine.

lær MER

Datakataloger og lisensiering

Med vårt enorme lager av millioner av datasett kan du samle inn og organisere etter behov. Vi kan deretter lisensiere disse kvalitetsdataene for dine spesifikke AI- og ML-brukskrav. I tillegg er disse dataene tilgjengelige til en brøkdel av prisen hvis du skulle lage dem selv.

lær MER

Vil du bygge ditt eget datasett?

Kontakt oss nå for å finne ut hvordan vi kan samle inn et tilpasset datasett for din unike AI-løsning.