Mest pålitelige taledatainnsamlingstjenester for din AI

Tren opp NLP-modellene, VA-er, TTS-prototyper og mer med samtaledata av høy kvalitet, med våre lyd- og taledatainnsamlingstjenester

Innsamling av lyddata

Oppdag lyddatapipelines uten flaskehalser.

Utvalgte klienter

Hvorfor er datasett for taleopplæring nødvendig for behandling av naturlig språk?

Har du noen gang lagt merke til at smarttelefonen VA, dvs. Siri, Bixby eller noe annet, samhandler? Måten de svarer på alle spørsmål og analyserer og presenterer resultater i henhold til dine krav!

Vel, så mye som disse VA-ene fascinerer oss, må disse intelligente ressursene og programmene trenes gradvis for å kunne svare, så nøyaktig. Dette er grunnen til at du bør vurdere å outsource tale/lyd og taledatainnsamling til spesialiserte datainnsamlingsselskaper, med validerende faglig ekspertise.

Investering i innsamling av lyddata forbereder din påståtte NLP for å imøtekomme et flerspråklig publikum. Ikke bare det, taledatainnsamling for NLP, som og når den håndteres av en ekspert, tar til og med innsamling i felt, semantisk analyse og lydtranskripsjon i betraktning. Med profesjonelle løsninger for taledatainnsamling kan du:

  • Skaff høykvalitets lyddatasett for å forbedre nøyaktigheten
  • Målrett ulike scenarier oppsett
  • Samle flerspråklige AI-treningsdata
  • Skaler ML-modellen din for å passe til ulike demografier og vertikaler

Profesjonelle lyd-/taledatainnsamlingstjenester for NLP

Hvilket som helst emne. Ethvert scenario.

Intelligente NLP-systemer er alt annet enn generiske. Avhengig av funksjonaliteten til programmet, må du kanskje fokusere på romlige og flerspråklige lyddatatjenester, som kun kan tilbys av anerkjente selskaper for innsamling av tale/lyddata. Det er her Shaip kommer inn i ordningen som en svært pålitelig leverandør av datatilkoblingstjenester som setter sin ære i å gjøre det tunge løftet for dine antatt intelligente AI-er.

Hos Shaip er vårt primære fokus på å mate modeller med høyest mulig volum av tilpassede taleprøver, på minst mulig tid. Med oss ​​om bord kan du forvente:

Talesamling
  • Kuratert lyd-/taledatainnsamling for NLP
  • Skreddersydde programmer som reagerer i henhold til spesifikke brukstilfeller
  • Klargjør mining av lyddatasett
  • Mønsterspesifikk og automatisert databehandling
  • Høyest mulig nivå av domenespesifisitet
  • Raskere tid til markedet med akselererte AI-modeller

Vår ekspertise

Juster lyddata for å forberede smarte NLP-modeller

Shaip tilbyr ende-til-ende tale-/lyddatainnsamlingstjenester på over 100+ språk for å muliggjøre stemmeaktiverte teknologier for å imøtekomme et mangfoldig sett av publikum over hele verden. Vi kan jobbe med prosjekter av alle omfang og størrelser; fra lisensiering av eksisterende lyddatasett, til å administrere tilpasset lyddatainnsamling, til lydtranskripsjon og merknader. Uansett hvor stort taledatainnsamlingsprosjektet ditt er, kan vi tilpasse lydinnsamlingstjenestene for å passe dine behov for å bygge NLP-datasett av høy kvalitet som er målrettet mot dialekter, toner og språk. Velg fra vårt brede utvalg av taledatasett og lyddatainnsamlingsressurser, for stemmeaktiverende intelligente oppsett.

Monolog tale

Monolog talesamling

Håndter talebaserte krav knyttet til en frittstående høyttaler for Text-to-Speed-prototypene dine og transkripsjonsspesifikke krav med skriptmating via enkanalsfiler.

Dialog Tale

Dialog Tale
Samling

Sett opp intelligente virtuelle assistenter, hastighetsspesifikke chatbots og modeller for automatisk talegjenkjenning med flerspråklig eksponering via tokanalsfiler og transkriberte ressurser.

Akustisk tale

Akustiske data
Samling

Vi kan profesjonelt ta opp lyddata i studiokvalitet, enten det er restauranter, kontorer eller hjem eller fra ulike miljøer og språk, gjennom vårt globale nettverk av samarbeidspartnere, samtidig som vi dekker et bredere akustisk spekter

Naturlig språk ytring

Naturlig språk ytringssamling

Tren smarte kommersielle oppsett for å identifisere forskjellige uttalte kundefraser med lignende betydning, for å gjøre AI-ene mer autonome i tid

Digitale virtuelle assistenter

Digital / Virtuelt
assistenter

Fokuser på å bygge din kommende virtuelle assistent ved å trene modeller med forbehold om menneskelig tale, flerspråklig eksponering, kontekstuell analyse og NLU.

Automatisk talegjenkjenning

Automatisk talegjenkjenning (ASR)

Forbedre nøyaktigheten til dine automatiske talegjenkjenningssystemer (ASR) ved å ha tilgang til avanserte diversifiserte tale-/lyddatasett fra et bredt spekter av demografi.

Naturlig språk ytring

Flerspråklig tale/lydtreningsdata

Våre svært dyktige språkfagfolk over hele verden tilbyr flerspråklig lyd-/taleopplæringsdata på flere språk og dialekter, inkludert arabisk, dansk, kinesisk, afrikaans, Singapore, New Zealand, hebraisk, indonesisk, irsk, koreansk, malaysisk, polsk, skotsk, svensk , fransk, tysk, vietnamesisk, thai, italiensk, spansk og mer.

Digitale virtuelle assistenter

Tekst-til-tale
(TTS)

For å tilby en bedre brukeropplevelse med TTS, er det avgjørende å utvikle et system som høres naturlig ut. Bygg en tekst-til-tale (TTS) flerspråklig modell ved hjelp av vår globale arbeidsstyrke, som hjelper deg å samle inn taledata på 150+ språk og dialekter for å forbedre AI-modellene dine fra kontroller i bilen til chatbots og læringsløsninger med høy- lyddata av høy kvalitet.

Grunner til å velge Shaip som din pålitelige partner for taledatainnsamling

porsjoner

porsjoner

Dedikerte og trente team:

  • 30,000+ samarbeidspartnere for dataskaping, merking og kvalitetssikring
  • Godkjent prosjektlederteam
  • Erfarent produktutviklingsteam
  • Talentpool-innkjøps- og onboarding-team
Prosess

Prosess

Høyeste prosesseffektivitet er sikret med:

  • Robust 6 Sigma Stage-Gate-prosess
  • Et dedikert team av 6 Sigma svarte belter – nøkkelprosesseiere og overholdelse av kvalitet
  • Kontinuerlig forbedring og tilbakemeldingssløyfe
Plattform

Plattform

Den patenterte plattformen tilbyr fordeler:

  • Nettbasert ende-til-ende-plattform
  • Upåklagelig kvalitet
  • Raskere TAT
  • Sømløs levering

Språk: Innsamlet lyddatasett

Hyllevare for tale-/lyddatasett

DetaljerSpråkdatasettEksempelfrekvensDatasettypeTotale lydtimerKort beskrivelseDatasettbeskrivelseAudio ChannelOpptaksplattformWER (%)LydformatTranskripsjonsformatBruk sakAntall høyttalereCTA
Taleno_US_CC_8Afroamerikansk folkespråkAfroamerikansk folkespråkno8 kHzCallcenter211Afroamerikanske samtalesenterdataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne: 612, mann: 1242 og ukjent: 12
Taleno_US_MA_16Afroamerikansk folkespråkAfroamerikansk folkespråkno16 kHzMedia Audio154African American Vernacular Media dataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne: 151, mann: 150 og ukjent: 10
TaleAfrikaans_GC_8afrikaansafrikaansaf_ZA8 kHzGenerell samtale368Afrikaans generelle samtaledataUskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15-60 minutter, afrikaans snakkes i Afrikadualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne: 502, mann: 390 og ukjent: 2
TaleAfrikaans_MA_16afrikaansafrikaansaf_ZA16 kHzMedia Audio658afrikanske mediefilerLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne: 750, mann: 1278 og ukjent: 52
TaleArabisk_GC_8ArabiskArabiskar_AE8 kHzGenerell samtale292Arabisk generelle samtaledataUskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15-60 minutter, arabisk fra Gulf-landenedualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne: 171, mann: 534 og ukjent: 1
TaleArabisk_SM_48ArabiskArabiskar-SA48 kHzManuskriptmonolog1,947Monolog med arabisk skriftEnkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 838 Mann 1209 Ukjent 78
TaleAssamese_CC_8AssamesiskAssamisk (I pipeline) som iCallcenter60Assamisk (In Pipeline) Call-Center-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleAssamese_GCAssamesiskAssamisk (I pipeline) som iGenerell samtale100Assamisk (I Pipeline) Generelle samtaledataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleAssamese_MAAssamesiskAssamisk (I pipeline) som iMedia Audio40Assamisk (In Pipeline) MedielyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleBengali_CC_8BengalskBengali (I pipeline) bn_INCallcenter60Bengali (In Pipeline) Call-Center-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleBengali_GCBengalskBengali (I pipeline) bn_INGenerell samtale100Bengali (In Pipeline) Generelle samtaledataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleBengali_MABengalskBengali (I pipeline) bn_INMedia Audio40Bengali (In Pipeline) MedielyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleBoston_CC_8Boston engelskBoston engelskno8 kHzCallcenter177Boston Call-center-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne: 605, mann: 711 og ukjent: 0
TaleBoston_GC_8Boston engelskBoston engelskno8 kHzGenerell samtale32Boston generelle samtaledataUskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne: 53, mann: 83 og ukjent: 0
TaleBoston_MA_16Boston engelskBoston engelskno16 kHzMedia Audio93Boston Media lyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne: 43, mann: 181 og ukjent: 2
TaleKanadisk_SM_48Kanadisk franskKanadisk franskfr-CA48 kHzManuskriptmonolog1,222Kanadisk franskEnkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 974 Mann 631 Ukjent 1
TaleKinesisk_CC_8Kinesisk engelskKinesisk engelskno8 kHzCallcenter169Kinesisk kundesenterdataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne: 1790, Mann: 523 og Ukjent: 13
TaleKinesisk_MA_16Kinesisk engelskKinesisk engelskno16 kHzMedia Audio249Kinesiske medier lyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne: 126, Mann: 346 og Ukjent: 6
TaleKinesisk forenklet_SM_48Kinesisk med enkle tegnKinesisk med enkle tegnzh-CN48 kHzManuskriptmonolog2,762Kinesisk med enkle tegnEnkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 1920 Mann 1535 Ukjent 270
TaleTradisjonell kinesisk_SM_48Tradisjonell kinesiskTradisjonell kinesiskzh-TW48 kHzManuskriptmonolog1,028Tradisjonell kinesiskEnkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 1069 Mann 262 Ukjent 3
TaleDanish_GC_8DanskDanskda_DK8 kHzGenerell samtale372Danske generelle samtaledataUskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne: 311, Mann: 417, Ukjent: 0
TaleDanish_MA_16DanskDanskda_DK16 kHzMedia Audio664Danske mediers lyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne: 369, Mann: 864, Ukjent: 27
TaleDanish_SM_48DanskDanskda-DK48 kHzManuskriptmonolog2,579Dansk skriftmonologEnkelttaleopptak, som har en tendens til å falle i intervallet 5 til 30 sekunder, dansk fra DanmarkMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 1551 Mann 1233 Ukjent 42
TaleEngelsk Deep South_CC_8Engelsk Deep SouthEngelsk Deep Southno8 kHzCallcenter151Engelsk Deep South Call-center dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 221 , Mann 1004 , Ukjent 7
TaleEngelsk Deep South_GC_8Engelsk Deep SouthEngelsk Deep Southno8 kHzGenerell samtale56Engelsk Deep South Generelle samtaledataUskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 99, Mann 31, Ukjent 0
TaleEngelsk Deep South_MA_16Engelsk Deep SouthEngelsk Deep Southno16 kHzMedia Audio266Engelsk Deep South Media lyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 204, Mann 356, Ukjent 21
TaleGerman_CC_8TyskTyskde-De8 kHzCallcenter64Tyske Call-center-data Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,Monodesktop. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 478 Mann 1440 Ukjent 0
TaleTysk_IVR_8TyskTyskde-De8 kHz IVR200Tyske IVR-dataMenneske til maskin. En IVR-type flyt der det er en TTS-forespørsel (f.eks. "Hvordan kan jeg hjelpe deg") etterfulgt av en spontan menneskelig responsMonodesktop. Wav .jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling Kvinne 10115 Mann 8750 Ukjent 0
TaleGujarati_CC_8gujaratiGujarati (I pipeline) gu_INCallcenter60Gujarati (In Pipeline) Call-Center-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleGujarati_GCgujaratiGujarati (I pipeline) gu_INGenerell samtale100Gujarati (In Pipeline) Generelle samtaledataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleGujarati_MAgujaratiGujarati (I pipeline) gu_INMedia Audio40Gujarati (In Pipeline) MedielyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleHebraisk_Generell samtale_8hebraiskhebraiskhe_IL8 kHzGenerell samtale399Hebraisk generelle samtaledataUskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15-60 minutter, hebraisk i Israeldualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 414 , Mann 399 , Ukjent 1
TaleHebraisk_MA_16hebraiskhebraiskhe_IL16 kHzMedia Audio427Hebraisk media lyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 361 , Mann 513, Ukjent 13
TaleHindi_MA_16HindiHindihei_IN16 kHzMedia Audio219Hindi Media lyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 83 , Mann 309, Ukjent 0
TaleHindi_SM_48HindiHindihi-IN48 kHzManuskriptmonolog2,867Hindi scripted monologEnkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 1977 Mann 1864 Ukjent 147
TaleHINGLISH_CC_8HinglishHinglishhg_IN8 kHzCallcenter208HINGLISH Call-senter-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 822, Mann 1262, Ukjent 0
TaleHINGLISH_MA_16HinglishHinglishhg_IN16 kHzMedia Audio216HINGLISH MedielyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 75, Mann 380, Ukjent 0
TaleHispanic_CC_8Spansk engelskSpansk engelskno8 kHzCallcenter212Hispanic Call-center dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 822, Mann 1262, Ukjent 0
TaleHispanic_MA_16Spansk engelskSpansk engelskno16 kHzMedia Audio155Hispanic Call Media-lydLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 140, Mann 219, Ukjent 5
TaleIndonesisk_GC_8IndonesiskIndonesiskjeg gjorde8 kHzGenerell samtale496Indonesisk generelle samtaledataUskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, indonesiskdualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 524, Mann 454, Ukjent 2
TaleIndonesisk_MA_16IndonesiskIndonesiskjeg gjorde16 kHzMedia Audio643Indonesisk media lyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 746, Mann 1507, Ukjent 129
TaleIrish_GC_8IrishIrishno_IE8 kHzGenerell samtale192Irske generelle samtaledataUskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 213 , Mann 153 , Ukjent 0
TaleJapansk_SM_48JapanskJapanskja-JP48 kHzManuskriptmonolog2,335Japansk skriftmonologEnkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 1460 Mann 1221 Ukjent 194
TaleKannada_CC_8kannadaKannada (I pipeline) kn_INCallcenter60Kannada (In Pipeline) Call-Center-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleKannada_GCkannadaKannada (I pipeline) kn_INGenerell samtale100Kannada (In Pipeline) Generelle samtaledataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleKannada_MAkannadaKannada (I pipeline) kn_INMedia Audio40Kannada (In Pipeline) MedielyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleKoreansk_CC_8KoreanskKoreanskko_KR8 kHzCallcenter107Koreanske Call-center-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 1086, Mann 210, Ukjent 4
TaleKoreansk_MA_16KoreanskKoreanskko_KR16 kHzMedia Audio204Koreanske medielyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 70 Mann 303, Ukjent 25
TaleKoreansk_SM_48KoreanskKoreanskko-KR48 kHzManuskriptmonolog1,955Monolog med koreansk manusEnkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 1195 Mann 1134 Ukjent 122
TaleMalay_GC_8MalayMalayms_MY8 kHzGenerell samtale266Malayisk generelle samtaledataUskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15-60 minutter, Malayisk i Malaysiadualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 316, Mann 176, Ukjent 0
TaleMalay_MA_16MalayMalayms_MY16 kHzMedia Audio344Malay Media lyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 236, Mann 626, Ukjent 47
TaleMalayalam_CC_8malayalamMalayalam (I pipeline) ml_INCallcenter60Malayalam (In Pipeline) Call-Center-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleMalayalam_GCmalayalamMalayalam (I pipeline) ml_INGenerell samtale100Malayalam (In Pipeline) Generelle samtaledataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleMalayalam_MAmalayalamMalayalam (I pipeline) ml_INMedia Audio40Malayalam (In Pipeline) MedielyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleMarathi_CC_8marathiMarathi (I pipeline) mr_INCallcenter60Marathi (In Pipeline) Call-Center-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleMarathi_GCmarathiMarathi (I pipeline) mr_INGenerell samtale100Marathi (In Pipeline) Generelle samtaledataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleMarathi_MAmarathiMarathi (I pipeline) mr_INMedia Audio40Marathi (In Pipeline) MedielyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleMeksikansk_SM_48Spansk (Mexico)Spansk (Mexico)es-MX48 kHzManuskriptmonolog1,492Meksikansk spansk manusmonologEnkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 1016 Mann 1069 Ukjent 95
TaleNederland_SM_48DutchDutchnl-NL48 kHzManuskriptmonolog1,205Nederlandsk skriftmonologEnkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 1285 Mann 531 Ukjent 3
TaleNew York English_CC_8New York engelskNew York engelskno8 kHzCallcenter103New York English Call-center dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 610, Mann 532, Ukjent 0
TaleNew York English_GC_8New York engelskNew York engelskno8 kHzGenerell samtale107New York engelsk generelle samtaledataUskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 118, Mann 114, Ukjent 0
TaleNew York English_MA_16New York engelskNew York engelskno16 kHzMedia Audio140New York English Media lyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 66, Mann 230, Ukjent 11
TaleNew Zealand_GC_8New Zealand engelsk New Zealand engelsk no_NZ8 kHzGenerell samtale148New Zealand engelsk generelle samtaledataUskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 167, mann 121, Ukjent 4
TaleNew Zealand_MA_16New Zealand engelsk New Zealand engelsk no_NZ16 kHzMedia Audio400New Zealand engelsk media lydLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 367, mann 678, Ukjent 26
TaleOriya_CC_8OriyaOriya (I pipeline) eller_INCallcenter60Oriya (In Pipeline) Call-Center-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleOriya_GCOriyaOriya (I pipeline) eller_INGenerell samtale100Oriya (In Pipeline) Generelle samtaledataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleOriya_MAOriyaOriya (I pipeline) eller_INMedia Audio40Oriya (In Pipeline) MedielyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalePolsk_MA_16polskpolskpl_pl16 kHzMedia Audio269Polsk media lydLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 173 Mann 354 Ukjent 6
TalePolsk Polen_SM_48Polsk (Polen)Polsk (Polen)pl-PL48 kHzManuskriptmonolog1,482Polsk Polen - ManuskriptmonologEnkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 1324 Mann 701 Ukjent 24
TalePunjabi_CC_8punjabiPunjabi (I pipeline) punjabiCallcenter60Punjabi (In Pipeline) Call-Center-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalePunjabi_GCpunjabiPunjabi (I pipeline) punjabiGenerell samtale100Punjabi (In Pipeline) Generelle samtaledataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalePunjabi_MApunjabiPunjabi (I pipeline) punjabi Media Audio40Punjabi (In Pipeline) MedielyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleRussisk_SM_48RussiskRussiskru-RU48 kHzManuskriptmonolog2,398Monolog med russisk manusEnkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 1689 Mann 1937 Ukjent 214
TaleSkotsk_GC_8skotsk (engelsk aksent)skotsk (engelsk aksent)no_AB8 kHzGenerell samtale292Skotske generelle samtaledataUskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 285 , Mann 260, Ukjent 3
TaleSingapore_CC_8Singapore engelskSingapore engelskno_SG8 kHzCallcenter218Singapore Call-Center-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 2139 , Mann 884, Ukjent 21
TaleSingapore_MA_16Singapore engelskSingapore engelskno_SG16 kHzMedia Audio247Singapore Media lyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 160, Mann 455, Ukjent 37
TaleSørafrikansk engelsk_CC_8sørafrikansk engelsksørafrikansk engelsken_ZA8 kHzCallcenter261South African English Call-Center dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 1274 , Mann 935 , Ukjent 1
TaleSørafrikansk engelsk_MA_16sørafrikansk engelsksørafrikansk engelsken_ZA16 kHzMedia Audio251Sørafrikansk engelsk media lyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 235, Mann 432, Ukjent 36
TaleSwahili_CC_8swahiliswahilisw_KE8 kHzCallcenter230Swahili Call-Center-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 611, Mann 833, Ukjent 0
TaleSwahili_MA_16swahiliswahilisw_KE16 kHzMedia Audio265Swahili Media lyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 118, Mann 493, Ukjent 25
TaleSvensk_CC_8SvenskSvensksv_SE8 kHzCallcenter250Svensk Call-Center-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 1581, mann 727, Ukjent 2
TaleSvensk_MA_16SvenskSvensksv_SE16 kHzMedia Audio278Swedish Media lyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 195, mann 500, Ukjent 21
TaleTamil_CC_8TamilskTamil (I pipeline) ta_INCallcenter60Tamil (In Pipeline) Call-Center-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleTamil_GCTamilskTamil (I pipeline) ta_INGenerell samtale100Tamil (In Pipeline) Generelle samtaledataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleTamil_MATamilsk Tamil (I pipeline) ta_INMedia Audio40Tamil (In Pipeline) MedielyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleTelugu_GC_8telugutelugute_IN8 kHzGenerell samtale553Telugu generelle samtaledataUskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 574 , Mann 564, Ukjent 0
TaleTelugu_MA_16telugutelugute_IN16 kHzMedia Audio648Telugu Media lyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 207, Mann 963, Ukjent 2
TaleTelugu_CC_8teluguTelugu (I pipeline) te_INCallcenter30Telugu (In Pipeline) Call-Center-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleTelugu_GCteluguTelugu (I pipeline) te_INGenerell samtale50Telugu (In Pipeline) Generelle samtaledataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleTelugu_MAteluguTelugu (I pipeline) te_INMedia Audio20Telugu (In Pipeline) MedielyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleThai_GC_8ThailandskThailandskth_TH8 kHzGenerell samtale183Thai generell samtaleUskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15-60 minutter, et uformelt register som brukes mellom vennerdualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 338, Mann 96, Ukjent 8
TaleThai_MA_8ThailandskThailandskth_TH16 kHzMedia Audio173Thai Media-lydLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 143, Mann 502, Ukjent 26
TaleTyrkisk Tyrkia_SM_48Tyrkisk TyrkiaTyrkisk Tyrkiatr-TR48 kHzManuskriptmonolog2,027Tyrkisk TyrkiaEnkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 1561 Mann 1241 Ukjent 31
TaleVietnamesisk_GC_8vietnamesiskvietnamesiskvi_VN8 kHzGenerell samtale295Vietnamesiske generelle samtaledataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, nordlig (f.eks. Hanoi), sentral og sørlig (f.eks. Ho Chi Minh-byen).dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 400, mann 380, Ukjente 2
TaleVietnamesisk_MA_16vietnamesiskvietnamesiskvi_VN16 kHzMedia Audio257vietnamesisk media lyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 249, mann 200, Ukjente 45
TaleWelsh_GC_8walisisk (engelsk aksent)walisisk (engelsk aksent)no_WL8 kHzGenerell samtale278walisiske generelle samtaledataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 270, Mann 324, Ukjent 0
TaleStorbritannia engelsk_WW_16UK engelskUK engelskno_uk16 kHzWake Word200 høyttalereWake Word engelsk engelsksøkeord innsamling av data
  • 200 høyttalere
  • 4 unike nøkkelsetninger per høyttaler
  • 25-30 gjentatte nøkkelsetningsopptak per unik nøkkelfrase
  • 25-30 lydfiler per unik nøkkelfrase
  • Totalt 120 innspilte ytringer per høyttaler
1 kanalMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKjønn: 50 % mann, 50 % kvinne, +/- 10 %.

Tjenester tilbys

Ekspertlyddatainnsamling er ikke alt-hånd-på-dekk for omfattende AI-oppsett. Hos Shaip kan du til og med vurdere følgende tjenester for å gjøre modellene mye mer utbredt enn vanlig:

Innsamling av tekstdata

Innsamling av tekstdata
Tjenester

Den sanne verdien av Shaip kognitive datainnsamlingstjenester er at det gir organisasjoner nøkkelen til å låse opp kritisk informasjon som finnes i ustrukturerte data

Innsamling av bildedata

Tjenester for innsamling av bildedata

Sørg for at datasynsmodellen din identifiserer hvert bilde nøyaktig, for sømløst å trene neste generasjons AI-modeller for fremtiden

Videodatainnsamling

Videodatainnsamlingstjenester

Fokuser nå på datasyn sammen med NLP for å trene modellene dine til å identifisere objekter, individer, avskrekkende midler og andre visuelle elementer til perfeksjon

Shaip Kontakt oss

Vil du bygge ditt eget lyddatasett?

Ta kontakt med vår interne taledatainnsamlingsekspert for å sette opp et lydlager som best passer dine behov

  • Ved å registrere meg godtar jeg Shaip Personvernserklæring og Våre vilkår og gi mitt samtykke til å motta B2B-markedsføringskommunikasjon fra Shaip.

Taledatainnsamling for en ML-modell refererer til prosessen med å samle inn lydopptak av talespråk. Denne samlingen hjelper til med å trene og raffinere maskinlæringsalgoritmer, spesielt de som er sentrert om å forstå og behandle menneskelige stemmer.

Når du har som mål å samle inn lyddata for Automatic Speech Recognition (ASR), bør du starte med å definere prosjektets spesifikke behov, inkludert ønsket språk, aksent og taletype. Etter å ha angitt disse parameterne, sørg for at du får alle nødvendige tillatelser for å respektere brukernes personvern. Bruk deretter passende opptaksenheter eller programvare for å fange klare lydprøver. Hvert opptak bør omhyggelig kommenteres med sin transkripsjon eller andre relevante metadata og lagres systematisk for enkel tilgang.

Et taledatasett i maskinlæring er sentralt for opplæring, testing og validering av modeller skreddersydd for å gjenkjenne, transkribere eller tolke talespråk. Slike datasett baner vei for en myriade av applikasjoner, fra taleassistenter og transkripsjonstjenester til stemmebiometri.

For å samle nøyaktige data fra forskjellige språk og aksenter, er samarbeid med morsmål med ønsket språkbakgrunn avgjørende. Mål for et variert og representativt utvalg for å dekke et bredt spekter av demografiske nyanser. Bruk standardisert opptaksutstyr i enhetlige miljøer for å sikre lydkonsistens. Og viktigere, annoter hver databit med detaljerte transkripsjoner og metadata, som angir det spesifikke språket og aksenten.