Mest pålitelige taledatainnsamlingstjenester for din AI

Tren opp NLP-modellene, VA-er, TTS-prototyper og mer med samtaledata av høy kvalitet, med våre lyd- og taledatainnsamlingstjenester

Innsamling av lyddata

Oppdag lyddatapipelines uten flaskehalser

Utvalgte klienter

Profesjonell lyd-/taledatainnsamlingstjenester

Hvilket som helst emne. Ethvert scenario.

Hos Shaip ligger vår ekspertise i å lage høykvalitets taledatasett designet for varierte AI/ML-krav. Vi tilbyr et ekspansivt utvalg av språk og tar opp i forskjellige innstillinger, noe som gjør datasettene våre omfattende og tilpasningsdyktige. Oditt fokus er på å mate modeller med det høyeste volumet av tilpassede taledata, på minst mulig tid. Med oss ​​om bord kan du forvente: 

Talesamling
  • Kuratert høykvalitets flerspråklig lyd-/taledata for å forbedre nøyaktigheten
  • Høyest mulig nivå av domenespesifisitet til target mangfoldig scenario oppsett
  •  Skaler ML-modellen din for å passe til ulike demografier og vertikaler
  • Opptaksmiljøer: Studiokvalitet, med krystallklar lyd med minimal bakgrunnsstøy, og Naturlige miljøer, der opptak inneholder omgivelseslyder for å etterligne virkelige situasjoner.

100 +

land

55K +

Timer med taledata

250 +

Prosjekter

60 +

Språk (100+ dialekter)

8 / 16 / 44 / 48 kHz

Samplingsfrekvens

Vår ekspertise

Juster lyddata for smartere NLP-modeller

Shaip tilbyr ende-til-ende tale-/lyddatainnsamlingstjenester på over 100+ språk for å muliggjøre stemmeaktiverte teknologier for å imøtekomme et mangfoldig sett av publikum over hele verden. Vi kan jobbe med prosjekter av alle omfang og størrelser; fra lisensiering av eksisterende lyddatasett, til å administrere tilpasset lyddatainnsamling, til lydtranskripsjon og merknader. Uansett hvor stort taledatainnsamlingsprosjektet ditt er, kan vi tilpasse lydinnsamlingstjenestene for å passe dine behov for å bygge NLP-datasett av høy kvalitet som er målrettet mot dialekter, toner og språk. Velg fra vårt brede utvalg av taledatasett og lyddatainnsamlingsressurser, for stemmeaktiverende intelligente oppsett.

Monolog tale

Monolog talesamling

Den fokuserer på å behandle tale fra en enkelt høyttaler. Bruk skriptede forespørsler for å mate inn enkeltkanals lydfiler, og sikre at unike talemønstre, toner og nyanser er spesifikke for den personen.

Dialog Tale

Dialog Tale
Samling

Interaksjon med to personer, replikerer virkelige samtaler og dialoger med flerspråklig eksponering via tokanalsfiler og transkriberte ressurser.

Samtaler med flere parter

Gruppe / Muti-party
samtaler

Diskusjoner med flere personer, fanger gruppedynamikk, overlapping og varierte toner for å trene talemodeller nøyaktig.

Naturlig språk ytring

Naturlig språk ytringssamling

Tren AI-er til å identifisere setninger eller vekke ord med lignende betydninger ved å bruke forskjellige, rike og autentiske ytringer for avansert naturlig språkbehandling og -forståelse.

Akustisk tale

Akustiske data
Samling

Vi kan profesjonelt ta opp lyddata i studiokvalitet, enten det er restauranter, kontorer eller hjem eller fra ulike miljøer og språk, samtidig som vi dekker et bredere akustisk spekter (omfattende lyddatasett).

Automatisk talegjenkjenning

Automatisk talegjenkjenning (ASR)

Forbedre nøyaktigheten til dine automatiske talegjenkjenningssystemer (ASR) ved å ha tilgang til avanserte diversifiserte tale-/lyddatasett fra et bredt spekter av demografi.

Naturlig språk ytring

Flerspråklig tale/lydtreningsdata

Våre dyktige språkfagfolk over hele verden tilbyr flerspråklige lyd-/taledata på forskjellige språk og dialekter. Denne innsatsen fremmer global kommunikasjon og bygger bro over språkbarrierer, og bidrar til mer inkluderende og effektive AI-løsninger.

Digitale virtuelle assistenter

Tekst-til-tale
(TTS)

Bygg en tekst-til-tale (TTS) flerspråklig modell ved hjelp av vår globale arbeidsstyrke, som hjelper deg å samle inn taledata på 150+ språk og dialekter for å forbedre AI-modellene dine fra kontroller i bilen til chatbots og læringsløsninger med høy- lyddata av høy kvalitet.

Call Center-opptak

Call Center
innspillinger

Ekte utvekslinger mellom agenter og kunder, som støtter en rekke språk som spansk, tysk, amerikansk engelsk, bengali, japansk, kinesisk og hindi.

Suksesshistorier

Samtale AI-datasett med over 3 8 timer med data på XNUMX språk

Kunden ønsket å bygge en flerspråklig plattform for indiske språk, og samarbeidet med Shaip for å samle inn, segmentere og transkribere store datasett på flere indiske språk. Dette vil bidra til å utvikle effektive talemodeller som kan drive klientens innovative nye plattform.

problem: Over 3,000 timer med lyddata samlet på 8 indiske språk, segmentert og transkribert for å utvikle automatisk talegjenkjenning.

Løsning: Vi leverte datainnsamling, segmentering, transkripsjon og leverte JSON-filer med metadata. Vi samlet inn 3000 timer med lyddata på 8 indiske språk i skala for klientens taleteknologiprosjekt.

Kasusstudie for taledatainnsamling

Grunner til å velge Shaip som din pålitelige partner for taledatainnsamling

porsjoner

porsjoner

Dedikerte og trente team:

  • 30,000+ samarbeidspartnere for dataskaping, merking og kvalitetssikring
  • Godkjent prosjektlederteam
  • Erfarent produktutviklingsteam
  • Talentpool-innkjøps- og onboarding-team
Prosess

Prosess

Høyeste prosesseffektivitet er sikret med:

  • Robust 6 Sigma Stage-Gate-prosess
  • Et dedikert team av 6 Sigma svarte belter – nøkkelprosesseiere og overholdelse av kvalitet
  • Kontinuerlig forbedring og tilbakemeldingssløyfe
Plattform

Plattform

Den patenterte plattformen tilbyr fordeler:

  • Nettbasert ende-til-ende-plattform
  • Upåklagelig kvalitet
  • Raskere TAT
  • Sømløs levering

Hyllevare for tale-/lyddatasett

DetaljerSpråkdatasettEksempelfrekvensDatasettypeTotale lydtimerKort beskrivelseDatasettbeskrivelseAudio ChannelOpptaksplattformWer (%)LydformatTranskripsjonsformatBruk sakAntall høyttalereCTA
Taleno_US_CC_8Afroamerikansk folkespråkAfroamerikansk folkespråkno8 kHzCallcenter211Afroamerikanske samtalesenterdataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne: 612, mann: 1242 og ukjent: 12
Taleno_US_MA_16Afroamerikansk folkespråkAfroamerikansk folkespråkno16 kHzMedia -lyd154African American Vernacular Media dataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne: 151, mann: 150 og ukjent: 10
TaleAfrikaans_GC_8afrikaansafrikaansaf_ZA8 kHzGenerell samtale368Afrikaans generelle samtaledataUskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15-60 minutter, afrikaans snakkes i Afrikadualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne: 502, mann: 390 og ukjent: 2
TaleAfrikaans_MA_16afrikaansafrikaansaf_ZA16 kHzMedia -lyd658afrikanske mediefilerLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne: 750, mann: 1278 og ukjent: 52
TaleArabisk_GC_8ArabiskArabiskar_AE8 kHzGenerell samtale292Arabisk generelle samtaledataUskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15-60 minutter, arabisk fra Gulf-landenedualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne: 171, mann: 534 og ukjent: 1
TaleArabisk_SM_48ArabiskArabiskar-SA48 kHzManuskriptmonolog1,947Monolog med arabisk skriftEnkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 838 Mann 1209 Ukjent 78
TaleAssamese_CC_8AssamesiskAssamisk (I pipeline) som iCallcenter60Assamisk (In Pipeline) Call-Center-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleAssamese_GCAssamesiskAssamisk (I pipeline) som iGenerell samtale100Assamisk (I Pipeline) Generelle samtaledataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleAssamese_MAAssamesiskAssamisk (I pipeline) som iMedia -lyd40Assamisk (In Pipeline) MedielyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleBengali_CC_8BengalskBengali (I pipeline) bn_INCallcenter60Bengali (In Pipeline) Call-Center-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleBengali_GCBengalskBengali (I pipeline) bn_INGenerell samtale100Bengali (In Pipeline) Generelle samtaledataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleBengali_MABengalskBengali (I pipeline) bn_INMedia -lyd40Bengali (In Pipeline) MedielyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleBoston_CC_8Boston engelskBoston engelskno8 kHzCallcenter177Boston Call-center-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne: 605, mann: 711 og ukjent: 0
TaleBoston_GC_8Boston engelskBoston engelskno8 kHzGenerell samtale32Boston generelle samtaledataUskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne: 53, mann: 83 og ukjent: 0
TaleBoston_MA_16Boston engelskBoston engelskno16 kHzMedia -lyd93Boston Media lyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne: 43, mann: 181 og ukjent: 2
TaleKanadisk_SM_48Kanadisk franskKanadisk franskfr-CA48 kHzManuskriptmonolog1,222Kanadisk franskEnkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 974 Mann 631 Ukjent 1
TaleKinesisk_CC_8Kinesisk engelskKinesisk engelskno8 kHzCallcenter169Kinesisk kundesenterdataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne: 1790, Mann: 523 og Ukjent: 13
TaleKinesisk_MA_16Kinesisk engelskKinesisk engelskno16 kHzMedia -lyd249Kinesiske medier lyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne: 126, Mann: 346 og Ukjent: 6
TaleKinesisk forenklet_SM_48Kinesisk med enkle tegnKinesisk med enkle tegnzh-CN48 kHzManuskriptmonolog2,762Kinesisk med enkle tegnEnkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 1920 Mann 1535 Ukjent 270
TaleTradisjonell kinesisk_SM_48Tradisjonell kinesiskTradisjonell kinesiskzh-TW48 kHzManuskriptmonolog1,028Tradisjonell kinesiskEnkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 1069 Mann 262 Ukjent 3
TaleDanish_GC_8DanskDanskda_DK8 kHzGenerell samtale372Danske generelle samtaledataUskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne: 311, Mann: 417, Ukjent: 0
TaleDanish_MA_16DanskDanskda_DK16 kHzMedia -lyd664Danske mediers lyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne: 369, Mann: 864, Ukjent: 27
TaleDanish_SM_48DanskDanskda-DK48 kHzManuskriptmonolog2,579Dansk skriftmonologEnkelttaleopptak, som har en tendens til å falle i intervallet 5 til 30 sekunder, dansk fra DanmarkMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 1551 Mann 1233 Ukjent 42
TaleEngelsk Deep South_CC_8Engelsk Deep SouthEngelsk Deep Southno8 kHzCallcenter151Engelsk Deep South Call-center dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 221 , Mann 1004 , Ukjent 7
TaleEngelsk Deep South_GC_8Engelsk Deep SouthEngelsk Deep Southno8 kHzGenerell samtale56Engelsk Deep South Generelle samtaledataUskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 99, Mann 31, Ukjent 0
TaleEngelsk Deep South_MA_16Engelsk Deep SouthEngelsk Deep Southno16 kHzMedia -lyd266Engelsk Deep South Media lyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 204, Mann 356, Ukjent 21
TaleGerman_CC_8TyskTyskde-De8 kHzCallcenter64Tyske Call-center-data Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,Monodesktop. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 478 Mann 1440 Ukjent 0
TaleTysk_IVR_8TyskTyskde-De8 kHz IVR200Tyske IVR-dataMenneske til maskin. En IVR-type flyt der det er en TTS-forespørsel (f.eks. "Hvordan kan jeg hjelpe deg") etterfulgt av en spontan menneskelig responsMonodesktop. Wav .jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling Kvinne 10115 Mann 8750 Ukjent 0
TaleGujarati_CC_8gujaratiGujarati (I pipeline) gu_INCallcenter60Gujarati (In Pipeline) Call-Center-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleGujarati_GCgujaratiGujarati (I pipeline) gu_INGenerell samtale100Gujarati (In Pipeline) Generelle samtaledataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleGujarati_MAgujaratiGujarati (I pipeline) gu_INMedia -lyd40Gujarati (In Pipeline) MedielyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleHebraisk_Generell samtale_8hebraiskhebraiskhe_IL8 kHzGenerell samtale399Hebraisk generelle samtaledataUskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15-60 minutter, hebraisk i Israeldualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 414 , Mann 399 , Ukjent 1
TaleHebraisk_MA_16hebraiskhebraiskhe_IL16 kHzMedia -lyd427Hebraisk media lyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 361 , Mann 513, Ukjent 13
TaleHindi_MA_16HindiHindihei_IN16 kHzMedia -lyd219Hindi Media lyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 83 , Mann 309, Ukjent 0
TaleHindi_SM_48HindiHindihi-IN48 kHzManuskriptmonolog2,867Hindi scripted monologEnkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 1977 Mann 1864 Ukjent 147
TaleHINGLISH_CC_8HinglishHinglishhg_IN8 kHzCallcenter208HINGLISH Call-senter-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 822, Mann 1262, Ukjent 0
TaleHINGLISH_MA_16HinglishHinglishhg_IN16 kHzMedia -lyd216HINGLISH MedielyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 75, Mann 380, Ukjent 0
TaleHispanic_CC_8Spansk engelskSpansk engelskno8 kHzCallcenter212Hispanic Call-center dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 822, Mann 1262, Ukjent 0
TaleHispanic_MA_16Spansk engelskSpansk engelskno16 kHzMedia -lyd155Hispanic Call Media-lydLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 140, Mann 219, Ukjent 5
TaleIndonesisk_GC_8IndonesiskIndonesiskjeg gjorde8 kHzGenerell samtale496Indonesisk generelle samtaledataUskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, indonesiskdualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 524, Mann 454, Ukjent 2
TaleIndonesisk_MA_16IndonesiskIndonesiskjeg gjorde16 kHzMedia -lyd643Indonesisk media lyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 746, Mann 1507, Ukjent 129
TaleIrish_GC_8IrishIrishno_IE8 kHzGenerell samtale192Irske generelle samtaledataUskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 213 , Mann 153 , Ukjent 0
TaleJapansk_SM_48JapanskJapanskja-JP48 kHzManuskriptmonolog2,335Japansk skriftmonologEnkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 1460 Mann 1221 Ukjent 194
TaleKannada_CC_8kannadaKannada (I pipeline) kn_INCallcenter60Kannada (In Pipeline) Call-Center-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleKannada_GCkannadaKannada (I pipeline) kn_INGenerell samtale100Kannada (In Pipeline) Generelle samtaledataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleKannada_MAkannadaKannada (I pipeline) kn_INMedia -lyd40Kannada (In Pipeline) MedielyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleKoreansk_CC_8KoreanskKoreanskko_KR8 kHzCallcenter107Koreanske Call-center-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 1086, Mann 210, Ukjent 4
TaleKoreansk_MA_16KoreanskKoreanskko_KR16 kHzMedia -lyd204Koreanske medielyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 70 Mann 303, Ukjent 25
TaleKoreansk_SM_48KoreanskKoreanskko-KR48 kHzManuskriptmonolog1,955Monolog med koreansk manusEnkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 1195 Mann 1134 Ukjent 122
TaleMalay_GC_8MalayMalayms_MY8 kHzGenerell samtale266Malayisk generelle samtaledataUskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15-60 minutter, Malayisk i Malaysiadualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 316, Mann 176, Ukjent 0
TaleMalay_MA_16MalayMalayms_MY16 kHzMedia -lyd344Malay Media lyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 236, Mann 626, Ukjent 47
TaleMalayalam_CC_8malayalamMalayalam (I pipeline) ml_INCallcenter60Malayalam (In Pipeline) Call-Center-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleMalayalam_GCmalayalamMalayalam (I pipeline) ml_INGenerell samtale100Malayalam (In Pipeline) Generelle samtaledataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleMalayalam_MAmalayalamMalayalam (I pipeline) ml_INMedia -lyd40Malayalam (In Pipeline) MedielyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleMarathi_CC_8marathiMarathi (I pipeline) mr_INCallcenter60Marathi (In Pipeline) Call-Center-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleMarathi_GCmarathiMarathi (I pipeline) mr_INGenerell samtale100Marathi (In Pipeline) Generelle samtaledataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleMarathi_MAmarathiMarathi (I pipeline) mr_INMedia -lyd40Marathi (In Pipeline) MedielyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleMeksikansk_SM_48Spansk (Mexico)Spansk (Mexico)es-MX48 kHzManuskriptmonolog1,492Meksikansk spansk manusmonologEnkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 1016 Mann 1069 Ukjent 95
TaleNederland_SM_48DutchDutchnl-NL48 kHzManuskriptmonolog1,205Nederlandsk skriftmonologEnkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 1285 Mann 531 Ukjent 3
TaleNew York English_CC_8New York engelskNew York engelskno8 kHzCallcenter103New York English Call-center dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 610, Mann 532, Ukjent 0
TaleNew York English_GC_8New York engelskNew York engelskno8 kHzGenerell samtale107New York engelsk generelle samtaledataUskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 118, Mann 114, Ukjent 0
TaleNew York English_MA_16New York engelskNew York engelskno16 kHzMedia -lyd140New York English Media lyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 66, Mann 230, Ukjent 11
TaleNew Zealand_GC_8New Zealand engelsk New Zealand engelsk no_NZ8 kHzGenerell samtale148New Zealand engelsk generelle samtaledataUskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 167, mann 121, Ukjent 4
TaleNew Zealand_MA_16New Zealand engelsk New Zealand engelsk no_NZ16 kHzMedia -lyd400New Zealand engelsk media lydLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 367, mann 678, Ukjent 26
TaleOriya_CC_8OriyaOriya (I pipeline) eller_INCallcenter60Oriya (In Pipeline) Call-Center-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleOriya_GCOriyaOriya (I pipeline) eller_INGenerell samtale100Oriya (In Pipeline) Generelle samtaledataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleOriya_MAOriyaOriya (I pipeline) eller_INMedia -lyd40Oriya (In Pipeline) MedielyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalePolsk_MA_16polskpolskpl_pl16 kHzMedia -lyd269Polsk media lydLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 173 Mann 354 Ukjent 6
TalePolsk Polen_SM_48Polsk (Polen)Polsk (Polen)pl-PL48 kHzManuskriptmonolog1,482Polsk Polen - ManuskriptmonologEnkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 1324 Mann 701 Ukjent 24
TalePunjabi_CC_8punjabiPunjabi (I pipeline) punjabiCallcenter60Punjabi (In Pipeline) Call-Center-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalePunjabi_GCpunjabiPunjabi (I pipeline) punjabiGenerell samtale100Punjabi (In Pipeline) Generelle samtaledataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalePunjabi_MApunjabiPunjabi (I pipeline) punjabi Media -lyd40Punjabi (In Pipeline) MedielyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleRussisk_SM_48RussiskRussiskru-RU48 kHzManuskriptmonolog2,398Monolog med russisk manusEnkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 1689 Mann 1937 Ukjent 214
TaleSkotsk_GC_8skotsk (engelsk aksent)skotsk (engelsk aksent)no_AB8 kHzGenerell samtale292Skotske generelle samtaledataUskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 285 , Mann 260, Ukjent 3
TaleSingapore_CC_8Singapore engelskSingapore engelskno_SG8 kHzCallcenter218Singapore Call-Center-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 2139 , Mann 884, Ukjent 21
TaleSingapore_MA_16Singapore engelskSingapore engelskno_SG16 kHzMedia -lyd247Singapore Media lyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 160, Mann 455, Ukjent 37
TaleSørafrikansk engelsk_CC_8sørafrikansk engelsksørafrikansk engelsken_ZA8 kHzCallcenter261South African English Call-Center dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 1274 , Mann 935 , Ukjent 1
TaleSørafrikansk engelsk_MA_16sørafrikansk engelsksørafrikansk engelsken_ZA16 kHzMedia -lyd251Sørafrikansk engelsk media lyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 235, Mann 432, Ukjent 36
TaleSwahili_CC_8swahiliswahilisw_KE8 kHzCallcenter230Swahili Call-Center-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 611, Mann 833, Ukjent 0
TaleSwahili_MA_16swahiliswahilisw_KE16 kHzMedia -lyd265Swahili Media lyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 118, Mann 493, Ukjent 25
TaleSvensk_CC_8SvenskSvensksv_SE8 kHzCallcenter250Svensk Call-Center-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 1581, mann 727, Ukjent 2
TaleSvensk_MA_16SvenskSvensksv_SE16 kHzMedia -lyd278Swedish Media lyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 195, mann 500, Ukjent 21
TaleTamil_CC_8TamilskTamil (I pipeline) ta_INCallcenter60Tamil (In Pipeline) Call-Center-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleTamil_GCTamilskTamil (I pipeline) ta_INGenerell samtale100Tamil (In Pipeline) Generelle samtaledataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleTamil_MATamilsk Tamil (I pipeline) ta_INMedia -lyd40Tamil (In Pipeline) MedielyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleTelugu_GC_8telugutelugute_IN8 kHzGenerell samtale553Telugu generelle samtaledataUskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 574 , Mann 564, Ukjent 0
TaleTelugu_MA_16telugutelugute_IN16 kHzMedia -lyd648Telugu Media lyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 207, Mann 963, Ukjent 2
TaleTelugu_CC_8teluguTelugu (I pipeline) te_INCallcenter30Telugu (In Pipeline) Call-Center-dataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleTelugu_GCteluguTelugu (I pipeline) te_INGenerell samtale50Telugu (In Pipeline) Generelle samtaledataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleTelugu_MAteluguTelugu (I pipeline) te_INMedia -lyd20Telugu (In Pipeline) MedielyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleThai_GC_8ThailandskThailandskth_TH8 kHzGenerell samtale183Thai generell samtaleUskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15-60 minutter, et uformelt register som brukes mellom vennerdualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 338, Mann 96, Ukjent 8
TaleThai_MA_8ThailandskThailandskth_TH16 kHzMedia -lyd173Thai Media-lydLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 143, Mann 502, Ukjent 26
TaleTyrkisk Tyrkia_SM_48Tyrkisk TyrkiaTyrkisk Tyrkiatr-TR48 kHzManuskriptmonolog2,027Tyrkisk TyrkiaEnkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 1561 Mann 1241 Ukjent 31
TaleVietnamesisk_GC_8vietnamesiskvietnamesiskvi_VN8 kHzGenerell samtale295Vietnamesiske generelle samtaledataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, nordlig (f.eks. Hanoi), sentral og sørlig (f.eks. Ho Chi Minh-byen).dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 400, mann 380, Ukjente 2
TaleVietnamesisk_MA_16vietnamesiskvietnamesiskvi_VN16 kHzMedia -lyd257vietnamesisk media lyddataLisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutterMonoNettkilde5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 249, mann 200, Ukjente 45
TaleWelsh_GC_8walisisk (engelsk aksent)walisisk (engelsk aksent)no_WL8 kHzGenerell samtale278walisiske generelle samtaledataUskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter,dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinne 270, Mann 324, Ukjent 0
TaleStorbritannia engelsk_WW_16UK engelskUK engelskno_uk16 kHzWake Word200 høyttalereWake Word engelsk engelsksøkeord innsamling av data
  • 200 høyttalere
  • 4 unike nøkkelsetninger per høyttaler
  • 25-30 gjentatte nøkkelsetningsopptak per unik nøkkelfrase
  • 25-30 lydfiler per unik nøkkelfrase
  • Totalt 120 innspilte ytringer per høyttaler
1 kanalMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKjønn: 50 % mann, 50 % kvinne, +/- 10 %.

Tjenester tilbys

Ekspertlyddatainnsamling er ikke alt-hånd-på-dekk for omfattende AI-oppsett. Hos Shaip kan du til og med vurdere følgende tjenester for å gjøre modellene mye mer utbredt enn vanlig:

Innsamling av tekstdata

Innsamling av tekstdata
Tjenester

Den sanne verdien av Shaip kognitive datainnsamlingstjenester er at det gir organisasjoner nøkkelen til å låse opp kritisk informasjon som finnes i ustrukturerte data

Innsamling av bildedata

Tjenester for innsamling av bildedata

Sørg for at datasynsmodellen din identifiserer hvert bilde nøyaktig, for sømløst å trene neste generasjons AI-modeller for fremtiden

Videodatainnsamling

Videodatainnsamlingstjenester

Fokuser nå på datasyn sammen med NLP for å trene modellene dine til å identifisere objekter, individer, avskrekkende midler og andre visuelle elementer til perfeksjon

Shaip Kontakt oss

Vil du bygge ditt eget lyddatasett?

Ta kontakt med vår interne taledatainnsamlingsekspert for å sette opp et lydlager som best passer dine behov

  • Ved å registrere meg godtar jeg Shaip Personvernserklæring og Våre vilkår og gi mitt samtykke til å motta B2B-markedsføringskommunikasjon fra Shaip.

Taledatainnsamling for en ML-modell refererer til prosessen med å samle inn lydopptak av talespråk. Denne samlingen hjelper til med å trene og raffinere maskinlæringsalgoritmer, spesielt de som er sentrert om å forstå og behandle menneskelige stemmer.

Når du har som mål å samle inn lyddata for Automatic Speech Recognition (ASR), bør du starte med å definere prosjektets spesifikke behov, inkludert ønsket språk, aksent og taletype. Etter å ha angitt disse parameterne, sørg for at du får alle nødvendige tillatelser for å respektere brukernes personvern. Bruk deretter passende opptaksenheter eller programvare for å fange klare lydprøver. Hvert opptak bør omhyggelig kommenteres med sin transkripsjon eller andre relevante metadata og lagres systematisk for enkel tilgang.

Et taledatasett i maskinlæring er sentralt for opplæring, testing og validering av modeller skreddersydd for å gjenkjenne, transkribere eller tolke talespråk. Slike datasett baner vei for en myriade av applikasjoner, fra taleassistenter og transkripsjonstjenester til stemmebiometri.

For å samle nøyaktige data fra forskjellige språk og aksenter, er samarbeid med morsmål med ønsket språkbakgrunn avgjørende. Mål for et variert og representativt utvalg for å dekke et bredt spekter av demografiske nyanser. Bruk standardisert opptaksutstyr i enhetlige miljøer for å sikre lydkonsistens. Og viktigere, annoter hver databit med detaljerte transkripsjoner og metadata, som angir det spesifikke språket og aksenten.