Mest pålitelige taledatainnsamlingstjenester for din AI
Tren opp NLP-modellene, VA-er, TTS-prototyper og mer med samtaledata av høy kvalitet, med våre lyd- og taledatainnsamlingstjenester
Oppdag lyddatapipelines uten flaskehalser.
Utvalgte klienter
Hvorfor er datasett for taleopplæring nødvendig for behandling av naturlig språk?
Har du noen gang lagt merke til at smarttelefonen VA, dvs. Siri, Bixby eller noe annet, samhandler? Måten de svarer på alle spørsmål og analyserer og presenterer resultater i henhold til dine krav!
Vel, så mye som disse VA-ene fascinerer oss, må disse intelligente ressursene og programmene trenes gradvis for å kunne svare, så nøyaktig. Dette er grunnen til at du bør vurdere å outsource tale/lyd og taledatainnsamling til spesialiserte datainnsamlingsselskaper, med validerende faglig ekspertise.
Investering i innsamling av lyddata forbereder din påståtte NLP for å imøtekomme et flerspråklig publikum. Ikke bare det, taledatainnsamling for NLP, som og når den håndteres av en ekspert, tar til og med innsamling i felt, semantisk analyse og lydtranskripsjon i betraktning. Med profesjonelle løsninger for taledatainnsamling kan du:
- Skaff høykvalitets lyddatasett for å forbedre nøyaktigheten
- MÃ¥lrett ulike scenarier oppsett
- Samle flerspråklige AI-treningsdata
- Skaler ML-modellen din for å passe til ulike demografier og vertikaler
Profesjonelle lyd-/taledatainnsamlingstjenester for NLP
Hvilket som helst emne. Ethvert scenario.
Intelligente NLP-systemer er alt annet enn generiske. Avhengig av funksjonaliteten til programmet, må du kanskje fokusere på romlige og flerspråklige lyddatatjenester, som kun kan tilbys av anerkjente selskaper for innsamling av tale/lyddata. Det er her Shaip kommer inn i ordningen som en svært pålitelig leverandør av datatilkoblingstjenester som setter sin ære i å gjøre det tunge løftet for dine antatt intelligente AI-er.
Hos Shaip er vårt primære fokus på å mate modeller med høyest mulig volum av tilpassede taleprøver, på minst mulig tid. Med oss ​​om bord kan du forvente:
- Kuratert lyd-/taledatainnsamling for NLP
- Skreddersydde programmer som reagerer i henhold til spesifikke brukstilfeller
- Klargjør mining av lyddatasett
- Mønsterspesifikk og automatisert databehandling
- Høyest mulig nivå av domenespesifisitet
- Raskere tid til markedet med akselererte AI-modeller
VÃ¥r ekspertise
Juster lyddata for å forberede smarte NLP-modeller
Shaip tilbyr ende-til-ende tale-/lyddatainnsamlingstjenester på over 100+ språk for å muliggjøre stemmeaktiverte teknologier for å imøtekomme et mangfoldig sett av publikum over hele verden. Vi kan jobbe med prosjekter av alle omfang og størrelser; fra lisensiering av eksisterende lyddatasett, til å administrere tilpasset lyddatainnsamling, til lydtranskripsjon og merknader. Uansett hvor stort taledatainnsamlingsprosjektet ditt er, kan vi tilpasse lydinnsamlingstjenestene for å passe dine behov for å bygge NLP-datasett av høy kvalitet som er målrettet mot dialekter, toner og språk. Velg fra vårt brede utvalg av taledatasett og lyddatainnsamlingsressurser, for stemmeaktiverende intelligente oppsett.
Monolog talesamling
Håndter talebaserte krav knyttet til en frittstående høyttaler for Text-to-Speed-prototypene dine og transkripsjonsspesifikke krav med skriptmating via enkanalsfiler.
Dialog Tale
Samling
Sett opp intelligente virtuelle assistenter, hastighetsspesifikke chatbots og modeller for automatisk talegjenkjenning med flerspråklig eksponering via tokanalsfiler og transkriberte ressurser.
Akustiske data
Samling
Vi kan profesjonelt ta opp lyddata i studiokvalitet, enten det er restauranter, kontorer eller hjem eller fra ulike miljøer og språk, gjennom vårt globale nettverk av samarbeidspartnere, samtidig som vi dekker et bredere akustisk spekter
Naturlig språk ytringssamling
Tren smarte kommersielle oppsett for å identifisere forskjellige uttalte kundefraser med lignende betydning, for å gjøre AI-ene mer autonome i tid
Digital / Virtuelt
assistenter
Fokuser på å bygge din kommende virtuelle assistent ved å trene modeller med forbehold om menneskelig tale, flerspråklig eksponering, kontekstuell analyse og NLU.
Automatisk talegjenkjenning (ASR)
Forbedre nøyaktigheten til dine automatiske talegjenkjenningssystemer (ASR) ved å ha tilgang til avanserte diversifiserte tale-/lyddatasett fra et bredt spekter av demografi.
Flerspråklig tale/lydtreningsdata
Våre svært dyktige språkfagfolk over hele verden tilbyr flerspråklig lyd-/taleopplæringsdata på flere språk og dialekter, inkludert arabisk, dansk, kinesisk, afrikaans, Singapore, New Zealand, hebraisk, indonesisk, irsk, koreansk, malaysisk, polsk, skotsk, svensk , fransk, tysk, vietnamesisk, thai, italiensk, spansk og mer.
Tekst-til-tale
(TTS)
For å tilby en bedre brukeropplevelse med TTS, er det avgjørende å utvikle et system som høres naturlig ut. Bygg en tekst-til-tale (TTS) flerspråklig modell ved hjelp av vår globale arbeidsstyrke, som hjelper deg å samle inn taledata på 150+ språk og dialekter for å forbedre AI-modellene dine fra kontroller i bilen til chatbots og læringsløsninger med høy- lyddata av høy kvalitet.
Grunner til å velge Shaip som din pålitelige partner for taledatainnsamling
porsjoner
Dedikerte og trente team:
- 30,000+ samarbeidspartnere for dataskaping, merking og kvalitetssikring
- Godkjent prosjektlederteam
- Erfarent produktutviklingsteam
- Talentpool-innkjøps- og onboarding-team
Prosess
Høyeste prosesseffektivitet er sikret med:
- Robust 6 Sigma Stage-Gate-prosess
- Et dedikert team av 6 Sigma svarte belter – nøkkelprosesseiere og overholdelse av kvalitet
- Kontinuerlig forbedring og tilbakemeldingssløyfe
Plattform
Den patenterte plattformen tilbyr fordeler:
- Nettbasert ende-til-ende-plattform
- Upåklagelig kvalitet
- Raskere TAT
- Sømløs levering
porsjoner
Dedikerte og trente team:
- 30,000+ samarbeidspartnere for dataskaping, merking og kvalitetssikring
- Godkjent prosjektlederteam
- Erfarent produktutviklingsteam
- Talentpool-innkjøps- og onboarding-team
Prosess
Høyeste prosesseffektivitet er sikret med:
- Robust 6 Sigma Stage-Gate-prosess
- Et dedikert team av 6 Sigma svarte belter – nøkkelprosesseiere og overholdelse av kvalitet
- Kontinuerlig forbedring og tilbakemeldingssløyfe
Plattform
Den patenterte plattformen tilbyr fordeler:
- Nettbasert ende-til-ende-plattform
- Upåklagelig kvalitet
- Raskere TAT
- Sømløs levering
Språk: Innsamlet lyddatasett
Hyllevare for tale-/lyddatasett
Detaljer | Corpus ID (Unik) | søkeord | Språkdatasett | Språkkode | Eksempelfrekvens | Datasettype | Totale lydtimer | Kort beskrivelse | Datasettbeskrivelse | Audio Channel | Opptaksplattform | WER (%) | Lydformat | Transkripsjonsformat | Bruk sak | Antall høyttalere | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
no_US_CC_8 | Afroamerikansk folkespråk | Afroamerikansk folkespråk | no | 8 kHz | Callcenter | 211 | Afroamerikanske samtalesenterdata | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne: 612, mann: 1242 og ukjent: 12 | Kontakt | |
no_US_MA_16 | Afroamerikansk folkespråk | Afroamerikansk folkespråk | no | 16 kHz | Media Audio | 154 | African American Vernacular Media data | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne: 151, mann: 150 og ukjent: 10 | Kontakt | |
Afrikaans_GC_8 | afrikaans | afrikaans | af_ZA | 8 kHz | Generell samtale | 368 | Afrikaans generelle samtaledata | Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15-60 minutter, afrikaans snakkes i Afrika | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne: 502, mann: 390 og ukjent: 2 | Kontakt | |
Afrikaans_MA_16 | afrikaans | afrikaans | af_ZA | 16 kHz | Media Audio | 658 | afrikanske mediefiler | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne: 750, mann: 1278 og ukjent: 52 | Kontakt | |
Arabisk_GC_8 | Arabisk | Arabisk | ar_AE | 8 kHz | Generell samtale | 292 | Arabisk generelle samtaledata | Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15-60 minutter, arabisk fra Gulf-landene | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne: 171, mann: 534 og ukjent: 1 | Kontakt | |
Arabisk_SM_48 | Arabisk | Arabisk | ar-SA | 48 kHz | Manuskriptmonolog | 1,947 | Monolog med arabisk skrift | Enkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 838 Mann 1209 Ukjent 78 | Kontakt | |
Assamese_CC_8 | Assamesisk | Assamisk (I pipeline) | som i | Callcenter | 60 | Assamisk (In Pipeline) Call-Center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Assamese_GC | Assamesisk | Assamisk (I pipeline) | som i | Generell samtale | 100 | Assamisk (I Pipeline) Generelle samtaledata | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Assamese_MA | Assamesisk | Assamisk (I pipeline) | som i | Media Audio | 40 | Assamisk (In Pipeline) Medielyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Bengali_CC_8 | Bengalsk | Bengali (I pipeline) | bn_IN | Callcenter | 60 | Bengali (In Pipeline) Call-Center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Bengali_GC | Bengalsk | Bengali (I pipeline) | bn_IN | Generell samtale | 100 | Bengali (In Pipeline) Generelle samtaledata | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Bengali_MA | Bengalsk | Bengali (I pipeline) | bn_IN | Media Audio | 40 | Bengali (In Pipeline) Medielyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Boston_CC_8 | Boston engelsk | Boston engelsk | no | 8 kHz | Callcenter | 177 | Boston Call-center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne: 605, mann: 711 og ukjent: 0 | Kontakt | |
Boston_GC_8 | Boston engelsk | Boston engelsk | no | 8 kHz | Generell samtale | 32 | Boston generelle samtaledata | Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne: 53, mann: 83 og ukjent: 0 | Kontakt | |
Boston_MA_16 | Boston engelsk | Boston engelsk | no | 16 kHz | Media Audio | 93 | Boston Media lyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne: 43, mann: 181 og ukjent: 2 | Kontakt | |
Kanadisk_SM_48 | Kanadisk fransk | Kanadisk fransk | fr-CA | 48 kHz | Manuskriptmonolog | 1,222 | Kanadisk fransk | Enkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 974 Mann 631 Ukjent 1 | Kontakt | |
Kinesisk_CC_8 | Kinesisk engelsk | Kinesisk engelsk | no | 8 kHz | Callcenter | 169 | Kinesisk kundesenterdata | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne: 1790, Mann: 523 og Ukjent: 13 | Kontakt | |
Kinesisk_MA_16 | Kinesisk engelsk | Kinesisk engelsk | no | 16 kHz | Media Audio | 249 | Kinesiske medier lyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne: 126, Mann: 346 og Ukjent: 6 | Kontakt | |
Kinesisk forenklet_SM_48 | Kinesisk med enkle tegn | Kinesisk med enkle tegn | zh-CN | 48 kHz | Manuskriptmonolog | 2,762 | Kinesisk med enkle tegn | Enkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 1920 Mann 1535 Ukjent 270 | Kontakt | |
Tradisjonell kinesisk_SM_48 | Tradisjonell kinesisk | Tradisjonell kinesisk | zh-TW | 48 kHz | Manuskriptmonolog | 1,028 | Tradisjonell kinesisk | Enkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 1069 Mann 262 Ukjent 3 | Kontakt | |
Danish_GC_8 | Dansk | Dansk | da_DK | 8 kHz | Generell samtale | 372 | Danske generelle samtaledata | Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne: 311, Mann: 417, Ukjent: 0 | Kontakt | |
Danish_MA_16 | Dansk | Dansk | da_DK | 16 kHz | Media Audio | 664 | Danske mediers lyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne: 369, Mann: 864, Ukjent: 27 | Kontakt | |
Danish_SM_48 | Dansk | Dansk | da-DK | 48 kHz | Manuskriptmonolog | 2,579 | Dansk skriftmonolog | Enkelttaleopptak, som har en tendens til å falle i intervallet 5 til 30 sekunder, dansk fra Danmark | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 1551 Mann 1233 Ukjent 42 | Kontakt | |
Engelsk Deep South_CC_8 | Engelsk Deep South | Engelsk Deep South | no | 8 kHz | Callcenter | 151 | Engelsk Deep South Call-center data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 221 , Mann 1004 , Ukjent 7 | Kontakt | |
Engelsk Deep South_GC_8 | Engelsk Deep South | Engelsk Deep South | no | 8 kHz | Generell samtale | 56 | Engelsk Deep South Generelle samtaledata | Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 99, Mann 31, Ukjent 0 | Kontakt | |
Engelsk Deep South_MA_16 | Engelsk Deep South | Engelsk Deep South | no | 16 kHz | Media Audio | 266 | Engelsk Deep South Media lyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 204, Mann 356, Ukjent 21 | Kontakt | |
German_CC_8 | Tysk | Tysk | de-De | 8 kHz | Callcenter | 64 | Tyske Call-center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | Mono | desktop | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 478 Mann 1440 Ukjent 0 | Kontakt | ||
Tysk_IVR_8 | Tysk | Tysk | de-De | 8 kHz | IVR | 200 | Tyske IVR-data | Menneske til maskin. En IVR-type flyt der det er en TTS-forespørsel (f.eks. "Hvordan kan jeg hjelpe deg") etterfulgt av en spontan menneskelig respons | Mono | desktop | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 10115 Mann 8750 Ukjent 0 | Kontakt | ||
Gujarati_CC_8 | gujarati | Gujarati (I pipeline) | gu_IN | Callcenter | 60 | Gujarati (In Pipeline) Call-Center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Gujarati_GC | gujarati | Gujarati (I pipeline) | gu_IN | Generell samtale | 100 | Gujarati (In Pipeline) Generelle samtaledata | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Gujarati_MA | gujarati | Gujarati (I pipeline) | gu_IN | Media Audio | 40 | Gujarati (In Pipeline) Medielyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Hebraisk_Generell samtale_8 | hebraisk | hebraisk | he_IL | 8 kHz | Generell samtale | 399 | Hebraisk generelle samtaledata | Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15-60 minutter, hebraisk i Israel | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 414 , Mann 399 , Ukjent 1 | Kontakt | |
Hebraisk_MA_16 | hebraisk | hebraisk | he_IL | 16 kHz | Media Audio | 427 | Hebraisk media lyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 361 , Mann 513, Ukjent 13 | Kontakt | |
Hindi_MA_16 | Hindi | Hindi | hei_IN | 16 kHz | Media Audio | 219 | Hindi Media lyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 83 , Mann 309, Ukjent 0 | Kontakt | |
Hindi_SM_48 | Hindi | Hindi | hi-IN | 48 kHz | Manuskriptmonolog | 2,867 | Hindi scripted monolog | Enkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 1977 Mann 1864 Ukjent 147 | Kontakt | |
HINGLISH_CC_8 | Hinglish | Hinglish | hg_IN | 8 kHz | Callcenter | 208 | HINGLISH Call-senter-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 822, Mann 1262, Ukjent 0 | Kontakt | |
HINGLISH_MA_16 | Hinglish | Hinglish | hg_IN | 16 kHz | Media Audio | 216 | HINGLISH Medielyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 75, Mann 380, Ukjent 0 | Kontakt | |
Hispanic_CC_8 | Spansk engelsk | Spansk engelsk | no | 8 kHz | Callcenter | 212 | Hispanic Call-center data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 822, Mann 1262, Ukjent 0 | Kontakt | |
Hispanic_MA_16 | Spansk engelsk | Spansk engelsk | no | 16 kHz | Media Audio | 155 | Hispanic Call Media-lyd | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 140, Mann 219, Ukjent 5 | Kontakt | |
Indonesisk_GC_8 | Indonesisk | Indonesisk | jeg gjorde | 8 kHz | Generell samtale | 496 | Indonesisk generelle samtaledata | Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, indonesisk | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 524, Mann 454, Ukjent 2 | Kontakt | |
Indonesisk_MA_16 | Indonesisk | Indonesisk | jeg gjorde | 16 kHz | Media Audio | 643 | Indonesisk media lyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 746, Mann 1507, Ukjent 129 | Kontakt | |
Irish_GC_8 | Irish | Irish | no_IE | 8 kHz | Generell samtale | 192 | Irske generelle samtaledata | Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 213 , Mann 153 , Ukjent 0 | Kontakt | |
Japansk_SM_48 | Japansk | Japansk | ja-JP | 48 kHz | Manuskriptmonolog | 2,335 | Japansk skriftmonolog | Enkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 1460 Mann 1221 Ukjent 194 | Kontakt | |
Kannada_CC_8 | kannada | Kannada (I pipeline) | kn_IN | Callcenter | 60 | Kannada (In Pipeline) Call-Center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Kannada_GC | kannada | Kannada (I pipeline) | kn_IN | Generell samtale | 100 | Kannada (In Pipeline) Generelle samtaledata | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Kannada_MA | kannada | Kannada (I pipeline) | kn_IN | Media Audio | 40 | Kannada (In Pipeline) Medielyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Koreansk_CC_8 | Koreansk | Koreansk | ko_KR | 8 kHz | Callcenter | 107 | Koreanske Call-center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 1086, Mann 210, Ukjent 4 | Kontakt | |
Koreansk_MA_16 | Koreansk | Koreansk | ko_KR | 16 kHz | Media Audio | 204 | Koreanske medielyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 70 Mann 303, Ukjent 25 | Kontakt | |
Koreansk_SM_48 | Koreansk | Koreansk | ko-KR | 48 kHz | Manuskriptmonolog | 1,955 | Monolog med koreansk manus | Enkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 1195 Mann 1134 Ukjent 122 | Kontakt | |
Malay_GC_8 | Malay | Malay | ms_MY | 8 kHz | Generell samtale | 266 | Malayisk generelle samtaledata | Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15-60 minutter, Malayisk i Malaysia | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 316, Mann 176, Ukjent 0 | Kontakt | |
Malay_MA_16 | Malay | Malay | ms_MY | 16 kHz | Media Audio | 344 | Malay Media lyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 236, Mann 626, Ukjent 47 | Kontakt | |
Malayalam_CC_8 | malayalam | Malayalam (I pipeline) | ml_IN | Callcenter | 60 | Malayalam (In Pipeline) Call-Center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Malayalam_GC | malayalam | Malayalam (I pipeline) | ml_IN | Generell samtale | 100 | Malayalam (In Pipeline) Generelle samtaledata | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Malayalam_MA | malayalam | Malayalam (I pipeline) | ml_IN | Media Audio | 40 | Malayalam (In Pipeline) Medielyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Marathi_CC_8 | marathi | Marathi (I pipeline) | mr_IN | Callcenter | 60 | Marathi (In Pipeline) Call-Center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Marathi_GC | marathi | Marathi (I pipeline) | mr_IN | Generell samtale | 100 | Marathi (In Pipeline) Generelle samtaledata | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Marathi_MA | marathi | Marathi (I pipeline) | mr_IN | Media Audio | 40 | Marathi (In Pipeline) Medielyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Meksikansk_SM_48 | Spansk (Mexico) | Spansk (Mexico) | es-MX | 48 kHz | Manuskriptmonolog | 1,492 | Meksikansk spansk manusmonolog | Enkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 1016 Mann 1069 Ukjent 95 | Kontakt | |
Nederland_SM_48 | Dutch | Dutch | nl-NL | 48 kHz | Manuskriptmonolog | 1,205 | Nederlandsk skriftmonolog | Enkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 1285 Mann 531 Ukjent 3 | Kontakt | |
New York English_CC_8 | New York engelsk | New York engelsk | no | 8 kHz | Callcenter | 103 | New York English Call-center data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 610, Mann 532, Ukjent 0 | Kontakt | |
New York English_GC_8 | New York engelsk | New York engelsk | no | 8 kHz | Generell samtale | 107 | New York engelsk generelle samtaledata | Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 118, Mann 114, Ukjent 0 | Kontakt | |
New York English_MA_16 | New York engelsk | New York engelsk | no | 16 kHz | Media Audio | 140 | New York English Media lyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 66, Mann 230, Ukjent 11 | Kontakt | |
New Zealand_GC_8 | New Zealand engelsk | New Zealand engelsk | no_NZ | 8 kHz | Generell samtale | 148 | New Zealand engelsk generelle samtaledata | Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 167, mann 121, Ukjent 4 | Kontakt | |
New Zealand_MA_16 | New Zealand engelsk | New Zealand engelsk | no_NZ | 16 kHz | Media Audio | 400 | New Zealand engelsk media lyd | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 367, mann 678, Ukjent 26 | Kontakt | |
Oriya_CC_8 | Oriya | Oriya (I pipeline) | eller_IN | Callcenter | 60 | Oriya (In Pipeline) Call-Center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Oriya_GC | Oriya | Oriya (I pipeline) | eller_IN | Generell samtale | 100 | Oriya (In Pipeline) Generelle samtaledata | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Oriya_MA | Oriya | Oriya (I pipeline) | eller_IN | Media Audio | 40 | Oriya (In Pipeline) Medielyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Polsk_MA_16 | polsk | polsk | pl_pl | 16 kHz | Media Audio | 269 | Polsk media lyd | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 173 Mann 354 Ukjent 6 | Kontakt | |
Polsk Polen_SM_48 | Polsk (Polen) | Polsk (Polen) | pl-PL | 48 kHz | Manuskriptmonolog | 1,482 | Polsk Polen - Manuskriptmonolog | Enkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 1324 Mann 701 Ukjent 24 | Kontakt | |
Punjabi_CC_8 | punjabi | Punjabi (I pipeline) | punjabi | Callcenter | 60 | Punjabi (In Pipeline) Call-Center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Punjabi_GC | punjabi | Punjabi (I pipeline) | punjabi | Generell samtale | 100 | Punjabi (In Pipeline) Generelle samtaledata | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Punjabi_MA | punjabi | Punjabi (I pipeline) | punjabi | Media Audio | 40 | Punjabi (In Pipeline) Medielyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Russisk_SM_48 | Russisk | Russisk | ru-RU | 48 kHz | Manuskriptmonolog | 2,398 | Monolog med russisk manus | Enkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 1689 Mann 1937 Ukjent 214 | Kontakt | |
Skotsk_GC_8 | skotsk (engelsk aksent) | skotsk (engelsk aksent) | no_AB | 8 kHz | Generell samtale | 292 | Skotske generelle samtaledata | Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 285 , Mann 260, Ukjent 3 | Kontakt | |
Singapore_CC_8 | Singapore engelsk | Singapore engelsk | no_SG | 8 kHz | Callcenter | 218 | Singapore Call-Center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 2139 , Mann 884, Ukjent 21 | Kontakt | |
Singapore_MA_16 | Singapore engelsk | Singapore engelsk | no_SG | 16 kHz | Media Audio | 247 | Singapore Media lyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 160, Mann 455, Ukjent 37 | Kontakt | |
Sørafrikansk engelsk_CC_8 | sørafrikansk engelsk | sørafrikansk engelsk | en_ZA | 8 kHz | Callcenter | 261 | South African English Call-Center data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 1274 , Mann 935 , Ukjent 1 | Kontakt | |
Sørafrikansk engelsk_MA_16 | sørafrikansk engelsk | sørafrikansk engelsk | en_ZA | 16 kHz | Media Audio | 251 | Sørafrikansk engelsk media lyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 235, Mann 432, Ukjent 36 | Kontakt | |
Swahili_CC_8 | swahili | swahili | sw_KE | 8 kHz | Callcenter | 230 | Swahili Call-Center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 611, Mann 833, Ukjent 0 | Kontakt | |
Swahili_MA_16 | swahili | swahili | sw_KE | 16 kHz | Media Audio | 265 | Swahili Media lyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 118, Mann 493, Ukjent 25 | Kontakt | |
Svensk_CC_8 | Svensk | Svensk | sv_SE | 8 kHz | Callcenter | 250 | Svensk Call-Center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 1581, mann 727, Ukjent 2 | Kontakt | |
Svensk_MA_16 | Svensk | Svensk | sv_SE | 16 kHz | Media Audio | 278 | Swedish Media lyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 195, mann 500, Ukjent 21 | Kontakt | |
Tamil_CC_8 | Tamilsk | Tamil (I pipeline) | ta_IN | Callcenter | 60 | Tamil (In Pipeline) Call-Center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Tamil_GC | Tamilsk | Tamil (I pipeline) | ta_IN | Generell samtale | 100 | Tamil (In Pipeline) Generelle samtaledata | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Tamil_MA | Tamilsk | Tamil (I pipeline) | ta_IN | Media Audio | 40 | Tamil (In Pipeline) Medielyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Telugu_GC_8 | telugu | telugu | te_IN | 8 kHz | Generell samtale | 553 | Telugu generelle samtaledata | Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 574 , Mann 564, Ukjent 0 | Kontakt | |
Telugu_MA_16 | telugu | telugu | te_IN | 16 kHz | Media Audio | 648 | Telugu Media lyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 207, Mann 963, Ukjent 2 | Kontakt | |
Telugu_CC_8 | telugu | Telugu (I pipeline) | te_IN | Callcenter | 30 | Telugu (In Pipeline) Call-Center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Telugu_GC | telugu | Telugu (I pipeline) | te_IN | Generell samtale | 50 | Telugu (In Pipeline) Generelle samtaledata | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Telugu_MA | telugu | Telugu (I pipeline) | te_IN | Media Audio | 20 | Telugu (In Pipeline) Medielyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Thai_GC_8 | Thailandsk | Thailandsk | th_TH | 8 kHz | Generell samtale | 183 | Thai generell samtale | Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15-60 minutter, et uformelt register som brukes mellom venner | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 338, Mann 96, Ukjent 8 | Kontakt | |
Thai_MA_8 | Thailandsk | Thailandsk | th_TH | 16 kHz | Media Audio | 173 | Thai Media-lyd | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 143, Mann 502, Ukjent 26 | Kontakt | |
Tyrkisk Tyrkia_SM_48 | Tyrkisk Tyrkia | Tyrkisk Tyrkia | tr-TR | 48 kHz | Manuskriptmonolog | 2,027 | Tyrkisk Tyrkia | Enkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 1561 Mann 1241 Ukjent 31 | Kontakt | |
Vietnamesisk_GC_8 | vietnamesisk | vietnamesisk | vi_VN | 8 kHz | Generell samtale | 295 | Vietnamesiske generelle samtaledata | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, nordlig (f.eks. Hanoi), sentral og sørlig (f.eks. Ho Chi Minh-byen). | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 400, mann 380, Ukjente 2 | Kontakt | |
Vietnamesisk_MA_16 | vietnamesisk | vietnamesisk | vi_VN | 16 kHz | Media Audio | 257 | vietnamesisk media lyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 249, mann 200, Ukjente 45 | Kontakt | |
Welsh_GC_8 | walisisk (engelsk aksent) | walisisk (engelsk aksent) | no_WL | 8 kHz | Generell samtale | 278 | walisiske generelle samtaledata | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 270, Mann 324, Ukjent 0 | Kontakt | |
Storbritannia engelsk_WW_16 | UK engelsk | UK engelsk | no_uk | 16 kHz | Wake Word | 200 høyttalere | Wake Word engelsk engelsk | søkeord innsamling av data
| 1 kanal | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kjønn: 50 % mann, 50 % kvinne, +/- 10 %. | Kontakt |
Tjenester tilbys
Ekspertlyddatainnsamling er ikke alt-hånd-på-dekk for omfattende AI-oppsett. Hos Shaip kan du til og med vurdere følgende tjenester for å gjøre modellene mye mer utbredt enn vanlig:
Innsamling av tekstdata
Tjenester
Den sanne verdien av Shaip kognitive datainnsamlingstjenester er at det gir organisasjoner nøkkelen til å låse opp kritisk informasjon som finnes i ustrukturerte data
Tjenester for innsamling av bildedata
Sørg for at datasynsmodellen din identifiserer hvert bilde nøyaktig, for sømløst å trene neste generasjons AI-modeller for fremtiden
Videodatainnsamlingstjenester
Fokuser nå på datasyn sammen med NLP for å trene modellene dine til å identifisere objekter, individer, avskrekkende midler og andre visuelle elementer til perfeksjon
Anbefalte ressurser
Vi tilbyr
Lydkommentarer for intelligente AI-er
Lydkommentartjenester har vært en sterk styrke for Shaip siden begynnelsen. Utvikle, tren og forbedre konversasjons-AI, chatbots og talegjenkjenningsmotorer med våre toppmoderne lydkommentartjenester.
Kjøperhåndbok
Kjøperveiledning: Komplett veiledning til konversasjons-AI
Chatboten du snakket med kjører på et avansert AI-system for samtaler som er trent, testet og bygget ved hjelp av tonnevis av talegjenkjenningsdatasett.
Datakatalog
Hyllevarekatalog for taledata og lisensiering
Det finnes en lang rekke vanlige applikasjoner for taledata i AI-prosjekter. Vi tilbyr deg enorme mengder data av høy kvalitet klar for din stemmegjenkjenning.
Vil du bygge ditt eget lyddatasett?
Ta kontakt med vår interne taledatainnsamlingsekspert for å sette opp et lydlager som best passer dine behov
Ofte stilte spørsmål (FAQ)
Taledatainnsamling for en ML-modell refererer til prosessen med å samle inn lydopptak av talespråk. Denne samlingen hjelper til med å trene og raffinere maskinlæringsalgoritmer, spesielt de som er sentrert om å forstå og behandle menneskelige stemmer.
Når du har som mål å samle inn lyddata for Automatic Speech Recognition (ASR), bør du starte med å definere prosjektets spesifikke behov, inkludert ønsket språk, aksent og taletype. Etter å ha angitt disse parameterne, sørg for at du får alle nødvendige tillatelser for å respektere brukernes personvern. Bruk deretter passende opptaksenheter eller programvare for å fange klare lydprøver. Hvert opptak bør omhyggelig kommenteres med sin transkripsjon eller andre relevante metadata og lagres systematisk for enkel tilgang.
Et taledatasett i maskinlæring er sentralt for opplæring, testing og validering av modeller skreddersydd for å gjenkjenne, transkribere eller tolke talespråk. Slike datasett baner vei for en myriade av applikasjoner, fra taleassistenter og transkripsjonstjenester til stemmebiometri.
For å samle nøyaktige data fra forskjellige språk og aksenter, er samarbeid med morsmål med ønsket språkbakgrunn avgjørende. Mål for et variert og representativt utvalg for å dekke et bredt spekter av demografiske nyanser. Bruk standardisert opptaksutstyr i enhetlige miljøer for å sikre lydkonsistens. Og viktigere, annoter hver databit med detaljerte transkripsjoner og metadata, som angir det spesifikke språket og aksenten.