Mest pålitelige taledatainnsamlingstjenester for din AI
Tren opp NLP-modellene, VA-er, TTS-prototyper og mer med samtaledata av høy kvalitet, med våre lyd- og taledatainnsamlingstjenester
Oppdag lyddatapipelines uten flaskehalser
Utvalgte klienter
Profesjonell lyd-/taledatainnsamlingstjenester
Hvilket som helst emne. Ethvert scenario.
Hos Shaip ligger vår ekspertise i å lage høykvalitets taledatasett designet for varierte AI/ML-krav. Vi tilbyr et ekspansivt utvalg av språk og tar opp i forskjellige innstillinger, noe som gjør datasettene våre omfattende og tilpasningsdyktige. Oditt fokus er på å mate modeller med det høyeste volumet av tilpassede taledata, på minst mulig tid. Med oss om bord kan du forvente:
- Kuratert høykvalitets flerspråklig lyd-/taledata for å forbedre nøyaktigheten
- Høyest mulig nivå av domenespesifisitet til target mangfoldig scenario oppsett
- Skaler ML-modellen din for å passe til ulike demografier og vertikaler
- Opptaksmiljøer: Studiokvalitet, med krystallklar lyd med minimal bakgrunnsstøy, og Naturlige miljøer, der opptak inneholder omgivelseslyder for å etterligne virkelige situasjoner.
100 +
55K +
Timer med taledata
250 +
Prosjekter
60 +
Språk (100+ dialekter)
8 / 16 / 44 / 48 kHz
Samplingsfrekvens
Vår ekspertise
Juster lyddata for smartere NLP-modeller
Shaip tilbyr ende-til-ende tale-/lyddatainnsamlingstjenester på over 100+ språk for å muliggjøre stemmeaktiverte teknologier for å imøtekomme et mangfoldig sett av publikum over hele verden. Vi kan jobbe med prosjekter av alle omfang og størrelser; fra lisensiering av eksisterende lyddatasett, til å administrere tilpasset lyddatainnsamling, til lydtranskripsjon og merknader. Uansett hvor stort taledatainnsamlingsprosjektet ditt er, kan vi tilpasse lydinnsamlingstjenestene for å passe dine behov for å bygge NLP-datasett av høy kvalitet som er målrettet mot dialekter, toner og språk. Velg fra vårt brede utvalg av taledatasett og lyddatainnsamlingsressurser, for stemmeaktiverende intelligente oppsett.
Monolog talesamling
Den fokuserer på å behandle tale fra en enkelt høyttaler. Bruk skriptede forespørsler for å mate inn enkeltkanals lydfiler, og sikre at unike talemønstre, toner og nyanser er spesifikke for den personen.
Dialog Tale
Samling
Interaksjon med to personer, replikerer virkelige samtaler og dialoger med flerspråklig eksponering via tokanalsfiler og transkriberte ressurser.
Gruppe / Muti-party
samtaler
Diskusjoner med flere personer, fanger gruppedynamikk, overlapping og varierte toner for å trene talemodeller nøyaktig.
Naturlig språk ytringssamling
Tren AI-er til å identifisere setninger eller vekke ord med lignende betydninger ved å bruke forskjellige, rike og autentiske ytringer for avansert naturlig språkbehandling og -forståelse.
Akustiske data
Samling
Vi kan profesjonelt ta opp lyddata i studiokvalitet, enten det er restauranter, kontorer eller hjem eller fra ulike miljøer og språk, samtidig som vi dekker et bredere akustisk spekter (omfattende lyddatasett).
Automatisk talegjenkjenning (ASR)
Forbedre nøyaktigheten til dine automatiske talegjenkjenningssystemer (ASR) ved å ha tilgang til avanserte diversifiserte tale-/lyddatasett fra et bredt spekter av demografi.
Flerspråklig tale/lydtreningsdata
Våre dyktige språkfagfolk over hele verden tilbyr flerspråklige lyd-/taledata på forskjellige språk og dialekter. Denne innsatsen fremmer global kommunikasjon og bygger bro over språkbarrierer, og bidrar til mer inkluderende og effektive AI-løsninger.
Tekst-til-tale
(TTS)
Bygg en tekst-til-tale (TTS) flerspråklig modell ved hjelp av vår globale arbeidsstyrke, som hjelper deg å samle inn taledata på 150+ språk og dialekter for å forbedre AI-modellene dine fra kontroller i bilen til chatbots og læringsløsninger med høy- lyddata av høy kvalitet.
Call Center
innspillinger
Ekte utvekslinger mellom agenter og kunder, som støtter en rekke språk som spansk, tysk, amerikansk engelsk, bengali, japansk, kinesisk og hindi.
Suksesshistorier
Samtale AI-datasett med over 3 8 timer med data på XNUMX språk
Kunden ønsket å bygge en flerspråklig plattform for indiske språk, og samarbeidet med Shaip for å samle inn, segmentere og transkribere store datasett på flere indiske språk. Dette vil bidra til å utvikle effektive talemodeller som kan drive klientens innovative nye plattform.
problem: Over 3,000 timer med lyddata samlet på 8 indiske språk, segmentert og transkribert for å utvikle automatisk talegjenkjenning.
Løsning: Vi leverte datainnsamling, segmentering, transkripsjon og leverte JSON-filer med metadata. Vi samlet inn 3000 timer med lyddata på 8 indiske språk i skala for klientens taleteknologiprosjekt.
Grunner til å velge Shaip som din pålitelige partner for taledatainnsamling
porsjoner
Dedikerte og trente team:
- 30,000+ samarbeidspartnere for dataskaping, merking og kvalitetssikring
- Godkjent prosjektlederteam
- Erfarent produktutviklingsteam
- Talentpool-innkjøps- og onboarding-team
Prosess
Høyeste prosesseffektivitet er sikret med:
- Robust 6 Sigma Stage-Gate-prosess
- Et dedikert team av 6 Sigma svarte belter – nøkkelprosesseiere og overholdelse av kvalitet
- Kontinuerlig forbedring og tilbakemeldingssløyfe
Plattform
Den patenterte plattformen tilbyr fordeler:
- Nettbasert ende-til-ende-plattform
- Upåklagelig kvalitet
- Raskere TAT
- Sømløs levering
porsjoner
Dedikerte og trente team:
- 30,000+ samarbeidspartnere for dataskaping, merking og kvalitetssikring
- Godkjent prosjektlederteam
- Erfarent produktutviklingsteam
- Talentpool-innkjøps- og onboarding-team
Prosess
Høyeste prosesseffektivitet er sikret med:
- Robust 6 Sigma Stage-Gate-prosess
- Et dedikert team av 6 Sigma svarte belter – nøkkelprosesseiere og overholdelse av kvalitet
- Kontinuerlig forbedring og tilbakemeldingssløyfe
Plattform
Den patenterte plattformen tilbyr fordeler:
- Nettbasert ende-til-ende-plattform
- Upåklagelig kvalitet
- Raskere TAT
- Sømløs levering
Hyllevare for tale-/lyddatasett
Detaljer | Corpus ID (Unik) | søkeord | Språkdatasett | Språkkode | Eksempelfrekvens | Datasettype | Totale lydtimer | Kort beskrivelse | Datasettbeskrivelse | Audio Channel | Opptaksplattform | Wer (%) | Lydformat | Transkripsjonsformat | Bruk sak | Antall høyttalere | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
no_US_CC_8 | Afroamerikansk folkespråk | Afroamerikansk folkespråk | no | 8 kHz | Callcenter | 211 | Afroamerikanske samtalesenterdata | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne: 612, mann: 1242 og ukjent: 12 | Kontakt | |
no_US_MA_16 | Afroamerikansk folkespråk | Afroamerikansk folkespråk | no | 16 kHz | Media -lyd | 154 | African American Vernacular Media data | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne: 151, mann: 150 og ukjent: 10 | Kontakt | |
Afrikaans_GC_8 | afrikaans | afrikaans | af_ZA | 8 kHz | Generell samtale | 368 | Afrikaans generelle samtaledata | Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15-60 minutter, afrikaans snakkes i Afrika | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne: 502, mann: 390 og ukjent: 2 | Kontakt | |
Afrikaans_MA_16 | afrikaans | afrikaans | af_ZA | 16 kHz | Media -lyd | 658 | afrikanske mediefiler | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne: 750, mann: 1278 og ukjent: 52 | Kontakt | |
Arabisk_GC_8 | Arabisk | Arabisk | ar_AE | 8 kHz | Generell samtale | 292 | Arabisk generelle samtaledata | Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15-60 minutter, arabisk fra Gulf-landene | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne: 171, mann: 534 og ukjent: 1 | Kontakt | |
Arabisk_SM_48 | Arabisk | Arabisk | ar-SA | 48 kHz | Manuskriptmonolog | 1,947 | Monolog med arabisk skrift | Enkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 838 Mann 1209 Ukjent 78 | Kontakt | |
Assamese_CC_8 | Assamesisk | Assamisk (I pipeline) | som i | Callcenter | 60 | Assamisk (In Pipeline) Call-Center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Assamese_GC | Assamesisk | Assamisk (I pipeline) | som i | Generell samtale | 100 | Assamisk (I Pipeline) Generelle samtaledata | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Assamese_MA | Assamesisk | Assamisk (I pipeline) | som i | Media -lyd | 40 | Assamisk (In Pipeline) Medielyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Bengali_CC_8 | Bengalsk | Bengali (I pipeline) | bn_IN | Callcenter | 60 | Bengali (In Pipeline) Call-Center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Bengali_GC | Bengalsk | Bengali (I pipeline) | bn_IN | Generell samtale | 100 | Bengali (In Pipeline) Generelle samtaledata | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Bengali_MA | Bengalsk | Bengali (I pipeline) | bn_IN | Media -lyd | 40 | Bengali (In Pipeline) Medielyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Boston_CC_8 | Boston engelsk | Boston engelsk | no | 8 kHz | Callcenter | 177 | Boston Call-center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne: 605, mann: 711 og ukjent: 0 | Kontakt | |
Boston_GC_8 | Boston engelsk | Boston engelsk | no | 8 kHz | Generell samtale | 32 | Boston generelle samtaledata | Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne: 53, mann: 83 og ukjent: 0 | Kontakt | |
Boston_MA_16 | Boston engelsk | Boston engelsk | no | 16 kHz | Media -lyd | 93 | Boston Media lyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne: 43, mann: 181 og ukjent: 2 | Kontakt | |
Kanadisk_SM_48 | Kanadisk fransk | Kanadisk fransk | fr-CA | 48 kHz | Manuskriptmonolog | 1,222 | Kanadisk fransk | Enkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 974 Mann 631 Ukjent 1 | Kontakt | |
Kinesisk_CC_8 | Kinesisk engelsk | Kinesisk engelsk | no | 8 kHz | Callcenter | 169 | Kinesisk kundesenterdata | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne: 1790, Mann: 523 og Ukjent: 13 | Kontakt | |
Kinesisk_MA_16 | Kinesisk engelsk | Kinesisk engelsk | no | 16 kHz | Media -lyd | 249 | Kinesiske medier lyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne: 126, Mann: 346 og Ukjent: 6 | Kontakt | |
Kinesisk forenklet_SM_48 | Kinesisk med enkle tegn | Kinesisk med enkle tegn | zh-CN | 48 kHz | Manuskriptmonolog | 2,762 | Kinesisk med enkle tegn | Enkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 1920 Mann 1535 Ukjent 270 | Kontakt | |
Tradisjonell kinesisk_SM_48 | Tradisjonell kinesisk | Tradisjonell kinesisk | zh-TW | 48 kHz | Manuskriptmonolog | 1,028 | Tradisjonell kinesisk | Enkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 1069 Mann 262 Ukjent 3 | Kontakt | |
Danish_GC_8 | Dansk | Dansk | da_DK | 8 kHz | Generell samtale | 372 | Danske generelle samtaledata | Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne: 311, Mann: 417, Ukjent: 0 | Kontakt | |
Danish_MA_16 | Dansk | Dansk | da_DK | 16 kHz | Media -lyd | 664 | Danske mediers lyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne: 369, Mann: 864, Ukjent: 27 | Kontakt | |
Danish_SM_48 | Dansk | Dansk | da-DK | 48 kHz | Manuskriptmonolog | 2,579 | Dansk skriftmonolog | Enkelttaleopptak, som har en tendens til å falle i intervallet 5 til 30 sekunder, dansk fra Danmark | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 1551 Mann 1233 Ukjent 42 | Kontakt | |
Engelsk Deep South_CC_8 | Engelsk Deep South | Engelsk Deep South | no | 8 kHz | Callcenter | 151 | Engelsk Deep South Call-center data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 221 , Mann 1004 , Ukjent 7 | Kontakt | |
Engelsk Deep South_GC_8 | Engelsk Deep South | Engelsk Deep South | no | 8 kHz | Generell samtale | 56 | Engelsk Deep South Generelle samtaledata | Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 99, Mann 31, Ukjent 0 | Kontakt | |
Engelsk Deep South_MA_16 | Engelsk Deep South | Engelsk Deep South | no | 16 kHz | Media -lyd | 266 | Engelsk Deep South Media lyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 204, Mann 356, Ukjent 21 | Kontakt | |
German_CC_8 | Tysk | Tysk | de-De | 8 kHz | Callcenter | 64 | Tyske Call-center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | Mono | desktop | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 478 Mann 1440 Ukjent 0 | Kontakt | ||
Tysk_IVR_8 | Tysk | Tysk | de-De | 8 kHz | IVR | 200 | Tyske IVR-data | Menneske til maskin. En IVR-type flyt der det er en TTS-forespørsel (f.eks. "Hvordan kan jeg hjelpe deg") etterfulgt av en spontan menneskelig respons | Mono | desktop | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 10115 Mann 8750 Ukjent 0 | Kontakt | ||
Gujarati_CC_8 | gujarati | Gujarati (I pipeline) | gu_IN | Callcenter | 60 | Gujarati (In Pipeline) Call-Center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Gujarati_GC | gujarati | Gujarati (I pipeline) | gu_IN | Generell samtale | 100 | Gujarati (In Pipeline) Generelle samtaledata | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Gujarati_MA | gujarati | Gujarati (I pipeline) | gu_IN | Media -lyd | 40 | Gujarati (In Pipeline) Medielyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Hebraisk_Generell samtale_8 | hebraisk | hebraisk | he_IL | 8 kHz | Generell samtale | 399 | Hebraisk generelle samtaledata | Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15-60 minutter, hebraisk i Israel | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 414 , Mann 399 , Ukjent 1 | Kontakt | |
Hebraisk_MA_16 | hebraisk | hebraisk | he_IL | 16 kHz | Media -lyd | 427 | Hebraisk media lyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 361 , Mann 513, Ukjent 13 | Kontakt | |
Hindi_MA_16 | Hindi | Hindi | hei_IN | 16 kHz | Media -lyd | 219 | Hindi Media lyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 83 , Mann 309, Ukjent 0 | Kontakt | |
Hindi_SM_48 | Hindi | Hindi | hi-IN | 48 kHz | Manuskriptmonolog | 2,867 | Hindi scripted monolog | Enkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 1977 Mann 1864 Ukjent 147 | Kontakt | |
HINGLISH_CC_8 | Hinglish | Hinglish | hg_IN | 8 kHz | Callcenter | 208 | HINGLISH Call-senter-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 822, Mann 1262, Ukjent 0 | Kontakt | |
HINGLISH_MA_16 | Hinglish | Hinglish | hg_IN | 16 kHz | Media -lyd | 216 | HINGLISH Medielyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 75, Mann 380, Ukjent 0 | Kontakt | |
Hispanic_CC_8 | Spansk engelsk | Spansk engelsk | no | 8 kHz | Callcenter | 212 | Hispanic Call-center data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 822, Mann 1262, Ukjent 0 | Kontakt | |
Hispanic_MA_16 | Spansk engelsk | Spansk engelsk | no | 16 kHz | Media -lyd | 155 | Hispanic Call Media-lyd | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 140, Mann 219, Ukjent 5 | Kontakt | |
Indonesisk_GC_8 | Indonesisk | Indonesisk | jeg gjorde | 8 kHz | Generell samtale | 496 | Indonesisk generelle samtaledata | Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, indonesisk | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 524, Mann 454, Ukjent 2 | Kontakt | |
Indonesisk_MA_16 | Indonesisk | Indonesisk | jeg gjorde | 16 kHz | Media -lyd | 643 | Indonesisk media lyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 746, Mann 1507, Ukjent 129 | Kontakt | |
Irish_GC_8 | Irish | Irish | no_IE | 8 kHz | Generell samtale | 192 | Irske generelle samtaledata | Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 213 , Mann 153 , Ukjent 0 | Kontakt | |
Japansk_SM_48 | Japansk | Japansk | ja-JP | 48 kHz | Manuskriptmonolog | 2,335 | Japansk skriftmonolog | Enkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 1460 Mann 1221 Ukjent 194 | Kontakt | |
Kannada_CC_8 | kannada | Kannada (I pipeline) | kn_IN | Callcenter | 60 | Kannada (In Pipeline) Call-Center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Kannada_GC | kannada | Kannada (I pipeline) | kn_IN | Generell samtale | 100 | Kannada (In Pipeline) Generelle samtaledata | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Kannada_MA | kannada | Kannada (I pipeline) | kn_IN | Media -lyd | 40 | Kannada (In Pipeline) Medielyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Koreansk_CC_8 | Koreansk | Koreansk | ko_KR | 8 kHz | Callcenter | 107 | Koreanske Call-center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 1086, Mann 210, Ukjent 4 | Kontakt | |
Koreansk_MA_16 | Koreansk | Koreansk | ko_KR | 16 kHz | Media -lyd | 204 | Koreanske medielyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 70 Mann 303, Ukjent 25 | Kontakt | |
Koreansk_SM_48 | Koreansk | Koreansk | ko-KR | 48 kHz | Manuskriptmonolog | 1,955 | Monolog med koreansk manus | Enkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 1195 Mann 1134 Ukjent 122 | Kontakt | |
Malay_GC_8 | Malay | Malay | ms_MY | 8 kHz | Generell samtale | 266 | Malayisk generelle samtaledata | Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15-60 minutter, Malayisk i Malaysia | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 316, Mann 176, Ukjent 0 | Kontakt | |
Malay_MA_16 | Malay | Malay | ms_MY | 16 kHz | Media -lyd | 344 | Malay Media lyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 236, Mann 626, Ukjent 47 | Kontakt | |
Malayalam_CC_8 | malayalam | Malayalam (I pipeline) | ml_IN | Callcenter | 60 | Malayalam (In Pipeline) Call-Center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Malayalam_GC | malayalam | Malayalam (I pipeline) | ml_IN | Generell samtale | 100 | Malayalam (In Pipeline) Generelle samtaledata | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Malayalam_MA | malayalam | Malayalam (I pipeline) | ml_IN | Media -lyd | 40 | Malayalam (In Pipeline) Medielyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Marathi_CC_8 | marathi | Marathi (I pipeline) | mr_IN | Callcenter | 60 | Marathi (In Pipeline) Call-Center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Marathi_GC | marathi | Marathi (I pipeline) | mr_IN | Generell samtale | 100 | Marathi (In Pipeline) Generelle samtaledata | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Marathi_MA | marathi | Marathi (I pipeline) | mr_IN | Media -lyd | 40 | Marathi (In Pipeline) Medielyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Meksikansk_SM_48 | Spansk (Mexico) | Spansk (Mexico) | es-MX | 48 kHz | Manuskriptmonolog | 1,492 | Meksikansk spansk manusmonolog | Enkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 1016 Mann 1069 Ukjent 95 | Kontakt | |
Nederland_SM_48 | Dutch | Dutch | nl-NL | 48 kHz | Manuskriptmonolog | 1,205 | Nederlandsk skriftmonolog | Enkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 1285 Mann 531 Ukjent 3 | Kontakt | |
New York English_CC_8 | New York engelsk | New York engelsk | no | 8 kHz | Callcenter | 103 | New York English Call-center data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 610, Mann 532, Ukjent 0 | Kontakt | |
New York English_GC_8 | New York engelsk | New York engelsk | no | 8 kHz | Generell samtale | 107 | New York engelsk generelle samtaledata | Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 118, Mann 114, Ukjent 0 | Kontakt | |
New York English_MA_16 | New York engelsk | New York engelsk | no | 16 kHz | Media -lyd | 140 | New York English Media lyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 66, Mann 230, Ukjent 11 | Kontakt | |
New Zealand_GC_8 | New Zealand engelsk | New Zealand engelsk | no_NZ | 8 kHz | Generell samtale | 148 | New Zealand engelsk generelle samtaledata | Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 167, mann 121, Ukjent 4 | Kontakt | |
New Zealand_MA_16 | New Zealand engelsk | New Zealand engelsk | no_NZ | 16 kHz | Media -lyd | 400 | New Zealand engelsk media lyd | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 367, mann 678, Ukjent 26 | Kontakt | |
Oriya_CC_8 | Oriya | Oriya (I pipeline) | eller_IN | Callcenter | 60 | Oriya (In Pipeline) Call-Center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Oriya_GC | Oriya | Oriya (I pipeline) | eller_IN | Generell samtale | 100 | Oriya (In Pipeline) Generelle samtaledata | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Oriya_MA | Oriya | Oriya (I pipeline) | eller_IN | Media -lyd | 40 | Oriya (In Pipeline) Medielyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Polsk_MA_16 | polsk | polsk | pl_pl | 16 kHz | Media -lyd | 269 | Polsk media lyd | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 173 Mann 354 Ukjent 6 | Kontakt | |
Polsk Polen_SM_48 | Polsk (Polen) | Polsk (Polen) | pl-PL | 48 kHz | Manuskriptmonolog | 1,482 | Polsk Polen - Manuskriptmonolog | Enkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 1324 Mann 701 Ukjent 24 | Kontakt | |
Punjabi_CC_8 | punjabi | Punjabi (I pipeline) | punjabi | Callcenter | 60 | Punjabi (In Pipeline) Call-Center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Punjabi_GC | punjabi | Punjabi (I pipeline) | punjabi | Generell samtale | 100 | Punjabi (In Pipeline) Generelle samtaledata | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Punjabi_MA | punjabi | Punjabi (I pipeline) | punjabi | Media -lyd | 40 | Punjabi (In Pipeline) Medielyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Russisk_SM_48 | Russisk | Russisk | ru-RU | 48 kHz | Manuskriptmonolog | 2,398 | Monolog med russisk manus | Enkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 1689 Mann 1937 Ukjent 214 | Kontakt | |
Skotsk_GC_8 | skotsk (engelsk aksent) | skotsk (engelsk aksent) | no_AB | 8 kHz | Generell samtale | 292 | Skotske generelle samtaledata | Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 285 , Mann 260, Ukjent 3 | Kontakt | |
Singapore_CC_8 | Singapore engelsk | Singapore engelsk | no_SG | 8 kHz | Callcenter | 218 | Singapore Call-Center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 2139 , Mann 884, Ukjent 21 | Kontakt | |
Singapore_MA_16 | Singapore engelsk | Singapore engelsk | no_SG | 16 kHz | Media -lyd | 247 | Singapore Media lyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 160, Mann 455, Ukjent 37 | Kontakt | |
Sørafrikansk engelsk_CC_8 | sørafrikansk engelsk | sørafrikansk engelsk | en_ZA | 8 kHz | Callcenter | 261 | South African English Call-Center data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 1274 , Mann 935 , Ukjent 1 | Kontakt | |
Sørafrikansk engelsk_MA_16 | sørafrikansk engelsk | sørafrikansk engelsk | en_ZA | 16 kHz | Media -lyd | 251 | Sørafrikansk engelsk media lyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 235, Mann 432, Ukjent 36 | Kontakt | |
Swahili_CC_8 | swahili | swahili | sw_KE | 8 kHz | Callcenter | 230 | Swahili Call-Center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 611, Mann 833, Ukjent 0 | Kontakt | |
Swahili_MA_16 | swahili | swahili | sw_KE | 16 kHz | Media -lyd | 265 | Swahili Media lyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 118, Mann 493, Ukjent 25 | Kontakt | |
Svensk_CC_8 | Svensk | Svensk | sv_SE | 8 kHz | Callcenter | 250 | Svensk Call-Center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 1581, mann 727, Ukjent 2 | Kontakt | |
Svensk_MA_16 | Svensk | Svensk | sv_SE | 16 kHz | Media -lyd | 278 | Swedish Media lyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 195, mann 500, Ukjent 21 | Kontakt | |
Tamil_CC_8 | Tamilsk | Tamil (I pipeline) | ta_IN | Callcenter | 60 | Tamil (In Pipeline) Call-Center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Tamil_GC | Tamilsk | Tamil (I pipeline) | ta_IN | Generell samtale | 100 | Tamil (In Pipeline) Generelle samtaledata | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Tamil_MA | Tamilsk | Tamil (I pipeline) | ta_IN | Media -lyd | 40 | Tamil (In Pipeline) Medielyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Telugu_GC_8 | telugu | telugu | te_IN | 8 kHz | Generell samtale | 553 | Telugu generelle samtaledata | Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15–60 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 574 , Mann 564, Ukjent 0 | Kontakt | |
Telugu_MA_16 | telugu | telugu | te_IN | 16 kHz | Media -lyd | 648 | Telugu Media lyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 207, Mann 963, Ukjent 2 | Kontakt | |
Telugu_CC_8 | telugu | Telugu (I pipeline) | te_IN | Callcenter | 30 | Telugu (In Pipeline) Call-Center-data | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Telugu_GC | telugu | Telugu (I pipeline) | te_IN | Generell samtale | 50 | Telugu (In Pipeline) Generelle samtaledata | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Telugu_MA | telugu | Telugu (I pipeline) | te_IN | Media -lyd | 20 | Telugu (In Pipeline) Medielyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Thai_GC_8 | Thailandsk | Thailandsk | th_TH | 8 kHz | Generell samtale | 183 | Thai generell samtale | Uskriptet telefonsamtale mellom to personer. Ca. Lydvarighet (område) - 15-60 minutter, et uformelt register som brukes mellom venner | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 338, Mann 96, Ukjent 8 | Kontakt | |
Thai_MA_8 | Thailandsk | Thailandsk | th_TH | 16 kHz | Media -lyd | 173 | Thai Media-lyd | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 143, Mann 502, Ukjent 26 | Kontakt | |
Tyrkisk Tyrkia_SM_48 | Tyrkisk Tyrkia | Tyrkisk Tyrkia | tr-TR | 48 kHz | Manuskriptmonolog | 2,027 | Tyrkisk Tyrkia | Enkeltytende opptak, som har en tendens til å falle i området 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 1561 Mann 1241 Ukjent 31 | Kontakt | |
Vietnamesisk_GC_8 | vietnamesisk | vietnamesisk | vi_VN | 8 kHz | Generell samtale | 295 | Vietnamesiske generelle samtaledata | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, nordlig (f.eks. Hanoi), sentral og sørlig (f.eks. Ho Chi Minh-byen). | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 400, mann 380, Ukjente 2 | Kontakt | |
Vietnamesisk_MA_16 | vietnamesisk | vietnamesisk | vi_VN | 16 kHz | Media -lyd | 257 | vietnamesisk media lyddata | Lisenserbare offentlige lyd-/videofiler som intervjuer, podcaster osv. - 1 til 5 personer. Ca. Lydvarighet (rekkevidde) 15-60 minutter | Mono | Nettkilde | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 249, mann 200, Ukjente 45 | Kontakt | |
Welsh_GC_8 | walisisk (engelsk aksent) | walisisk (engelsk aksent) | no_WL | 8 kHz | Generell samtale | 278 | walisiske generelle samtaledata | Uskriptet, syntetisk telefonsamtale mellom "agent" og "kunde", ca. Lydvarighet (område) 5–15 minutter, | dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinne 270, Mann 324, Ukjent 0 | Kontakt | |
Storbritannia engelsk_WW_16 | UK engelsk | UK engelsk | no_uk | 16 kHz | Wake Word | 200 høyttalere | Wake Word engelsk engelsk | søkeord innsamling av data
| 1 kanal | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kjønn: 50 % mann, 50 % kvinne, +/- 10 %. | Kontakt |
Tjenester tilbys
Ekspertlyddatainnsamling er ikke alt-hånd-på-dekk for omfattende AI-oppsett. Hos Shaip kan du til og med vurdere følgende tjenester for å gjøre modellene mye mer utbredt enn vanlig:
Innsamling av tekstdata
Tjenester
Den sanne verdien av Shaip kognitive datainnsamlingstjenester er at det gir organisasjoner nøkkelen til å låse opp kritisk informasjon som finnes i ustrukturerte data
Tjenester for innsamling av bildedata
Sørg for at datasynsmodellen din identifiserer hvert bilde nøyaktig, for sømløst å trene neste generasjons AI-modeller for fremtiden
Videodatainnsamlingstjenester
Fokuser nå på datasyn sammen med NLP for å trene modellene dine til å identifisere objekter, individer, avskrekkende midler og andre visuelle elementer til perfeksjon
Anbefalte ressurser
Vi tilbyr
Lydkommentarer for intelligente AI-er
Lydkommentartjenester har vært en sterk styrke for Shaip siden begynnelsen. Utvikle, tren og forbedre konversasjons-AI, chatbots og talegjenkjenningsmotorer med våre toppmoderne lydkommentartjenester.
Kjøperhåndbok
Kjøperveiledning: Komplett veiledning til konversasjons-AI
Chatboten du snakket med kjører på et avansert AI-system for samtaler som er trent, testet og bygget ved hjelp av tonnevis av talegjenkjenningsdatasett.
Datakatalog
Hyllevarekatalog for taledata og lisensiering
Det finnes en lang rekke vanlige applikasjoner for taledata i AI-prosjekter. Vi tilbyr deg enorme mengder data av høy kvalitet klar for din stemmegjenkjenning.
Vil du bygge ditt eget lyddatasett?
Ta kontakt med vår interne taledatainnsamlingsekspert for å sette opp et lydlager som best passer dine behov
Ofte stilte spørsmål (FAQ)
Taledatainnsamling for en ML-modell refererer til prosessen med å samle inn lydopptak av talespråk. Denne samlingen hjelper til med å trene og raffinere maskinlæringsalgoritmer, spesielt de som er sentrert om å forstå og behandle menneskelige stemmer.
Når du har som mål å samle inn lyddata for Automatic Speech Recognition (ASR), bør du starte med å definere prosjektets spesifikke behov, inkludert ønsket språk, aksent og taletype. Etter å ha angitt disse parameterne, sørg for at du får alle nødvendige tillatelser for å respektere brukernes personvern. Bruk deretter passende opptaksenheter eller programvare for å fange klare lydprøver. Hvert opptak bør omhyggelig kommenteres med sin transkripsjon eller andre relevante metadata og lagres systematisk for enkel tilgang.
Et taledatasett i maskinlæring er sentralt for opplæring, testing og validering av modeller skreddersydd for å gjenkjenne, transkribere eller tolke talespråk. Slike datasett baner vei for en myriade av applikasjoner, fra taleassistenter og transkripsjonstjenester til stemmebiometri.
For å samle nøyaktige data fra forskjellige språk og aksenter, er samarbeid med morsmål med ønsket språkbakgrunn avgjørende. Mål for et variert og representativt utvalg for å dekke et bredt spekter av demografiske nyanser. Bruk standardisert opptaksutstyr i enhetlige miljøer for å sikre lydkonsistens. Og viktigere, annoter hver databit med detaljerte transkripsjoner og metadata, som angir det spesifikke språket og aksenten.