Over 22 XNUMX timer med lyddata ble samlet inn og transkribert for å trene en flerspråklig digital assistent.
LOUISVILLE, KENTUCKY, USA, 1. august 2022: Shaip gjør det mulig for et amerikansk multinasjonalt datateknologiselskap med over 22 13 timer med lyddata å trene sin flerspråklige digitale assistent på over XNUMX språk fra hele verden.
Over 7 millioner ytringer på 30 sekunder eller mindre ble samlet inn, transkribert og levert på mindre enn åtte måneder, samtidig som de sikret en sunn blanding av høyttalere etter alder, kjønn, utdanning og dialekter i en mangfoldig blanding av opptaksmiljøer i 16 kHz-frekvens.
Vatsal Ghiya, administrerende direktør i Shaip, sa: "Shaip er ledende innen Samtale AI Prosjekter. Vi har aktivert flere Fortune 500-selskaper med NLP-datakravene deres. Vi delte den samme visjonen med kunden og gjorde dem i stand til å forbedre løsninger med gullstandarddata som løser fremtidige problemer som betyr noe."
Han legger videre til: "Behovet for Utterance-opplæring oppstår fra det faktum at ikke alle kunder bruker de samme ordene eller frasene mens de samhandler eller stiller spørsmål til stemmeassistentene sine i et skriptformat. Det er derfor spesifikke stemmeapplikasjoner må trenes på spontan taledata. For eksempel: "Hvor ligger det nærmeste sykehuset?" "Finn et sykehus i nærheten av meg" eller "Er det et sykehus i nærheten?" alle indikerer den samme søkehensikten, men er formulert annerledes. Shaip kan hjelpe deg med å identifisere og artikulere ytringer på måter folk ville samhandle med en stemmeassistent i et virkelighetsscenario.»
Arbeidsomfanget for Shaip inkluderte, men var ikke begrenset til, å skaffe store mengder lydtreningsdata for talegjenkjenning, transkribere lydopptak på flere språk og levere tilsvarende JSON-filer som inneholder metadataene. Shaip kan samle ytringer i skala samtidig som de opprettholder ønsket kvalitetsnivå som kreves for å trene ML-modeller for komplekse prosjekter.
Om Shaip
Med hovedkontor i Louisville, Kentucky, Shaip er en fullstendig administrert dataplattform designet for bedrifter som ønsker å løse sine mest krevende AI-utfordringer som muliggjør smartere, raskere og bedre resultater. Shaip støtter alle aspekter av AI-treningsdata fra datainnsamling, lisensiering, merking, transkribering og avidentifikasjon ved sømløst å skalere våre ansatte, plattformer og prosesser for å hjelpe bedrifter med å utvikle sine AI- og ML-modeller. For å lære hvordan du kan gjøre datavitenskapsteamet ditt og ledernes liv mer håndterlig, besøk oss på www.shaip.com.
Mediekontakt
Anubhav Saraf
Seniorsjef – Markedsføring
866-426-9412
info@shaip.com
12806 Townepark Way, Louisville, KY 40243-2311
kilde: Shaip