Syntetiske helsesamtaler for ASR

Muliggjør utvikling av omgivelsesteknologi gjennom syntetiske helsesamtaler

Omgivelsesteknologi

Over 2000 timer med lyddata samlet inn og transkribert i kliniske omgivelser

I det raskt utviklende domenet til Conversational AI er en av de bemerkelsesverdige applikasjonene innen helsesektoren, hvor teknologi brukes til å strømlinjeforme interaksjoner mellom leverandør og pasient. Vår klient, et ledende navn innen helseteknologi, henvendte seg til Shaip med et krav om å forbedre sin Automatic Speech Recognition (ASR)-modell for bedre å forstå og transkribere samtaler med flere høyttalere i kliniske omgivelser. På grunn av personvernforskrifter var det utfordrende å skaffe seg dialoger i den virkelige verden; derfor var ideen å skape og transkribere syntetiske, men realistiske interaksjoner mellom helsepersonell og pasienter.

Volum

2,000 timer, eller ca 12,000 til 24,000 individuelle syntetiske interaksjoner av 10 minutters gjennomsnittlig varighet.

Målet

Vårt primære mål var å generere rundt 2,000 12,000 timer med lydopptak, oversette til 24,000 XNUMX til XNUMX XNUMX omhyggelig utformede syntetiske interaksjoner, som legemliggjør et mangfold i kjønn, alder, aksenter og medisinske roller. Dette omfattende og autentiske datasettet, designet for å etterligne kliniske dialoger i den virkelige verden, ble opprettet mens de strengt fulgte personvernregler som HIPAA. De syntetiske interaksjonene fungerte som et rikt datasett, medvirkende til å trene og foredle vår klients ASR-modell, noe som betydelig forbedret dens ferdigheter i å håndtere virkelige samtaler i kliniske omgivelser.

 

Mål

Utfordringer

Overholdelse av regelverk

Å sikre overholdelse av personvernlover som HIPAA mens du skaper realistiske, men syntetiske helseinteraksjoner, kan være utfordrende.

Overholdelse av regelverk

Dataautentisitet og mangfold

Å lage syntetiske interaksjoner som nøyaktig etterligner kliniske dialoger i den virkelige verden, samtidig som de omfatter et bredt spekter av scenarier, aksenter, aldre og medisinske roller krever en grundig tilnærming og dyp domenekunnskap.

Dataautentisitet og mangfold

Kvalitetssikring

Å oppnå et høyt nivå av nøyaktighet i transkripsjon, slik som målrettet 95 % Word Accuracy Rate (WER) og 90 % Tag Accuracy Rate (TER), krever strenge kvalitetssikringsprosesser.

Tekniske evner

Det er en betydelig utfordring å sikre at den tekniske infrastrukturen, inkludert opptaks- og transkripsjonsplattformene, kan håndtere datamengden og opprettholde kvaliteten.

Ressursrekruttering og opplæring

Å rekruttere personer med medisinsk bakgrunn for rollespill, og sikre at de følger realistiske scenarier samtidig som de opprettholder en naturlig samtaleflyt, kan være ganske utfordrende. I tillegg krever opplæring av transkripsjonister til å følge strenge kvalitetsretningslinjer betydelig innsats og ekspertise.

Tilnærming/løsning

Lydinnsamling og transkripsjon

  • Oppretting av scenarier: Utviklet realistiske scenarier som gjenspeiler vanlige ikke-hastende tilstander som oppstår i familiemedisinsk praksis for voksne, som hypertensjon, diabetes og smertebehandling.
  • Rollespill: Rekrutterte individer med medisinsk bakgrunn til rollespill som helsepersonell og pasienter, ved å følge de angitte scenariene og simulere kliniske samtaler i den virkelige verden.
  • Innspilling: Brukte Shaip Work Mobile App for å fange opp lyd, og sikre en mangfoldig representasjon når det gjelder kjønn, alder, aksenter og faglig bakgrunn blant deltakerne.

Validering og transkripsjon

  • Utførte valideringsskript for å sikre nøyaktigheten og kvaliteten på lydfilene.
  • Transkripsjoner ble utført på Bhasha-plattformen, i henhold til spesifikke retningslinjer gitt, og sikret ordrett teksttranskripsjon med presis diarisering.
  • Kommenterte metadata inkludert høyttaler-ID, alder, kjønn, morsmål og medisinsk opplæring/erfaring, som var avgjørende for klientens modellopplæringsformål.

Kvalitetssikring

  • Omfattende kvalitetskontroller av CQA og PMO sikret et mål for transkripsjonskvalitet på 95 % Word Accuracy Rate (WER) og 90 % Tag Accuracy Rate (TER).

Datalevering

  • Strukturerte dataene på en klar, organisert måte og leverte dem i grupper, sammen med detaljerte batchnotater og kulturkataloger.
  • Sørget for at alle data, inkludert lydfiler, transkripsjoner og metadata, var nøyaktig merket og formatert i henhold til kundens spesifikasjoner.

Tilbakemelding og iterasjon

Etablerte en robust tilbakemeldingssløyfe med klienten for å identifisere eventuelle mangler, og sikre at korrigeringer ble gjort og et komplett, nøyaktig datasett ble levert.

Nøkkelprestasjoner

  • Vellykket innsamling og transkripsjon av 2000 timer med syntetiske helseinteraksjoner.
  • Rask og nøyaktig transkripsjon med en bemerkelsesverdig nøyaktighetsrate, noe som bidrar betydelig til kundens mål om å forbedre sin ASR-modell.
  • Demonstrerte Shaips evne til å håndtere store, komplekse prosjekter med en grundig tilnærming til kvalitet og nøyaktighet.

Utfallet

Det omhyggelig utførte prosjektet tilrettelagt av Shaip resulterte i et rikt datasett som i betydelig grad bidro til forbedringen av kundens ASR-modell. De syntetiske interaksjonene skapte en realistisk representasjon av kliniske dialoger, og hjalp klienten med å oppnå en mer robust og pålitelig taletjeneste for helsemiljøer. Gjennom en strukturert og godt koordinert tilnærming sikret Shaip en vellykket levering av et komplekst prosjekt innenfor den fastsatte tidsrammen, og styrket sin ekspertise i å administrere storskala samtale-AI-prosjekter i helsevesenet.

Samarbeidet vårt med Shaip fremmet prosjektet vårt innen Ambient Technology og Conversational AI innen helsevesenet betydelig. Deres ekspertise på å lage og transkribere syntetiske helsetjenester dialoger ga et solid grunnlag, og viste frem potensialet til syntetiske data for å overvinne regulatoriske utfordringer. Med Shaip navigerte vi disse hindringene og er nå et skritt nærmere å realisere vår visjon om intuitive helsetjenester.

Gylden-5-stjerners

Akselerer din Healthcare AI
applikasjonsutvikling med 100 %