HIPAA-kompatible lyddata for legediktering for helsevesenets AI

Få fart på innovasjonen innen AI innen helsevesenet ved å bruke ferdige lyddata for legediktering som er i samsvar med personvern- og HIPAA-forskrifter.

Legediktering lyddatadatasett

Koble til datakilden du har gått glipp av i dag

Medisinske lyddatasett av høy kvalitet for smartere AI-modeller

Vårt avidentifiserte helsedatasett inneholder lydfiler fra 31 ulike spesialiteter, omhyggelig diktert av leger. Disse opptakene fanger opp detaljerte beskrivelser av pasienters kliniske tilstander og behandlingsplaner, hentet fra reelle lege-pasient-interaksjoner på sykehus og i kliniske omgivelser. Dette datasettet er i full overensstemmelse med personvernforskrifter og er ideelt for trening av avanserte AI-modeller for helsevesenet.

Medisinske lyddata etter kjønn
Spesialitet Pasientlydfiler (spilletid i timer) Totalt antall lydfiler
Totalt257,9775,172,766
mann58,8502,444,910
Hunn113,4061,290,900
Ukjent85,7211,436,956
Medisinske lyddata etter spesialitet
Spesialitet Pasientlydfiler (spilletid i timer) Totalt antall lydfiler
Totalt257,9775,172,766
Ulykke og krise9359
Allergi og immunologi115222202
anestesiologi67722280
Anestetika19
APRN1631693
Kardiologi675041566721
Hjerte17122
Hjerte-thoraxkirurgi110
Klinisk hematologi02
Kolon og endetarmskirurgi7162
Kolorektal kirurg45984
Kritisk omsorgsmedisin2204328
Tannlege165
Dermatology77123014
Kostholdsekspert og ernæringsfysiolog44736
Nødsmedisin4911112518
endokrinologi2057052
ENT7010175477
Familemedisin1767106733
Gastroenterologi145840365
Allmenn medisin1405757
Generell praksis411318
Generell kirurgi203871744
gynekologi3269103370
Håndkirurgi245
hematologi2588125
Hospitalist5931142529
Infeksjonssykdom49314001
Indremedisin15410445591
Intervensjonell kardiologi151143035
Mors-føtal medisin511355
neonatology104524760
Nefrologi73520334
Nevrologi226963774
Nevrokirurgi46211990
Nukleær medisin223
OBGYN3562122303
Onkologi293882996
Oftalmologi131641047
Optometry331066
Ortopedi5665164483
Øre3433100811
Patologi1664097
Pediatrisk pulmonologi440
Pediatrisk spesialitet35682
Barnekirurgi223
Pediatrics8779271
Fysisk medisin og rehabilitering134723523
Fysioterapeut1141713
Lege Ass.638
Podiatrisk kirurgi424
Podiatry47312296
Primary Care65120120
Psykiatri212060381
Lunge129035290
Stråle onkologi2396558
Radiologi334599641
revmatologi2938729
SICU125
Talepatologi328
Kirurgisk onkologi2175758
Brystkirurgi1073336
Transplantasjonskirurgi611535
Urologi317096934
Øvre gastrointestinale kirurgi458
VASKULÆRE OPERASJONER19156
Vaskulær/Generelt9268
Wound Care15211
Medisinske lyddata etter enhet
Spesialitet Pasientlydfiler (spilletid i timer) Totalt antall lydfiler
Totalt257,9775,172,766
iPhone66632,382
Digital Recorder1,65922,377
Blandetype69,8181,408,679
Smartphone51,5331,306,405
SpeechMic10,329257,730
Telefondiktasjon120,8672,071,557
Ukjent3,10473,636

Vi håndterer alle typer datalisensiering, dvs. tekst, lyd, video eller bilde. Datasettene består av medisinske datasett for ML: Legedikteringsdatasett, legekliniske notater, medisinsk samtaledatasett, medisinsk transkripsjonsdatasett, lege-pasientsamtale, medisinske tekstdata, medisinske bilder – CT-skanning, MR, ultralyd (samlet grunnlag tilpassede krav) .

Shaip kontakt oss

Finner du ikke det du leter etter?

Nye medisinske datasett blir samlet inn på tvers av alle datatyper 

Kontakt oss nå for å gi slipp på bekymringene for datainnsamling av helsetreningsdata

  • Ved å registrere meg godtar jeg Shaip Personvernerklæring og Våre vilkår og gi mitt samtykke til å motta B2B-markedsføringskommunikasjon fra Shaip.

Lyddata fra legediktat består av lydfiler der leger beskriver en pasients kliniske tilstand, behandlingsplan eller sykehistorie under konsultasjoner eller sykehusbesøk.

Disse dataene er avgjørende for å trene AI-modeller i talegjenkjenning, naturlig språkbehandling (NLP) og automatisering av klinisk dokumentasjon. De bidrar til å bygge systemer for transkribering, analyse og forbedring av arbeidsflyter for helsedokumentasjon.

Datasettet inneholder 257,977 31 timer med legediktat fra XNUMX medisinske spesialiteter i den virkelige verden. Lyd tas opp med ulike enheter, inkludert telefoner, digitale opptakere, smarttelefoner og talemikrofoner.

Ja, alle lydfiler avidentifiseres for å fjerne personlig identifiserbar informasjon (PII), noe som sikrer pasientens konfidensialitet.

Ja, datasettene overholder HIPAA- og Safe Harbor-retningslinjene, sammen med andre globale personvernstandarder.

Ja, datasett kan skreddersys til spesifikke spesialiteter, demografi eller opptaksenhetstyper basert på prosjektets krav.

Absolutt. Datasettene er omfattende, med millioner av lydfiler, noe som gjør dem egnet for både små og store AI/ML-prosjekter.

De medisinske lyddataene og tilhørende transkripsjoner leveres i standardformater som sømløst kan integreres i talegjenkjennings- og NLP-modeller (natural language processing).

Lyddataene gjennomgår strenge kvalitetskontroller, og domeneeksperter validerer annoteringer for å sikre nøyaktighet og pålitelighet.

Kostnaden avhenger av faktorer som datamengde, tilpasning og prosjektomfang. Vi ber deg fylle ut «Kontakt oss»-skjemaet med dine krav for å motta det beste tilbudet.

Leveringsfristene varierer basert på prosjektets størrelse og kompleksitet, men er strukturert for å overholde tidsfrister effektivt.

Disse datasettene forbedrer AI-funksjoner i å automatisere klinisk dokumentasjon, forbedre transkripsjonsnøyaktigheten og muliggjøre bedre beslutningstaking for helsepersonell.