Datasett for elektroniske helsejournaler (EHR) for AI- og ML-prosjekter
Hyllevare elektroniske helsejournaler (EPJ)-datasett for å komme i gang med Healthcare AI-prosjektet ditt.
Plugg inn medisinske data du har gått glipp av i dag
Finn de riktige elektroniske helsejournaldataene (EPJ) for din AI for helsevesenet
Forbedre maskinlæringsmodellene dine med klassens beste treningsdata. Elektroniske helsejournaler eller EPJ er medisinske journaler som inneholder pasientens sykehistorie, diagnoser, resepter, behandlingsplaner, vaksinasjons- eller immuniseringsdatoer, allergier, røntgenbilder (CT-skanning, MR, røntgen) og laboratorietester og mer. Vår hyllevarekatalog gjør det enkelt for deg å få medisinsk opplæringsdata du kan stole på.
Hyllevare elektronisk helsejournal (EPJ):
- 5.1 millioner+ registrerer og legelydfiler i 31 spesialiteter
- Medisinske journaler i den virkelige verden for å trene Clinical NLP og andre Document AI-modeller
- Metadatainformasjon som MRN (Anonymisert), Innleggelsesdato, Utskrivelsesdato, Lengde på oppholdsdager, Kjønn, Pasientklasse, Betaler, Finansklasse, Stat, Utskrivningsdisposisjon, Alder, DRG, DRG-beskrivelse, $ Refusjon, AMLOS, GMLOS, Risiko for dødelighet, alvorlighetsgrad av sykdom, Grouper, sykehuspostnummer, etc.
- Medisinske journaler fra forskjellige amerikanske stater og regioner - Nordøst (46%), Sør (9%), Midtvesten (3%), Vest (28%), Andre (14%)
- Medisinske journaler som tilhører alle pasientklasser som dekkes - poliklinisk, poliklinisk (klinisk, rehabilitering, tilbakevendende, kirurgisk barnehage), akutt.
- Medisinske journaler som tilhører alle pasientaldersgrupper <10 år (7.9%), 11-20 år (5.7%), 21-30 år (10.9%), 31-40 år (11.7%), 41-50 år (10.4% ), 51-60 år (13.8%), 61-70 år (16.1%), 71-80 år (13.3%), 81-90 år (7.8%), 90+ år (2.4%)
- Pasientens kjønnsforhold på 46 % (mann) og 54 % (kvinnelig)
- PII-redigerte dokumenter som følger Safe Harbor-retningslinjene i samsvar med HIPAA
EPJ-data etter sted
Sted | Tekstdokumenter |
---|---|
Nordøst | 4,473,573 |
Sør | 1,801,716 |
Midtvesten | 781,701 |
Vest | 1,509,109 |
EPJ-data etter hoveddiagnosekategori
EPJ-data etter hoveddiagnosekategori | Tekstdokumenter |
---|---|
Sirkulasjonssystemet | 589,730 |
Infeksiøse og parasittiske sykdommer | 559,244 |
Luftveiene | 561,983 |
Muskel- og skjelettsystem og bindevev | 329,344 |
Fordøyelsessystemet | 346,369 |
nervesystemet | 316,243 |
Psykiske sykdommer og lidelser | 282,501 |
Nyre og urinveier | 209,561 |
Graviditet, fødsel og Puerperium | 165,303 |
Nyfødte og andre nyfødte med tilstander som stammer fra perinatalperioden | 163,605 |
Endokrine, ernæringsmessige og metabolske sykdommer og lidelser | 142,808 |
Lever og gallesystem og bukspyttkjertel | 127,172 |
Hud, subkutant vev og bryst | 89,577 |
Skader, forgiftninger og giftige effekter av narkotika | 64,097 |
Blod, bloddannende organer, immunologiske lidelser | 48,990 |
Alkohol/narkotikabruk og alkohol/narkotika-induserte organiske psykiske lidelser | 48,717 |
Flere betydelige traumer | 27,902 |
Øre, nese, munn og hals | 22,987 |
Kvinnelig reproduksjonssystem | 17,010 |
Faktorer som påvirker helsestatus og andre kontakter med helsetjenester | 21,294 |
Myeloproliferative sykdommer og lidelser, dårlig differensierte neoplasmer | 15,620 |
Infeksjoner av humant immunsviktvirus | 12,422 |
Mannlig reproduktivt system | 9,230 |
Eye | 3,549 |
Burns | 444 |
Bruk av alkohol/narkotika eller induserte psykiske lidelser | 48,717 |
Totalt med MDC | 4,175,702 |
Kofferter som bruker en spesialgruppe som 3M (MDC ikke spesifisert) | 1,619,682 |
Polikliniske tilfeller (MDC ikke spesifisert) | 1,980,606 |
Saker uten generert refusjon (MDC ikke spesifisert) | 790,697 |
Totalt inkludert alt (saker med og uten MDC-kategori) | 8,566,687 |
Vi håndterer alle typer datalisensiering, dvs. tekst, lyd, video eller bilde. Datasettene består av medisinske datasett for ML: Legedikteringsdatasett, legekliniske notater, medisinsk samtaledatasett, medisinsk transkripsjonsdatasett, lege-pasientsamtale, medisinske tekstdata, medisinske bilder – CT-skanning, MR, ultralyd (samlet grunnlag tilpassede krav) .
Finner du ikke det du leter etter?
Nye medisinske datasett blir samlet inn på tvers av alle datatyper
Kontakt oss nå for å gi slipp på bekymringene for datainnsamling av helsetreningsdata