DICOM medisinsk bildedatasett for avanserte AI/ML-applikasjoner i helsevesenet
Avidentifisert DICOM-bildedatasett med bevarte metadata – og valgfrie radiologistudierapporter – for å akselerere modelltrening, validering og klinisk forskning.
DICOM-bildedata bygget for ekte kunstig intelligens
Shaip tilbyr AI-klar DICOM medisinske bildedatasett utviklet for å hjelpe AI-team innen helsevesenet med å bygge, trene og validere robuste modeller for diagnose, triage og beslutningsstøtte – ved hjelp av avidentifiserte data som bevarer klinisk verdi.
Datasett-øyeblikksbilde
- Totalt antall studier:10M +
- Toppgeografiske områder (etter studier): USA, Brasil og India
- Modaliteter representert: CR, CT, US, DX, MR, MG, OT, RF, NM, Mammografi
- Kroppsdeler representert: Bryst, mage, hode, ryggrad, nakke, hjerte og mer
Vanlige brukstilfeller for DICOM-bildedatasett

Trene AI-modeller for diagnostisk avbildning
- Deteksjon av unormaliteter
- Sykdomsklassifisering
- Alvorlighetsgradspoeng/-stadieinndeling
- Triageprioritering
- Støtter utvikling av multimodalitet

Valider og benchmark modellens ytelse
- Evaluer modellens nøyaktighet på bredere populasjoner
- Referanseytelse etter modalitet/kroppsregion
- Kjør ekstern validering for å redusere overtilpasning

Forbedre modellens robusthet på tvers av enheter og nettsteder
- Testgeneralisering på tvers av skannere/leverandører
- Reduser ytelsestap ved utrulling til nye sykehus

Bygg multimodal AI (bilde + radiologirapport)
- Utlede svake etiketter fra rapportspråk
- Tren modeller i samsvar med rapportfortellinger
- Bygg rapportbevisst triage og beslutningsstøtte

Klinisk forskning og kohortoppretting
- Filtrer kohorter etter modalitet/kroppsdel/tid
- Støtt retrospektive studier
- Få fart på hypotesetesting samtidig som du opprettholder personvernkontrollene

Annotering og opprettelse av sannhetsdata for ML-trening
- Klassifiseringsmerker
- Avgrensende bokser
- Segmenteringsmasker
Hva du mottar i DICOM-bildedatasettet
1. DICOM-pikseldata (bildene)
Alle bilder er avidentifiserte på pikselnivå:
- Tekst på bilder er redigert eller pseudonymisert
- «De-facing»-artefakter kan introduseres når ansiktsrekonstruksjon er mulig (f.eks. CT med høy oppløsning).
3. Studierapport (valgfritt, når tilgjengelig)
Ustrukturert fortellende tekst skrevet av radiologen/legen, med Safe Harbor-anonymisering og samme datoforskyvningstilnærming anvendt.
2. DICOM-metadata (med Safe Harbor)
Alle standard DICOM-metadata bevares for levering, mens HIPAA Safe Harbor-identifikatorer anonymiseres, inkludert:
- Pasientnavn erstattet med pasient-ID
- Pasient-ID kryptografisk hashet
- Institusjonsnavnet er erstattet med et alternativt navn
- Datoer endret innen 365 dager (konsistent endring på pasientnivå).
4. Tilpassede metadata (valgfritt verdiøkning)
Valgfrie avledede metadata kan inkludere:
- Analysert pasientalder
- SNOMED-tagger (fra rapporten)
- Positive enheter (fra rapporten)
- Bostedsland (fra adresse)
- Imputert rase / Imputert etnisitet (avledede felt)
Personvern-første DICOM-avidentifikasjonsmetoder
Datasettet bruker kryptografisk hashing og pseudonymisering for å overholde HIPAA, samtidig som det bevarer klinisk nytteverdi og beskytter sensitive data.
Beskyttelse på pikselnivå
Redigering/pseudonymisering av innbrent tekst og fjerning av facing ved behov.
Metadatabeskyttelse
Safe Harbor-identifikatorer anonymiseres, mens standard DICOM-metadata bevares.
Datoskifte
Datoer forskyves innenfor et 365-dagers intervall, på pasientnivå for å bevare tidsmessige sammenhenger på tvers av studier.
Demografisk gulvbelegg
Enkelte felt har en grense/grense for antall personer for å redusere risikoen for reidentifisering (f.eks. alder, vekt, størrelse og noen etnisitetsverdier).
Finner du ikke det du leter etter?
Nye medisinske datasett blir samlet inn på tvers av alle datatyper
Kontakt oss nå for å gi slipp på bekymringene for datainnsamling av helsetreningsdata
Ofte stilte spørsmål (FAQ)
1. Hva er et DICOM-bildedatasett?
Et DICOM-bildedatasett er en samling av medisinske bildestudier lagret i DICOM-standarden, inkludert pikseldata og kliniske metadata, som ofte brukes til å trene og validere AI-modeller for helsevesenet.
2. Hva er inkludert i dette DICOM-bildedatasettet?
Avhengig av lisensomfang kan det inkludere DICOM-pikseldata, bevarte (avidentifiserte) DICOM-metadata, valgfrie studierapporter og valgfrie verdiskapende tilpassede metadata.
3. Er bildene avidentifiserte?
Ja. Bilder avidentifiseres på pikselnivå, inkludert redigering/pseudonymisering av tekst på bilder og defacing når det er nødvendig.
4. Er DICOM-metadataene bevart?
Standard DICOM-metadata bevares for levering, mens HIPAA Safe Harbor-identifikatorer anonymiseres (f.eks. pasient-/institusjonsidentifikatorer og datoer).
5. Hvordan håndteres datoer?
Datoer kan endres innen 365 dager, og brukes konsekvent på pasientnivå for å bevare relativ timing på tvers av studier.
6. Er radiologi-/studierapporter inkludert?
Når det er tilgjengelig og lisensiert, kan studierapporter (ustrukturert fortellende tekst) inkluderes, med identifikatorer pseudonymisert.
7. Hvilke tilpassede metadata kan være tilgjengelige?
Alternativer kan inkludere analysert pasientalder, SNOMED-tagger, positive enheter, bostedsland og andre avledede felt.
8. Kan jeg be om en spesifikk kohort (modalitet, kroppsdel, geografi osv.)?
Ja – del målområdet og filtrene dine, så vil Shaip foreslå den best passende datasettseksjonen basert på tilgjengelighet.
9. Hvordan lisensierer jeg datasettet?
Send inn dine krav via kontaktskjemaet. Teamet vårt vil bekrefte tilgjengelighet, omfang, lisensvilkår og leveringsalternativer.