DICOM medisinsk bildedatasett for avanserte AI/ML-applikasjoner i helsevesenet

Avidentifisert DICOM-bildedatasett med bevarte metadata – og valgfrie radiologistudierapporter – for å akselerere modelltrening, validering og klinisk forskning.

Dicom-bildedatasett

DICOM-bildedata bygget for ekte kunstig intelligens

Shaip tilbyr AI-klar DICOM medisinske bildedatasett utviklet for å hjelpe AI-team innen helsevesenet med å bygge, trene og validere robuste modeller for diagnose, triage og beslutningsstøtte – ved hjelp av avidentifiserte data som bevarer klinisk verdi.

Datasett-øyeblikksbilde

  • Totalt antall studier:10M +
  • Toppgeografiske områder (etter studier): USA, Brasil og India
  • Modaliteter representert: CR, CT, US, DX, MR, MG, OT, RF, NM, Mammografi
  • Kroppsdeler representert: Bryst, mage, hode, ryggrad, nakke, hjerte og mer
Dicom-bildedata

Vanlige brukstilfeller for DICOM-bildedatasett

Tren diagnostiske bildebehandlingsmodeller for kunstig intelligens

Trene AI-modeller for diagnostisk avbildning

  • Deteksjon av unormaliteter
  • Sykdomsklassifisering
  • Alvorlighetsgradspoeng/-stadieinndeling
  • Triageprioritering
  • Støtter utvikling av multimodalitet
Valider og benchmark modellens ytelse

Valider og benchmark modellens ytelse

  • Evaluer modellens nøyaktighet på bredere populasjoner
  • Referanseytelse etter modalitet/kroppsregion
  • Kjør ekstern validering for å redusere overtilpasning
Forbedre modellens robusthet på tvers av enheter og nettsteder

Forbedre modellens robusthet på tvers av enheter og nettsteder

  • Testgeneralisering på tvers av skannere/leverandører
  • Reduser ytelsestap ved utrulling til nye sykehus
Bygg multimodal AI (bilde + radiologirapport)

Bygg multimodal AI (bilde + radiologirapport)

  • Utlede svake etiketter fra rapportspråk
  • Tren modeller i samsvar med rapportfortellinger
  • Bygg rapportbevisst triage og beslutningsstøtte
Klinisk forskning og kohortoppretting

Klinisk forskning og kohortoppretting

  • Filtrer kohorter etter modalitet/kroppsdel/tid
  • Støtt retrospektive studier
  • Få fart på hypotesetesting samtidig som du opprettholder personvernkontrollene
Annotering og opprettelse av sannhetsdata for ml-trening

Annotering og opprettelse av sannhetsdata for ML-trening

  • Klassifiseringsmerker
  • Avgrensende bokser
  • Segmenteringsmasker

Hva du mottar i DICOM-bildedatasettet

1. DICOM-pikseldata (bildene)

Alle bilder er avidentifiserte på pikselnivå:

  • Tekst på bilder er redigert eller pseudonymisert
  • «De-facing»-artefakter kan introduseres når ansiktsrekonstruksjon er mulig (f.eks. CT med høy oppløsning).

3. Studierapport (valgfritt, når tilgjengelig)

Ustrukturert fortellende tekst skrevet av radiologen/legen, med Safe Harbor-anonymisering og samme datoforskyvningstilnærming anvendt.

2. DICOM-metadata (med Safe Harbor)

Alle standard DICOM-metadata bevares for levering, mens HIPAA Safe Harbor-identifikatorer anonymiseres, inkludert:

  • Pasientnavn erstattet med pasient-ID
  • Pasient-ID kryptografisk hashet
  • Institusjonsnavnet er erstattet med et alternativt navn
  • Datoer endret innen 365 dager (konsistent endring på pasientnivå).

4. Tilpassede metadata (valgfritt verdiøkning)

Valgfrie avledede metadata kan inkludere:

  • Analysert pasientalder
  • SNOMED-tagger (fra rapporten)
  • Positive enheter (fra rapporten)
  • Bostedsland (fra adresse)
  • Imputert rase / Imputert etnisitet (avledede felt)

Personvern-første DICOM-avidentifikasjonsmetoder

Datasettet bruker kryptografisk hashing og pseudonymisering for å overholde HIPAA, samtidig som det bevarer klinisk nytteverdi og beskytter sensitive data.

Beskyttelse på pikselnivå

Redigering/pseudonymisering av innbrent tekst og fjerning av facing ved behov.

Metadatabeskyttelse

Safe Harbor-identifikatorer anonymiseres, mens standard DICOM-metadata bevares.

Datoskifte

Datoer forskyves innenfor et 365-dagers intervall, på pasientnivå for å bevare tidsmessige sammenhenger på tvers av studier.

Demografisk gulvbelegg

Enkelte felt har en grense/grense for antall personer for å redusere risikoen for reidentifisering (f.eks. alder, vekt, størrelse og noen etnisitetsverdier).

Shaip kontakt oss

Finner du ikke det du leter etter?

Nye medisinske datasett blir samlet inn på tvers av alle datatyper 

Kontakt oss nå for å gi slipp på bekymringene for datainnsamling av helsetreningsdata

  • Ved å registrere meg godtar jeg Shaip Personvernerklæring og Våre vilkår og gi mitt samtykke til å motta B2B-markedsføringskommunikasjon fra Shaip.

Et DICOM-bildedatasett er en samling av medisinske bildestudier lagret i DICOM-standarden, inkludert pikseldata og kliniske metadata, som ofte brukes til å trene og validere AI-modeller for helsevesenet.

Avhengig av lisensomfang kan det inkludere DICOM-pikseldata, bevarte (avidentifiserte) DICOM-metadata, valgfrie studierapporter og valgfrie verdiskapende tilpassede metadata.

Ja. Bilder avidentifiseres på pikselnivå, inkludert redigering/pseudonymisering av tekst på bilder og defacing når det er nødvendig.

Standard DICOM-metadata bevares for levering, mens HIPAA Safe Harbor-identifikatorer anonymiseres (f.eks. pasient-/institusjonsidentifikatorer og datoer).

Datoer kan endres innen 365 dager, og brukes konsekvent på pasientnivå for å bevare relativ timing på tvers av studier.

Når det er tilgjengelig og lisensiert, kan studierapporter (ustrukturert fortellende tekst) inkluderes, med identifikatorer pseudonymisert.

Alternativer kan inkludere analysert pasientalder, SNOMED-tagger, positive enheter, bostedsland og andre avledede felt.

Ja – del målområdet og filtrene dine, så vil Shaip foreslå den best passende datasettseksjonen basert på tilgjengelighet.

Send inn dine krav via kontaktskjemaet. Teamet vårt vil bekrefte tilgjengelighet, omfang, lisensvilkår og leveringsalternativer.