Forbedring av onkologisk NLP-forskning

Onkologisk datapresisjon: lisensiering, avidentifikasjon og merknad for NLP-modellinnovasjon

Onkologi nlp

Revolusjonerer kreftbehandling med banebrytende NLP-teknologier

Klienten, en stor aktør i helsesektoren, krevde en avansert NLP-løsning for å behandle et betydelig volum av onkologiske journaler. Som en del av et sentralt initiativ for å avgrense onkologisk forskning, er behovet for å balansere detaljert dataanalyse med strenge personvernstandarder avgjørende. Denne case-studien skisserer våre bidrag til å forbedre klientens forskningsinnsats gjennom dataanmerkninger med høy kvalitet, streng avidentifikasjonspraksis og bruk av Natural Language Processing (NLP)-teknikker, alt innenfor det regulatoriske rammeverket gitt av HIPAA.

Volum

Datalisensiering + Data De-id
10 sider
Onkologiske forhold
10 sider
Ikke-onkologisk domene
10 sider
negasjon
10 sider
Onkologisk domene
10 sider
NER + Relasjonskartlegging
10 sider

Utfordringer

Prosjektet krevde en nyansert forståelse av klinisk dokumentasjon, presis identifikasjon av medisinske enheter, og evnen til å bruke negasjonsetiketter nøyaktig, alt innenfor et sikkert rammeverk som beskytter pasientens personvern i henhold til HIPAA-regelverket. Arbeidet krevde ikke bare teknisk ekspertise i å håndtere store mengder komplekse data, men også en strategisk tilnærming for å innlemme tilbakemeldinger og opprettholde kvalitet på tvers av alle stadier av merknadsprosessen.

Mål

Detaljert beskrivelse av tjenester

KategoriBeskrivelse
Omfattende klinisk datadekningDekker ulike notattyper, omsorgsinnstillinger og onkologiske subspesialiteter, og sikrer et robust datasett som reflekterer ulike kliniske scenarier.
Streng avidentifikasjonSikre at alle merkede poster blir avidentifisert i samsvar med HIPAAs Safe Harbor-metode, noe som sikrer kundens tillit til personvern og sikkerhet.
Retningslinjer for kommentarerOppretting og implementering av standard retningslinjer for datakommentarer for utarbeidelse av merkede poster i tråd med HIPAA-standarder.
Avanserte annoteringsstrategierManuell merknad av 10,000 XNUMX sider med onkologirelaterte journaler ble utført med et detaljert fokus på å identifisere negasjonsstatuser og annen relevant informasjon i henhold til etablerte retningslinjer.
Streng kvalitetssikringOppnå den spesifiserte kvalitetsstandarden som er skissert i retningslinjen

Oppløsning

Vår tilnærming innebar følgende nøkkelstrategier:

Tilpasset Onkologidatasettkompilering

Fra et stort arkiv med over 5 MN EHR ble en nøye utvalgt undergruppe av data hentet ut, rettet mot å imøtekomme klientens spesialiserte krav til onkologiske data med fokus på genomiske enheter. Innsamlingsprosessen innebar å lage en uttømmende liste over tumormarkører, gener, varianter og TNM-stadier, ved å bruke nøkkelordsøk for å finne dokumenter som er rikelig med disse dataene. Regelmessige uttrykk ble brukt til å identifisere en rekke genetiske variasjoner og kreftstadier. Denne tilnærmingen, kombinert med en bred datadekning som omfatter ulike dokumenttyper, spesialiteter, omsorgsinnstillinger og data fra flere leger, sikret et omfattende og relevant onkologisk datasett.

Onkologisk datasettsamling

Streng avidentifikasjon

Prosessen fulgte strengt HIPAAs Safe Harbor-metode for avidentifikasjon, som garanterer kundens tillit til personvern og sikkerhet. Dette innebærer å fjerne all beskyttet helseinformasjon (PHI) og erstatte den med merkede plassholdere, og dermed opprettholde nytten av dataene samtidig som pasientens konfidensialitet beskyttes.

Avidentifikasjonsvariabler

KategoriUnder
NavnPasientnavn, legenavn, sykepleiernavn, familiemedlemsnavn, legesenternavn, klinikknavn, sykehjemsnavn, firmanavn, universitetsnavn
Alder 
DatoDatomønster, Måned Årsmønster, Dag Månedsmønster, Dag Årsmønster, Dag, Måned, År, Sesong
StedLand, stat, by, gate, postnummer, romnummer, suitenummer, etasjenummer
IDPersonnummer, journalnummer, mottakernummer for helseplan, kontonummer, sertifikat-/lisensnummer, biometrisk id, journal-ID, tiltredelsesnummer, kjøretøyets identifikasjonsnummer, lisensnummer Enhetsidentifikatorer og serienummer
KontaktTelefonnummer, faksnummer, e-postadresse, web-URL, IP-adresse

Eksempel:

Den 25. september 2106, kl. 11:00, ble Mr. Harry Pace, 90 år gammel, innlagt på Forrest General Hospital for en planlagt hofteoperasjon, tidligere konsultert av hans primærlege Dr. Jose Martin, og deltatt av Kendra Reith, MD. Under oppholdet var han under omsorg av Mary Hu, NP, og Suzan Ray, RN, og R. Charles Melancon, PA, ble også konsultert. Operasjonen hans, utført samme dag som innleggelsen, var vellykket uten rapporterte komplikasjoner. Etter operasjonen ble Mr. Pace overført til rom 202, etasje 2, for restitusjon. Hans kone, Emma Pace, var til stede hele veien og fikk alle nødvendige oppdateringer. Under hans korte opphold ble hans medisinske journaler, inkludert MRN MR99062619 og konto KV000014764, håndtert i henhold til standardprotokollene til Gracewood Nursing Home, hans tidligere bolig. Han ble utskrevet senere samme dag til pleie av Oakland poliklinikk for videre restitusjon. Gjennom hele prosessen ble alle prosedyrer dokumentert og sikret med overholdelse av konfidensialitetsstandarder.

Eksempel: Avidentifisert

On [Datomønster], klokken 11:00, Mr. [Pasientnavn], alderen [Alder], ble tatt opp til [Navn på medisinsk senter] for en planlagt hofteoperasjon, tidligere konsultert av hans primærlege Dr. [Legenavn], og deltok av [Legenavn] MD. Under oppholdet var han under omsorg av [sykepleier], NP, og [sykepleier], RN, med [Legenavn], PA, blir også konsultert. Operasjonen hans, utført samme dag som innleggelsen, var vellykket uten rapporterte komplikasjoner. Etter operasjonen, Mr. [Pasientnavn] ble overført til Romnr. [Romnummer], Etasjenr. [Etasjenummer], for utvinning. Hans kone, [familiemedlemsnavn], var til stede hele veien og fikk alle nødvendige oppdateringer. Under hans korte opphold, hans medisinske poster, inkludert MRN [journalnummer] og konto [Kontonummer], ble håndtert i henhold til standardprotokollene til [Navn på sykehjem], hans tidligere bolig. Han ble utskrevet senere samme dag til omsorg for [Klinikknavn] for videre restitusjon. Gjennom hele prosessen ble alle prosedyrer dokumentert og sikret med overholdelse av konfidensialitetsstandarder.

Retningslinjer for merknader og avanserte merknadsteknikker

Shaip var medvirkende til å etablere og implementere standard retningslinjer for datakommentarer og sørget for at alle merkede poster ble utarbeidet konsekvent og i samsvar med HIPAA-standarder. I tillegg ble 10,000 XNUMX sider fra ulike medisinske journaler omhyggelig kommentert, med fokus på detaljert merking av negasjonsstatuser og andre klinisk relevante enheter, inkludert ulike onkologiske subspesialiteter. Kommentaren ble utført av et team av ekspertkommentatorer med spesialkunnskap innen onkologi og personvernforskrifter.

Komplekse merknadskriterier

KategoriUnder
Datokommentar (onkologi)Diagnosedato, stadiumdato, start, prosedyredato, medisindato startet, medisindato avsluttet, strålingsdato startet, strålingsdato avsluttet
Sykdom (onkologi)Kreftproblem, histologi, klinisk status, kroppssted, atferd, karakter, kreftstadium, TNM-stadium, tumormarkørtest, dimensjoner, kode
Behandling (onkologi)Kreftmedisin, legemiddeldosering, frekvens, kreftkirurgi, operasjonsresultat, strålingsmodalitet, stråledosering
GenomicsVariasjonskode, genstudert, metode, prøve
negasjonNegativ, mulig negativ, usikker, mulig positiv
Klinisk NERKreftproblem – Kroppssted, Histologi – Kroppssted, Atferd – Kroppssted, Kreftkirurgi – Relasjoner Kroppssted, Strålingsmodalitet – Kroppssted, Histologi – Grad, Kreftproblem – Dimensjon

Eksempel:

Onkologisk klinisk notaterklæring

Uttalelse om onkologi, klinisk notat

"Pasient Jane Doe ble diagnostisert med Stage IIIB ikke-småcellet lungekreft (NSCLC), spesifikt adenokarsinom, 03. Kreften er lokalisert i høyre nedre lungelapp. Den er klassifisert som T05N2023M3 i henhold til TNM staging-systemet, med en tumorstørrelse på 2 cm x 0 cm. En EGFR-ekson 5-sletting ble identifisert gjennom PCR-analyse av tumorbiopsiprøven. Kjemoterapi med Carboplatin AUC 3 og Pemetrexed 19 mg/m² ble startet 5 og skal administreres hver 500. uke. Ekstern strålebehandling (EBRT) med en dose på 03 Gy i 20 fraksjoner startet 2023. Pasientens behandling pågår, og det er ingen tegn på hjernemetastaser på den nylige MR-undersøkelsen. Muligheten for lymfovaskulær invasjon er ennå ikke fastslått, og pasientens toleranse for hele kjemoterapiregimet er fortsatt usikker.

Uttalelse om onkologi, klinisk notat

Onkologisk klinisk notaterklæring

Streng kvalitetssikring

Implementerte et fleksibelt prosjektstyringsrammeverk som muliggjorde effektiv integrering av tilbakemeldinger fra kunder samtidig som de opprettholdt strenge kvalitetsstandarder. En omfattende kvalitetssikringsprotokoll ble håndhevet, i samsvar med retningslinjene for å nå de nødvendige kvalitetsstandardene. Denne protokollen inneholdt påfølgende runder med gjennomgang og verifisering, og sikret presisjonen og påliteligheten til de kommenterte dataene. Et slikt omhyggelig kvalitetstilsyn er avgjørende for å lage en pålitelig NLP-løsning, avgjørende for informert klinisk beslutningstaking og fortreffelig forskning.

Utfallet

Vellykket levert 10,000 XNUMX avidentifiserte merkede poster av høy kvalitet, og gir et sikkert og verdifullt datasett for klientens utvikling av NLP-modeller. Den omhyggelige anvendelsen av NLP og overholdelse av HIPAA avidentifikasjonsstandarder resulterte i et svært raffinert datasett som vil underbygge klientens pågående og fremtidige onkologiske forskningsinnsats, og til slutt sikte på å forbedre onkologiske pasientresultater og behandlingseffektivitet.

Suksessen til prosjektet illustrerer vår evne til å håndtere komplekse medisinske data med presisjon, og bidrar til kundens mål om å forbedre pasientbehandlingsresultater og akselerere tempoet i helseinnovasjon.

Vårt partnerskap med Shaip har vært avgjørende for å fremme våre NLP-evner innen onkologidomenet. Den profesjonelle håndteringen av 10,000 XNUMX medisinske journaler, kommentert med detaljert negasjon og andre kliniske enheter, demonstrerte deres forpliktelse til fortreffelighet og etterlevelse. Dessuten har deres forpliktelse til personvernstandarder som HIPAA gitt oss uvurderlige ressurser for å drive våre AI-initiativer for å utvikle banebrytende onkologiske behandlinger og diagnostikk fremover.

Gylden-5-stjerners

Akselerer din Healthcare AI
applikasjonsutvikling med 100 %