Forbedring av onkologisk NLP-forskning
Onkologisk datapresisjon: lisensiering, avidentifikasjon og merknad for NLP-modellinnovasjon
Revolusjonerer kreftbehandling med banebrytende NLP-teknologier
Klienten, en stor aktør i helsesektoren, krevde en avansert NLP-løsning for å behandle et betydelig volum av onkologiske journaler. Som en del av et sentralt initiativ for å avgrense onkologisk forskning, er behovet for å balansere detaljert dataanalyse med strenge personvernstandarder avgjørende. Denne case-studien skisserer våre bidrag til å forbedre klientens forskningsinnsats gjennom dataanmerkninger med høy kvalitet, streng avidentifikasjonspraksis og bruk av Natural Language Processing (NLP)-teknikker, alt innenfor det regulatoriske rammeverket gitt av HIPAA.
Volum
Utfordringer
Prosjektet krevde en nyansert forståelse av klinisk dokumentasjon, presis identifikasjon av medisinske enheter, og evnen til å bruke negasjonsetiketter nøyaktig, alt innenfor et sikkert rammeverk som beskytter pasientens personvern i henhold til HIPAA-regelverket. Arbeidet krevde ikke bare teknisk ekspertise i å håndtere store mengder komplekse data, men også en strategisk tilnærming for å innlemme tilbakemeldinger og opprettholde kvalitet på tvers av alle stadier av merknadsprosessen.
Detaljert beskrivelse av tjenester
Kategori | Beskrivelse |
Omfattende klinisk datadekning | Dekker ulike notattyper, omsorgsinnstillinger og onkologiske subspesialiteter, og sikrer et robust datasett som reflekterer ulike kliniske scenarier. |
Streng avidentifikasjon | Sikre at alle merkede poster blir avidentifisert i samsvar med HIPAAs Safe Harbor-metode, noe som sikrer kundens tillit til personvern og sikkerhet. |
Retningslinjer for kommentarer | Oppretting og implementering av standard retningslinjer for datakommentarer for utarbeidelse av merkede poster i tråd med HIPAA-standarder. |
Avanserte annoteringsstrategier | Manuell merknad av 10,000 XNUMX sider med onkologirelaterte journaler ble utført med et detaljert fokus på å identifisere negasjonsstatuser og annen relevant informasjon i henhold til etablerte retningslinjer. |
Streng kvalitetssikring | Oppnå den spesifiserte kvalitetsstandarden som er skissert i retningslinjen |
Oppløsning
Vår tilnærming innebar følgende nøkkelstrategier:
Tilpasset Onkologidatasettkompilering
Fra et stort arkiv med over 5 MN EHR ble en nøye utvalgt undergruppe av data hentet ut, rettet mot å imøtekomme klientens spesialiserte krav til onkologiske data med fokus på genomiske enheter. Innsamlingsprosessen innebar å lage en uttømmende liste over tumormarkører, gener, varianter og TNM-stadier, ved å bruke nøkkelordsøk for å finne dokumenter som er rikelig med disse dataene. Regelmessige uttrykk ble brukt til å identifisere en rekke genetiske variasjoner og kreftstadier. Denne tilnærmingen, kombinert med en bred datadekning som omfatter ulike dokumenttyper, spesialiteter, omsorgsinnstillinger og data fra flere leger, sikret et omfattende og relevant onkologisk datasett.
Streng avidentifikasjon
Prosessen fulgte strengt HIPAAs Safe Harbor-metode for avidentifikasjon, som garanterer kundens tillit til personvern og sikkerhet. Dette innebærer å fjerne all beskyttet helseinformasjon (PHI) og erstatte den med merkede plassholdere, og dermed opprettholde nytten av dataene samtidig som pasientens konfidensialitet beskyttes.
Avidentifikasjonsvariabler
Kategori | Under |
Navn | Pasientnavn, legenavn, sykepleiernavn, familiemedlemsnavn, legesenternavn, klinikknavn, sykehjemsnavn, firmanavn, universitetsnavn |
Alder | |
Dato | Datomønster, Måned Årsmønster, Dag Månedsmønster, Dag Årsmønster, Dag, Måned, År, Sesong |
Sted | Land, stat, by, gate, postnummer, romnummer, suitenummer, etasjenummer |
ID | Personnummer, journalnummer, mottakernummer for helseplan, kontonummer, sertifikat-/lisensnummer, biometrisk id, journal-ID, tiltredelsesnummer, kjøretøyets identifikasjonsnummer, lisensnummer Enhetsidentifikatorer og serienummer |
Kontakt | Telefonnummer, faksnummer, e-postadresse, web-URL, IP-adresse |
Eksempel:
Den 25. september 2106, kl. 11:00, ble Mr. Harry Pace, 90 år gammel, innlagt på Forrest General Hospital for en planlagt hofteoperasjon, tidligere konsultert av hans primærlege Dr. Jose Martin, og deltatt av Kendra Reith, MD. Under oppholdet var han under omsorg av Mary Hu, NP, og Suzan Ray, RN, og R. Charles Melancon, PA, ble også konsultert. Operasjonen hans, utført samme dag som innleggelsen, var vellykket uten rapporterte komplikasjoner. Etter operasjonen ble Mr. Pace overført til rom 202, etasje 2, for restitusjon. Hans kone, Emma Pace, var til stede hele veien og fikk alle nødvendige oppdateringer. Under hans korte opphold ble hans medisinske journaler, inkludert MRN MR99062619 og konto KV000014764, håndtert i henhold til standardprotokollene til Gracewood Nursing Home, hans tidligere bolig. Han ble utskrevet senere samme dag til pleie av Oakland poliklinikk for videre restitusjon. Gjennom hele prosessen ble alle prosedyrer dokumentert og sikret med overholdelse av konfidensialitetsstandarder.
Eksempel: Avidentifisert
On [Datomønster], klokken 11:00, Mr. [Pasientnavn], alderen [Alder], ble tatt opp til [Navn på medisinsk senter] for en planlagt hofteoperasjon, tidligere konsultert av hans primærlege Dr. [Legenavn], og deltok av [Legenavn] MD. Under oppholdet var han under omsorg av [sykepleier], NP, og [sykepleier], RN, med [Legenavn], PA, blir også konsultert. Operasjonen hans, utført samme dag som innleggelsen, var vellykket uten rapporterte komplikasjoner. Etter operasjonen, Mr. [Pasientnavn] ble overført til Romnr. [Romnummer], Etasjenr. [Etasjenummer], for utvinning. Hans kone, [familiemedlemsnavn], var til stede hele veien og fikk alle nødvendige oppdateringer. Under hans korte opphold, hans medisinske poster, inkludert MRN [journalnummer] og konto [Kontonummer], ble håndtert i henhold til standardprotokollene til [Navn på sykehjem], hans tidligere bolig. Han ble utskrevet senere samme dag til omsorg for [Klinikknavn] for videre restitusjon. Gjennom hele prosessen ble alle prosedyrer dokumentert og sikret med overholdelse av konfidensialitetsstandarder.
Retningslinjer for merknader og avanserte merknadsteknikker
Shaip var medvirkende til å etablere og implementere standard retningslinjer for datakommentarer og sørget for at alle merkede poster ble utarbeidet konsekvent og i samsvar med HIPAA-standarder. I tillegg ble 10,000 XNUMX sider fra ulike medisinske journaler omhyggelig kommentert, med fokus på detaljert merking av negasjonsstatuser og andre klinisk relevante enheter, inkludert ulike onkologiske subspesialiteter. Kommentaren ble utført av et team av ekspertkommentatorer med spesialkunnskap innen onkologi og personvernforskrifter.
Komplekse merknadskriterier
Kategori | Under |
Datokommentar (onkologi) | Diagnosedato, stadiumdato, start, prosedyredato, medisindato startet, medisindato avsluttet, strålingsdato startet, strålingsdato avsluttet |
Sykdom (onkologi) | Kreftproblem, histologi, klinisk status, kroppssted, atferd, karakter, kreftstadium, TNM-stadium, tumormarkørtest, dimensjoner, kode |
Behandling (onkologi) | Kreftmedisin, legemiddeldosering, frekvens, kreftkirurgi, operasjonsresultat, strålingsmodalitet, stråledosering |
Genomics | Variasjonskode, genstudert, metode, prøve |
negasjon | Negativ, mulig negativ, usikker, mulig positiv |
Klinisk NER | Kreftproblem – Kroppssted, Histologi – Kroppssted, Atferd – Kroppssted, Kreftkirurgi – Relasjoner Kroppssted, Strålingsmodalitet – Kroppssted, Histologi – Grad, Kreftproblem – Dimensjon |
Eksempel:
Uttalelse om onkologi, klinisk notat
"Pasient Jane Doe ble diagnostisert med Stage IIIB ikke-småcellet lungekreft (NSCLC), spesifikt adenokarsinom, 03. Kreften er lokalisert i høyre nedre lungelapp. Den er klassifisert som T05N2023M3 i henhold til TNM staging-systemet, med en tumorstørrelse på 2 cm x 0 cm. En EGFR-ekson 5-sletting ble identifisert gjennom PCR-analyse av tumorbiopsiprøven. Kjemoterapi med Carboplatin AUC 3 og Pemetrexed 19 mg/m² ble startet 5 og skal administreres hver 500. uke. Ekstern strålebehandling (EBRT) med en dose på 03 Gy i 20 fraksjoner startet 2023. Pasientens behandling pågår, og det er ingen tegn på hjernemetastaser på den nylige MR-undersøkelsen. Muligheten for lymfovaskulær invasjon er ennå ikke fastslått, og pasientens toleranse for hele kjemoterapiregimet er fortsatt usikker.
Uttalelse om onkologi, klinisk notat
Streng kvalitetssikring
Implementerte et fleksibelt prosjektstyringsrammeverk som muliggjorde effektiv integrering av tilbakemeldinger fra kunder samtidig som de opprettholdt strenge kvalitetsstandarder. En omfattende kvalitetssikringsprotokoll ble håndhevet, i samsvar med retningslinjene for å nå de nødvendige kvalitetsstandardene. Denne protokollen inneholdt påfølgende runder med gjennomgang og verifisering, og sikret presisjonen og påliteligheten til de kommenterte dataene. Et slikt omhyggelig kvalitetstilsyn er avgjørende for å lage en pålitelig NLP-løsning, avgjørende for informert klinisk beslutningstaking og fortreffelig forskning.
Utfallet
Vellykket levert 10,000 XNUMX avidentifiserte merkede poster av høy kvalitet, og gir et sikkert og verdifullt datasett for klientens utvikling av NLP-modeller. Den omhyggelige anvendelsen av NLP og overholdelse av HIPAA avidentifikasjonsstandarder resulterte i et svært raffinert datasett som vil underbygge klientens pågående og fremtidige onkologiske forskningsinnsats, og til slutt sikte på å forbedre onkologiske pasientresultater og behandlingseffektivitet.
Suksessen til prosjektet illustrerer vår evne til å håndtere komplekse medisinske data med presisjon, og bidrar til kundens mål om å forbedre pasientbehandlingsresultater og akselerere tempoet i helseinnovasjon.
Vårt partnerskap med Shaip har vært avgjørende for å fremme våre NLP-evner innen onkologidomenet. Den profesjonelle håndteringen av 10,000 XNUMX medisinske journaler, kommentert med detaljert negasjon og andre kliniske enheter, demonstrerte deres forpliktelse til fortreffelighet og etterlevelse. Dessuten har deres forpliktelse til personvernstandarder som HIPAA gitt oss uvurderlige ressurser for å drive våre AI-initiativer for å utvikle banebrytende onkologiske behandlinger og diagnostikk fremover.