NLP ved Ahus - Bruk av framtidens metoder for analyse av journaltekst

Saksnr. NEM 2019/190, REK Sør-øst 2018/2551 | [Klagesak]

Institusjon
Akershus universitetssykehus HF
Klager

Fredrik Dahl

Første instans
REK sør-øst A
Henvisninger

Personvernforordningen artikkel 6 og 9

Sammendrag

Klage på vedtak i brev av 4.6.2019 hvor REK Sør-øst A behandlet utsatt sak. Søknaden gjelder dispensasjon fra taushetsplikt begrunnet i det store antall personer.

Komiteen kom til at tidligere vedtak om at prosjektet falt utenfor helseforskningsloven opprettholdes. REK vurderte også dispensasjon fra taushetsplikten etter helsepersonelloven § 29, og fant at den åpne delegasjonsfullmakten for dette tilfellet ikke kunne benyttes.

Formålet med prosjektet er å etablere, og videreutvikle, moderne teknologi for automatisk tekstanalyse fra journaler, som senere vil gjøre det mulig å utnytte journalteksten bedre til pasientbehandling, kvalitetssikring og forskning.

Prosjektleder påklaget vedtaket i brev av 08.08.2019. Prosjektleder er enig i at prosjektet faller utenfor helseforskningsloven, men argumenterer for at prosjektet er forskning, og at språkprosessering er et forskningsfelt.

REK opprettholdt vedtaket fra 4.6.2019. Komiteen oversendte saken til NEM for vurdering, og ønsket også en vurdering på prinsipielt grunnlag.

NEM tok saken til behandling i komitémøtet 04.09.19. Komiteen vurderte prosjektet i tre punkter: Er det forskning, er forskningen regulert av helseforskningsloven, og har REK kompetansen til å gi fritak fra taushetsplikt for dette prosjektet.
NEM vurderte at prosjektet er et veldig åpent og hypotesegenererende prosjekt som har likhetstegn med grunnforskning. NEM konkluderte med at dette er et forskningsprosjekt.Videre vurderte NEM at prosjektet ligger i gråsonen for helseforskningslovens virkeområde, men støtter REK og klager i at det konkrete prosjekt ikke reguleres av helseforskningsloven.
Til sist konkluderer NEM at REK har kompetanse til å vurdere fritak fra taushetsplikt for det omsøkte prosjektet.

Klagen ble dermed tatt til følge, og oversendes REK for realitetsvurdering.

Prosjektbeskrivelse

Kortversjon:
I journalsystemene til Ahus lagres store mengder fritekst, som i liten grad utnyttes. Formålet med dette prosjektet er å etablere, og videreutvikle, moderne teknologi for automatisk tekstanalyse (Natural Language Processing; NLP), som senere vil gjøre det mulig å utnytte journalteksten bedre til pasientbehandling, kvalitetssikring og forskning.

Søknaden gjelder dispensasjon fra taushetsplikt. Begrunnelsen er det store antallet personer.

Studiepopulasjon: Hele pasientpopulasjonen til Ahus.Forskningsdata og metode:

Journaltekst (fritekst), ca 5 milliarder ord. Ikke-veiledet maskinlæring.

Søkers risikovurdering, tiltak og etisk vurdering: Journaltekst på avveie, mulig identifikasjon av person. Dataene frie for personkjennetegn (navn, adresse, f.nr; lovbestemt), sikker lagring, vanskeligere å identifisere enkeltpersoner. Risiko anses som liten sammenliknet med potensiell nytte i framtiden for pasientbehandling, kvalitetssikring og forskning.

Saksgang

REK S-Ø A tok saken til behandling 17.1.2019. Komiteen besluttet å utsette saken for å innhente mer informasjon og muligens for å innhente en konsulentuttalelse.

Konsulentuttalelse ble likevel ikke innhentet. Saken ble diskutert i REK-sekretariat og med Datatilsynet.

Før neste komitémøte (4.3.2019), ble det gjennomført en telefonsamtale mellom REK/prosjektleder:
«REK ba om mer informasjon om prosjekt, fremtidig anvendelse, nødvendighet av type data og mengde informasjon. Prosjektleders svar (på telefon): finner byggeklosser (med mening), kan f eks få mer fullstendig informasjon hvis tilstand (eks besvimelse) ikke alltid er kodet, kun beskrevet på forskjellige måter, journaltekst godt egnet for metoden (forskjellig språk, terminologi, ufullstendig osv.), ved bruk av ikke-veiledet ML unngås arbeid med annotering (innlegging av informasjon før analyse), men krever store datamengder.»

REKs vedtak 4.3.2019 (utsettelse):
i) Ikke helseforskning, ii) skal gjøres vurdering om det kan gis dispensasjon etter helsepersonelloven § 29. Vedtak utsatt med begrunnelse:

«Slik komitéen forstår søknad og prosjektbeskrivelse foreligger det ikke tilstrekkelig eller tydelig nok informasjon til å kunne vurdere om forskningen er av vesentlig interesse for samfunnet og om hensynet til deltakernes velferd og integritet er ivaretatt. Komitéen vil også understreke at IKT-utviklingsprosjekter ikke er i kjernen av hva komitéen vanligvis vurderer, og kravene til klarhet og presisjon i beskrivelsen av prosjektet skjerpes derfor ytterligere.»

Komitéen ber om en tilbakemelding fra prosjektleder, inkludert en mer utfyllende forskningsprotokoll, en redegjørelse for den potensielle samfunnsnytten av prosjektet, en vurdering av i hvilken grad nytten kan forventes, og en vurdering av om hensynet til deltakernes velferd og integritet er ivaretatt.

Tilbakemelding fra prosjektleder 12.4.2019:
Kommentarer er besvart, og prosjektprotokoll er revidert. I tillegg blir det opplyst at prosjektet er arbeidspakke (AP)1 i BigMed satsingen «Språkteknologi mot hjertedød, sepsis», og prosjektbeskrivelsen for denne er også lagt ved. Av denne fremgår: Dette er et initiativ for å opprette et nasjonalt samlingspunkt for analyse og tolkning av norsk klinisk tekst med deltakere fra OUS, UiO, Ahus, NTNU og St.Olav og består av 4 AP'er: 1) Etablering av NLP datakjede (det aktuelle prosjektet); 2) Prevalens og prognostisk betydning av synkope som innleggelsesdiagnose i norske sykehus; 3) Computational Sepsis Mining and Modelling (Eksponeringshistorikk for infeksjoner som progenitor for sepsis); 4) Eksterne leveranser og søknad Senter for automatisk klinisk tekstforståelse. I tillegg til REK-søknaden er AP1 under behandling av PVO ved Ahus. AP2 er behandlet av REK, som har kategorisert det som «annen type forskning» og gitt dispensasjon fra taushetsplikten. Den er meldt til PVO ved Ahus, men ikke ferdigbehandlet. AP 3 baserer seg initialt på REK-godkjenning for bruk av Sepsisregisteret og deltakersamtykket gitt til bruk av journaldata i HUNT IV.

REKs vedtak 4.6.2019:
i) Ikke helseforskning (dvs. opprettholdes), ii) vedrørende dispensasjon etter helsepersonelloven § 29 vurderer komiteén at den åpne delegasjonsfullmakten for dette tilfellet ikke kan benyttes. Begrunnelsen i ii) er basert på (utdrag):

a) Vurderingskriterier for dispensasjon fra taushetsplikt er kun at data skal benyttes til «forskning» iflg delegasjonsfullmakt, dvs. REKs kompetanse ubegrenset. Dette fremstår ikke å være i tråd med forutsetningene for GDPR og ny personopplysningslov.
b) Uklart om prosjektet er «forskning», modellutvikling, programvareutvikling eller annet. Minner om etablering og lesing av data fra et helseregister og derfor mer nærliggende å trekke en rettslig parallell fra de ulike helseregisterforskriftene hva gjelder REKs kompetanse til å godkjenne slike prosjekter. REK godkjenner prosjekter som faller inn under REKs mandat etter helseforskningsloven, så fremt data er personidentifiserbare. Faller prosjektene utenfor mandat, skal Helsedirektoratet godkjenne bruken av personidentifiserbare data, jf. f.eks. NPR-forskriften § 3-6.
c) REKs realkompetanse internt i komiteene ikke etablert med det for øye å ta stilling til
prosjekter som omhandler dataverktøy, programvarer, AI-forskning eller lignende.

Vedtak:
«Søknaden avvises som utenfor REKs mandat. Prosjektet faller utenfor helseforskningslovens virkeområde jf. § 2 og den åpne delegasjonsfullmakten (jf. forskrift av 2. juli 2009 nr. 989 om delegering av myndighet til den regionale komiteen for medisinsk og helsefaglig forskningsetikk etter helsepersonelloven § 29 første ledd og forvaltningsloven § 13d første ledd) kan ikke benyttes for dette tilfellet. Komiteen mener at Helsedirektoratet er rette instans til å godkjenne bruken av personidentifiserbare data.»

Klagen (8.8.2019)
Søker er enig i REKs konklusjon om at prosjektet ikke omfattes av helseforskningslovens virkeområde og presiserer at søknaden var da også formulert som en ren dispensasjonssøknad. Det er «Videre konkluderer komitéen med at prosjektet også faller utenfor den åpne delegasjonsfullmakten for dispensasjon til «annen type forskning» som påklages. I klagen utdyper de den forventede nytten av prosjektet og argumenterer for at er forskning. De påpeker også: «Vi ser samtidig at komitéens begrunnelse er så vidt prinsipiell at vi forventer at klagen vil avslås og oversendes NEM. I så fall vil alminnelig forvaltningspraksis være at NEM bare behandler vedtaket om at prosjektet er utenfor delegasjonsfullmakten, og hvis de gir medhold, sender saken tilbake til REK for realitetsbehandling. Hvis NEM derimot skulle anse det som hensiktsmessig å realitetsbehandle søknaden på grunn av sakens prinsipielle natur, er vi positive til dette.»

Prosjektleder gir følgende begrunnelse for at prosjektet er forskning: «naturlig språkprosessering» (NLP) er et forskningsfelt, videreutvikle metoder fra dette forskningsfeltet og publisere i vitenskapelige tidsskrifter.

REK opprettholder vedtaket fra 4.6.2019. Videre ønsker komiteen at saken oversendes NEM for en vurdering av saken på et prinsipielt grunnlag.

NEMs vurdering

NEM tok saken til behandling i komitémøte den 4.9.19. Etter forskningsetikkloven § 10, 3. ledd er NEM klageorgan for vedtak fattet av REK, og NEMs kompetanse i klagebehandling følger av forvaltningsloven § 34.

I opprinnelig søknad ble det ikke nevnt noe om BigMed-satsingen «Språkteknologi mot hjertedød, sepsis», der prosjektet inngår som arbeidspakke 1. Dette kom inn som en del av tilbakemeldingen fra REK om at det var behov for bedre prosjektbeskrivelse. BigMed-satsingen har arbeidspakker som har definerte utfallsmål knyttet til medisinsk og helsefaglig forskning, og to arbeidspakker har REK-godkjenning. Omsøkte delprosjekt må vurderes separat.

NEM valgte å dele opp vurderingen i tre punkter:

  1. er det forskning?
  2. er forskningen regulert av helseforskningsloven?
  3. har REK kompetansen til å gi fritak fra taushetsplikten for dette prosjektet?

Forskning

For REK kan det synes som om vurderingen av om det er forskning eller ikke, kompliseres ved at det ikke er definert klare utfallsmål. Dermed oppfatter REK prosjektet, i hvert fall delvis, som modellutvikling, men utelukker ikke at det er forskning, og argumenterer med manglende kompetanse i komiteen. Prosjektleder viser til at det skal utvikles nye metoder, som i seg selv kan ses på som ny kunnskap, og disse kan igjen brukes til å skaffe tilveie ny kunnskap innen medisinsk forskning. Dette er argumenter som støtter at det er forskning. Prosjektleder viser til at det skal utvikles nye metoder innenfor fagområdet naturlig språkprosessering, som kan ses på som å frembringe ny kunnskap. BigMed er dessuten finansiert som et forskningsprosjekt av Norges forskningsråd. Dette er argumenter som støtter at det er forskning. NEM oppfattet prosjektet som en forskningsbasert metodeutvikling. Prosjektet er et veldig åpent og hypotesegenererende prosjekt som har likhetstegn med grunnforskning. NEM konkluderte med at dette er et forskningsprosjekt.

Innenfor helseforskningsloven

Det er enighet mellom REK og søker om at prosjektet ikke faller inn under helseforskningsloven, og søknaden/klagen gjelder kun dispensasjon fra taushetsplikten. NEM har i klagesaksbehandlingen likevel anledning til å prøve alle sider av saken. Bruk av kunstig intelligens (KI) inn i helsevesenet er et relativt nytt felt der det er forventninger om stor fremtidig aktivitet og nytte. NEM mener derfor det er viktig med en avklaring av når slike prosjekter er regulert av helseforskningsloven og når de ikke er det. Med denne bakgrunn valgte NEM å vurdere om dette prosjektet er regulert av helseforskningsloven.

Prosjektet skal anvende pasientjournaler til å utvikle nye metoder for å fremskaffe ordvektorer for norsk medisinsk journaltekst, men har ikke (klare) medisinske utfallsmål. På sikt kan derimot metodene brukes til å skaffe tilveie ny kunnskap innen medisinsk forskning. Isolert sett kan prosjektet derfor vurderes å falle utenfor helseforskningslovens virkeområde. Derimot setter tilleggsinformasjonen ved prosjektbeskrivelsen for BigMed-satsingen prosjektet inn i en medisinsk og helsefaglig sammenheng.

NEM har tidligere fremholdt at det kan være tjenlig å kartlegge og diskutere etiske spørsmål før det konkluderes om helseforskningsloven gjelder eller ikke. Det er grunnleggende nytt at analyser som kan få direkte betydning for pasientbehandling skjer uten at det er direkte resultat av faglige vurderinger og kognitive prosesser hos helsepersonell. Det er grunn til å tro at maskinlæring og andre kunstig intelligens-metoder kan komme til å bli viktig innen medisinsk forskning og helsehjelp. Det faktum at nye metoder blir tatt i bruk som ikke var aktuelle da helseforskningsloven ble forberedt, bør ikke føre til at NEM konkluderer med at forskning innen det medisinske feltet som gjør bruk av slike metoder faller utenfor det saklige virkeområdet for loven. Et slik resultat vil sette REK-systemet på sidelinjen og være et hinder for å ta stilling til nye, viktige etiske spørsmål knyttet til fremtidig medisinsk og helsefaglig forskning. REK og NEM må kunne fortolke gjeldende lovordlyd i lys av ny teknologi og nye forskningsmetoder; f.eks. i lys av maskinlæring som i dette prosjektet.

Omsøkte prosjekt utføres med vitenskapelig metodikk for å skaffe til veie ny kunnskap innenfor helse og sykdom. Kilden for denne nye kunnskapen er journaltekst, dvs. helseopplysninger. NEM ser det sannsynlig at det i prosjektet fremkommer forhold som kan utløse behov for beskyttelse knyttet til respekt for deltakernes menneskeverd og menneskerettigheter. Riktignok har prosjektet neppe noen slik direkte virkning på deltakerne, men kunstig intelligens-metoder tilgengeliggjør sparsomt med forklaring av analyseresultatene. Dermed er det verken mulig for helsepersonell eller for pasienter, som slike metoder kan bli brukt for å veilede og behandle mv., å få tilgang til et informasjonsgrunnlag som gjør det mulig for dem å treffe spesifikke, begrunnede og informerte valg som basis for å gi og samtykke til helsehjelp. Slike spørsmål er det relevant å vurdere i REK og NEM.

NEM vurderer at prosjektet ligger i gråsonen for helseforskningslovens virkeområde. Prosjektet vil neppe fremskaffe ny kunnskap om sykdom eller helse direkte, slik kunnskap vil ligge noe frem i tid når metoden kan tas i bruk i nye prosjekter for å studere hypoteser. REKs vedtak om at dette konkrete prosjektet er forskning som ikke er regulert av helseforskningloven fremstår dermed som en forsvarlig vurdering. NEM vil likevel signalisere at prosjektet ligger ved grensen for å falle inn under loven. Det er derfor fortsatt et behov for grundig vurdering av hvor skillet går for forskning om utvikling av KI.

Fritak fra taushetsplikten

REK vurderer at prosjektet faller utenfor den åpne delegasjonsfullmakten til REK. Jf. forskrift av 2. juli 2009 nr. 989 om delegering av myndighet til den regionale komiteen for medisinsk og helsefaglig forskningsetikk etter helsepersonelloven § 29 første ledd og forvaltningsloven § 13d første ledd.

Ved behandlingen av dette spørsmålet synes REK å blande sammen to spørsmål som må holdes adskilt. Dels er det tale om unntak fra taushetsplikt, og dels har vi et spørsmål om rettslig grunnlag etter personvernforordningen (PVF) artikkel 6 og 9. Personvernforordningen regulerer ikke spørsmål om taushetsplikt for helseopplysninger om forskningsdeltakere (heller ikke for andre registrerte). Dette spørsmålet er kun avhengig av nasjonal lovgivning. Det kan være forvirrende at en mulig hjemmel for å gjøre unntak fra taushetsplikt er å innhente samtykke fra den personen som opplysningene gjelder. Dette er imidlertid en annen type samtykke enn samtykke som rettslig grunnlag etter personvernforordningen artikkel 6(1)(a) og 9(2)(a), og må ses adskilt fra dette. REK må derfor først vurdere om det er anledning til å dispensere fra taushetsplikten i samsvar med helsepersonelloven § 29. Hvis det er adgang til å gjøre unntak, blir spørsmålet for forskningsansvarlig institusjon om det foreligger rettslig grunnlag i samsvar med personvernforordningen. Når det gjelder rettslig grunnlag stilles følgende krav: Det skal både være rettslig grunnlag etter artikkel 6(1) for «alminnelige» opplysninger og etter artikkel 9(2) for særlige kategorier personopplysninger. Alternativet i artikkel 6(1)(e) om «nødvendig for å utføre en oppgave i allmenhetens interesse» er trolig aktuelt rettslig grunnlag etter artikkel 6. Etter artikkel 9(2) finnes grunnlaget i alternativet i bokstav j om vitenskapelig forskning. Både artikkel 6(3) og artikkel 9(2)(j) stiller krav til nasjonal lovgivning. Det er alminnelig antatt at helseforskningsloven og helsepersonelloven tilfredsstiller disse kravene, og lovene gir dermed rettslig grunnlag i tråd med artikkel 6(3) og 9(2)(j). På dette punktet kan REK derfor vurdere dispensasjonsadgangen etter helsepersonelloven § 29, uten å ta videre hensyn til personvernforordningens bestemmelser om rettslig grunnlag.

Personvernprinsippene i PVF artikkel 5 får anvendelse ved vurderingen av dispensasjon fra taushetsplikt. Disse prinsippene vil imidlertid primært ha betydning for de nærmere vilkårene for dispensasjonen som gis. For eksempel kan rettferdighets- og åpenhetsprinsippet i artikkel 5(1)(a) begrunne krav om informasjonstiltak om prosjektet overfor offentligheten. Videre kan formålsbegrensingsprinsippet (artikkel 5(1)(b)) begrunne avgrensing av hva helseopplysningene kan brukes til. Lagringsbegrensningsprinsippet (artikkel 5(1)(e)) kan åpenbart begrunne vilkår om varighet av lagringen av det analyserte materialet; og prinsippet om integritet og konfidensialitet (artikkel 5(1)(f)) gir grunn til å kreve sikkerhetstiltak i samsvar med artikkel 32.

Dataminimeringsprinsippet kan trolig vanskelig begrunne vilkår uten at det svekker denne type prosjekt. Årsaken er at det nettopp er et poeng å gjøre maskinelle analyser av et omfattende materiale. Det er derved også vanskelig å stille krav i samsvar med riktighetsprinsippet i artikkel 5(1)(d), fordi journaltekstene trolig må analyseres slik de er, og fordi enkeltfeil får mindre å si når det skjer en statistisk analyse av et veldig stort tekstmateriale.

Det er grunn til å understreke at personvernforordningen ikke kan forstås slik at alle prinsippene i artikkel 5 skal få stort gjennomslag samtidig. Avgjørende er helhetsvurderingen, herunder om manglende krav til dataminimering og riktighet vil kunne gi virkninger for registrertes rettigheter og friheter på en måte som ikke kan aksepteres.

NEMs konklusjon er at REK har kompetanse til å vurdere fritak fra taushetsplikten for omsøkte prosjekt.

Avslutningsvis har NEM en kommentar til REKs anførsel om at de mangler «realkompetanse» om tekniske/teknologiske spørsmål. REK har anledning til å be om, knytte til seg supplerende ekspertise, for å vurdere søknader. Dette må gjelde uavhengig av hvilken type faglig kunnskap det er behov for.

Vedtak

Klagen tas til følge. REK har kompetansen til å vurdere fritak fra taushetsplikten i omsøkte prosjekt,jf. forskrift av 2. juli 2009 nr. 989 om delegering av myndighet til den regionale komiteen for medisinsk og helsefaglig forskningsetikk etter helsepersonelloven § 29 første ledd og forvaltningsloven § 13d første ledd. Søknaden sendes dermed tilbake til REK for realitetsvurdering.

Vedtaket er endelig og kan ikke påklages, jf. forskningsetikkloven § 10, tredje ledd.