LØRN Case #C0652
Maskinlæring i medisinsk journaltekst
Hva er det samfunnsmessige viktige med presisjonsmedisin? Og hvor mye av genetikken til norges befolkning kjenner vi til? I denne episoden av #LØRN snakker Silvija med sjekk tittel i lydfil, Eivind Hovig, om hvordan mutasjoner i kreft samspiller med immunsystemet, og forutsigelser på hvordan man kan manipulere det

Fredrik Dahl

Seniorforsker ved Akershus universitetssykehus

Ahus

"Bioinformatiske løsninger er det som er ofte i fokus. Men innovasjon er noe som dukker opp som muligheter underveis i forskningen, og ikke noe som er i fokus i og for seg. Noe av kunsten er jo å være i forskningsfronten innen et område med samfunnsmessig relevans, slik jeg ser det, forteller han i episoden."

Varighet: 38 min

LYTTE

Ta quiz og få læringsbevis

0.00

Du må være medlem for å ta quiz

Ferdig med quiz?

Besvar refleksjonsoppgave

Hvem er du, og hvordan ble du interessert i innovasjon/forskning?

Jeg har alltid vært interessert i forskning og oppfinnelser. Fra jeg var barn har jeg vært spesielt opptatt av hva som skjer når vi tenker, hva tanker egentlig er og om det går an å få maskiner til å tenke som oss.

Hva er det viktigste dere gjør på jobben?

Jeg jobber i en avdeling for helsetjenesteforskning hvor vi gjør forskjellige analyser av hvordan helsetjenesten virker og hvordan det går med pasientene.

Hva fokuserer du på innen teknologi/innovasjon?

Jeg fokuserer på metoder innen maskinlæring som kan brukes til å få mer nyttig informasjon og kunnskap fra sykehusets journalsystemer.

Hvorfor er det spennende?

Vi har behov for kunstig intelligens som kan hjelpe til med å finne fram og sammenstille informasjon om en pasient. Slike systemer kan også hjelpe til med å finne andre pasienter som likner på den som skal behandles, slik at man raskere kan få oversikt over liknende tilfeller.

Hva synes du er de mest interessante kontroverser?

Spørsmålet om hvilken informasjon om pasienter som bør dokumenteres.

Dine egne relevante prosjekter siste året?

Et BigMed-prosjekt hvor vi har trent opp såkalte nevralnett-modeller til å klassifisere radiologirapporter, slik at man automatisk kan telle opp andelen av undersøkelser som ga relevante funn for forskjellige pasientgrupper. Et annet prosjekt handler om å bruke maskinlæring til å avgjøre om en pasient har besvimt ut fra det som står i journalen.

Dine andre favoritteksempler på lignende prosjekter, internasjonalt og nasjonalt?

Googles (og andre store aktørers) samlede framgang innen maskinlæring på naturlig språk.

Hva tror du er relevant kunnskap for fremtiden?

Maskinlæring kommer til å bli stadig viktigere. Den første omveltningen kommer innen bildebehandling hvor maskiner er i ferd med å bli bedre enn mennesker til å kjenne igjen de fleste typer objekter. Den andre store bølgen dreier seg om maskinlæring brukt på tekst.

Hva gjør vi unikt godt i Norge av dette?

Norge er ikke noe lokomotiv innen dette feltet, og hele Europa står i fare for å bli frakjørt av USA og Kina.

Et favoritt sitat?

«Hver gang vi sier opp en lingvist blir språkmodellene våre bedre».

Viktigste poeng fra vår samtale?

Maskinlæring på medisinsk tekst kan gjøre helsetjenesten bedre.

Hvem er du, og hvordan ble du interessert i innovasjon/forskning?

Jeg har alltid vært interessert i forskning og oppfinnelser. Fra jeg var barn har jeg vært spesielt opptatt av hva som skjer når vi tenker, hva tanker egentlig er og om det går an å få maskiner til å tenke som oss.

Hva er det viktigste dere gjør på jobben?

Jeg jobber i en avdeling for helsetjenesteforskning hvor vi gjør forskjellige analyser av hvordan helsetjenesten virker og hvordan det går med pasientene.

Hva fokuserer du på innen teknologi/innovasjon?

Jeg fokuserer på metoder innen maskinlæring som kan brukes til å få mer nyttig informasjon og kunnskap fra sykehusets journalsystemer.

Hvorfor er det spennende?

Vi har behov for kunstig intelligens som kan hjelpe til med å finne fram og sammenstille informasjon om en pasient. Slike systemer kan også hjelpe til med å finne andre pasienter som likner på den som skal behandles, slik at man raskere kan få oversikt over liknende tilfeller.

Hva synes du er de mest interessante kontroverser?

Spørsmålet om hvilken informasjon om pasienter som bør dokumenteres.

Dine egne relevante prosjekter siste året?

Et BigMed-prosjekt hvor vi har trent opp såkalte nevralnett-modeller til å klassifisere radiologirapporter, slik at man automatisk kan telle opp andelen av undersøkelser som ga relevante funn for forskjellige pasientgrupper. Et annet prosjekt handler om å bruke maskinlæring til å avgjøre om en pasient har besvimt ut fra det som står i journalen.

Dine andre favoritteksempler på lignende prosjekter, internasjonalt og nasjonalt?

Googles (og andre store aktørers) samlede framgang innen maskinlæring på naturlig språk.

Hva tror du er relevant kunnskap for fremtiden?

Maskinlæring kommer til å bli stadig viktigere. Den første omveltningen kommer innen bildebehandling hvor maskiner er i ferd med å bli bedre enn mennesker til å kjenne igjen de fleste typer objekter. Den andre store bølgen dreier seg om maskinlæring brukt på tekst.

Hva gjør vi unikt godt i Norge av dette?

Norge er ikke noe lokomotiv innen dette feltet, og hele Europa står i fare for å bli frakjørt av USA og Kina.

Et favoritt sitat?

«Hver gang vi sier opp en lingvist blir språkmodellene våre bedre».

Viktigste poeng fra vår samtale?

Maskinlæring på medisinsk tekst kan gjøre helsetjenesten bedre.

Vis mer
Tema: Helse- og velferdsteknologi
Organisasjon: Ahus
Perspektiv: Forskning
Dato: 200402
Sted: OSLO
Vert: Silvija Seres

Dette er hva du vil lære:


MaskinlæringRadiologi
Nevrale net Journaler

Mer læring:

AI Superpowers av Kai-Fu Lee Science-artikkelen What can machine learning do? Workforce implications Keiseren over alle sykdommer av Sidharta Mukherjee

Del denne Casen

Din neste LØRNing

Din neste LØRNing

Din neste LØRNing

Dette er LØRN Cases

En LØRN CASE er en kort og praktisk, lett og morsom, innovasjonshistorie. Den er fortalt på 30 minutter, er samtalebasert, og virker like bra som podkast, video eller tekst. Lytt og lær der det passer deg best! Vi dekker 15 tematiske områder om teknologi, innovasjon og ledelse, og 10 perspektiver som gründer, forsker etc. På denne siden kan du lytte, se eller lese gratis, men vi anbefaler deg å registrere deg, slik at vi kan lage personaliserte læringsstier for nettopp deg. 

Vi vil gjerne hjelpe deg komme i gang og fortsette å drive med livslang læring.

En LØRN CASE er en kort og praktisk, lett og morsom, innovasjonshistorie. Den er fortalt på 30 minutter, er samtalebasert, og virker like bra som podkast, video eller tekst. Lytt og lær der det passer deg best! Vi dekker 15 tematiske områder om teknologi, innovasjon og ledelse, og 10 perspektiver som gründer, forsker etc. På denne siden kan du lytte, se eller lese gratis, men vi anbefaler deg å registrere deg, slik at vi kan lage personaliserte læringsstier for nettopp deg. Vi vil gjerne hjelpe deg komme i gang og fortsette å drive med livslang læring.

Vis

Flere caser i samme tema

More Cases in the same topic

#C0160
Helse- og velferdsteknologi

Jan Biti

CEO

Cofounder

#C0152
Helse- og velferdsteknologi

Berit Løkensgard Strand

Professor

NTNU

#C0221
Helse- og velferdsteknologi

Jonathan Romm

Prof

Arkitekthøyskolen Oslo

Utskrift av samtalen: Maskinlæring i medisinsk journaltekst

Silvija Seres: Hei og velkommen til Lørn i samarbeid med Bigmed. Tema i dag er helseteknologi og gjesten min er Fredrik Dahl som er seniorforsker ved Akershus universitetssykehus. Fredrik, vi skal snakke om hvordan maskinlæring kan fungere på medisinsk journaltekst. Gleder meg til å høre mer om både maskinlæring og disse pasientjournalene, og hvordan verden går videre på dem. Men først, fortell oss om hvem du er og hva som driver deg i den retningen av forsking som du holder på med? 

 

Fredrik Dahl: Bakgrunnen min utdannelsesmessig, så har doktorgrad i informatikk innen maskinlæring fra 20 år tilbake. Fra jeg var liten har jeg alltid vært interessert i hvordan man kan få maskiner til å tenke som mennesker og hvor grensene ligger for hva som er mulig å få til der. Det prosjektet jeg er inne i nå som vi skal snakke om i dag handler om hvordan vi kan bruke maskin læringsmetoder til å få maskiner hente ut informasjon og samle sammen informasjon fra pasientjournaler. 

 

Silvija: Du har studert informatikk, du har havnet i helseverden, hva var overgangen der? 

 

Fredrik: Jeg har hatt en litt springende karriere. De første 10 årene av arbeidslivs karrieren min så jobbet jeg i forsvaret faktisk med å analysere militære operasjoner, så hoppet jeg over til å være statistiker på Blindern i en postdoc-stilling et par år. Før jeg nå gikk over til å jobbe med helsetjenesteforskning for 15 år siden. 

 

Silvija: Du er også på fritiden en ivrig sopplukker, og quiz og sjakkspiller. Du må ha noe å gjøre når det ikke er høst og kantareller. 

 

Fredrik: Vi har heldigvis veldig lang høst i landet vårt. Resten av året må man finne på andre ting. 

 

Silvija: Dere jobber med helsetjenesteforskning? Hva betyr det?

Fredrik: Det er et veldig bredt og sammensatt felt som handler om kombinasjon av mange forskjellige metoder for å studere hvordan helsetjenestene virker som system og hvordan det går med pasientene, hvordan man kan forbedre forløpene osv. På avdelingen min har vi alt fra leger og psykologer, matematikere og informatikere som meg selv, økonomer. Veldig mange forskjellige yrkesgrupper, også sosiologer som studerer mer kvalitativ problemstillinger. Vi har forskningsaktiviteter på kommunikasjonen mellom pasienter og leger. Det er et veldig bredt forskningsmiljø. 

 

Silvija: Du ser spesielt på pasientjournal utnyttelse nå, er det det som er oppgaven? 

 

Fredrik: Det er klart dette ligger i nær sagt midt i kjernen av hva man vanligvis tenker på ved helsetjenesteforskning. Det er en tilknyttet del at hvis man lykkes med å informere informasjonen ut av pasientjournalene i sykehus systemene så vil det være en viktig brikke i det å få helsetjenestene til å fungere bedre. Disse journalene det er snakk om er det som legene og sykepleiere først og fremst skriver som dokumentasjon om pasientene etter pasientmøtene de har. 

 

Silvija: Kan du hjelpe å forstå hvordan en pasientjournal ser ut? Jeg har hørt episke fortellinger om e-journaler og hvorfor noen må gjøres i Norge og utlandet. Kan du hjelpe oss å forstå den problematikken. Hva er en pasientjournal? 

 

Fredrik: En del av systemet går ut på mer systematisk hodeverk, om man har faste tall og bokstavkoder for hvilken sykdommer folk har, at man setter opp nært sagt tabellverk over det og hvilke sykdommer pasienter har over tid. Men i tillegg så er det også en mer tekstlig beskrivelse hvor legene oppsummerer hva de mener feiler pasienten, hvilken undersøkelser som er gjort, hvilket behandlinger som er foretatt og hvordan det går med pasienten. 

 

Silvija: Dette er ikke lenger håndskrevet. Det legene knotter inn i datamaskinene sine når vi er hos dem og når vi ikke er hos dem, men det er fortsatt veldig ustrukturert informasjon. Også er spørsmålet om hvordan man kan finne strukturer og mønstre på tvers av dette kaoset? 

 

Fredrik: Det er nettopp noe av problemstillingen. Forøvrig så er det mye som ikke skrives inn på tastatur på vanlig måte, men at legene snakker inn i en maskin og forteller hva som skal stå. Også er det automatisk språkgjenkjenning som lager selve teksten, men det er ikke det trinnet jeg i såfall forsker på. Det vi studerer er selve tekst notatene og hvordan man kan trekke ut kunnskap fra dem. Det finnes mange forskjellige typer av notater, f.eks henvisning notater som gjerne produseres rett før en innleggelse for å hjelpe sykehuset i nær sagt styre pasienten til riktig sted på sykehuset og hvis det skal tas røntgenbilder og slike ting så skrives det henvisninger til det. Legene som ser på bildene produserer rapporter av hva de ser og videre skrives det notater fra selve konsultasjonene. En typisk epikrise som er en tekstbit som skrives når pasienten skrives ut som oppsummerer nær sagt et opphold. Det er mange forskjellige notater som inneholder forskjellig type informasjon. 

 

Silvija: HVis jeg forstår deg rett så er det skoler her når det gjelder effektivisering av bruken av pasientjournaler. Noen som prøver å hjelpe legene og alle de andre som skriver i dem til å lage mer strukturerte materialer i utgangspunktet. Også er det det andre skolen som du hører til som mener at det er maskinene jobb i etterpå å prøve og skape en forståelse ut av den fritekst kaoset. 


Fredrik: Det er ikke noe stor konflikt nødvendigvis. Det er ikke nødvendig å nær sagt legge vekt på at det er helt forskjellige måter å tenke på, men det er likevel en forskjellig innretning med at noen miljøer er mest opptatt av at vi skal legge masse arbeid i at vi skal lage formelle definisjoner av alle underkategorier av alle sykdommer og hva begreper betyr helt eksakt. Mer eller mindre tvinge legene og andre helsearbeidere til å bruke det språket eksakt som man har definert at det skal fungere. Hvis man lykkes veldig godt med det så har man fordeler med at det kan fungere på tvers av land hvis man får til å oversette det. Man kan sikre at informasjonen blir dokumentert på en måte sånn at alle er enige om hva den betyr. Men dette viser seg å være vanskeligere enn det man skulle tro. VI skulle sikkert tro at det er vanskelig, men det er nært sagt enda vanskeligere enn man ville tro. 

 

Silvija: Jeg spurte deg om interessante kontroverser, og den du nevnte for meg er i utgangspunktet en veldig stor og filosofisk en. Det er det med bevisst tenking er forbeholdt mennesker eller om maskinene også kan være bevisste. Det sier du at prøver å slutte og bruke tid på. 

 

Fredrik: Det er sinnsykt at det har kommet til at dette kan man spekulere mye om, men det er ikke så lett å tenke seg noen eksperimenter eller undersøkelser i verden som kan gi svar på det. Da vil diskusjonen nødvendigvis bli endeløs. Da er det bedre å bruke tiden må mer praktiske diskusjoner. 

 

Silvija: Her er min holdning til det. Jeg tenker det er helt irrelevant. Jeg tror maskinene kan trenes opp til å være smarte eller bevisste på ganske mange smale områder, sånn som i ditt tilfelle f.eks, å forstå pasientjournaler ekstremt fort og raskt med kanskje like stort nivå og presisjon, eller større enn mennesker ville gjort. Så kan vi legge sammen de forskjellige smale, smarteter til å få maskiner som egentlig gjør jobben for oss kjempebra. Da skjønner ikke jeg lenger poenget med den filosofiske diskusjonen. Du prøver å lære maskiner til å lese journaler veldig raskt og effektivt. Jeg synes disse konkrete prosjektene du jobber med er utrolig spennende måte å gå frem på og pushe grenser. En av dem som du nevner er hvor du trener opp maskiner eller disse neural modellene til å klassifisere radiologi rapport. Fortell litt mer om det. 

 

Fredrik: Det konkrete prosjektet handler om CT-undersøkelser av barn. Bakgrunnen for det prosjektet er at man gjerne vil holde den type undersøkelser ned på så lavt nivå som mulig fordi det er en viss strålingsbelastning, så det er en ulempe med å gjøre disse undersøkelsene også. Det er viktig å holde en slags oversikt over hvor stor del av undersøkelsene som faktisk finner ting av medisinsk interesse. Slik radiologi-rapportene er skrevet så er det ikke nødvendigvis en enkel oppsummering av alt sammen betyr. Noen ganger er det det, men ofte er det ikke det. Da har vi altså trent opp slike neural nett-modeller til å lese gjennom slike rapporter som typisk er 4-5 linjer og konkluderer med om undersøkelsen er informasjon av medisinsk betydning. 

 

Silvija: Hva slags reaksjoner får du fra leger? Dialoger spesielt. For meg er dette veldig spennende dilemma om hva vi skal gjøre når maskinene blir veldig gode på å gjøre det her. Reaksjonen jeg har fått fra leger og forskere som jobber med lignende ting som deg er at det aldri har vært så mye å gjøre for radiologer som nå. Hva tenker du? 

 

Fredrik: Akkurat i dette prosjektet så er det nok ikke så veldig kontroversielt. Her er det radiologer som har skrevet den aktuelle teksten som så maskiner skal skanne gjennom og tolke. Det som noen kan mene kan være en, om ikke en trussel mot radiologi-yrket, men hvert fall føre til at det ser annerledes ut, det er nært sagt den andre hovedgrenen av kunstig intelligens og maskinlæring nå for tiden. Nemlig det som ikke går på å forstå tekst, det å analysere bilder. Det er virkelig en enorm revolusjon som er midt inne i nå hvor maskinlæring algoritmer kan trenes opp til å klassifisere bilder veldig godt. I mange av de testdomene man har laget så er maskinene like bra som mennesker til å kjenne igjen hva det er bilde av. Kan være alt fra bilder av hus og biler og båter til kaffekopper og hverdagslige ting, men også innenfor radiologi. Hvis det f.eks er bilder av brystpartiet til mennesker tatt med røntgen så kan man da trene opp disse algoritmene til å kjenne igjen mulig kreftsvulster og slike ting. Dette arbeidet er ikke ferdig og det er mye kvalitetssikring som må til, men dette kommer definitivt til å påvirke hvordan radiologi-yrket blir utøvet i praksis i framtiden. 

 

Silvija: La oss si at 90 prosent er lett å klassifisere. Det gjenstår 10 prosent som maskinene kan hjelpe oss med å highlighte. Også er det radiologer og mennesker som kommer inn med å kanskje bruke noe etikk, kulturell forståelse, kontekstforståelse som maskinene kanskje ikke har, til å løse det på en måte som også gir oss mennesker ansvaret. 

 

Fredrik: I den nære fremtiden så kommer det til å bli sånn at man alltid vil ha radiologer med i prosessen som nært sagt kvalitetssikrer og overvåker det som maskinene gjør. Men på litt lenger sikt så kan bli annerledes. Det er f.eks ikke sånn at vi håndregner for å sjekke om lommekalkulatoren har plusset sammen tall riktig. Det kan komme til et punkt hvor det faktisk er omvendt. At de bilde klassifiseringene som algoritmene gjør faktisk er bedre enn det mennesker får til. Vi er ikke der nå på en systematisk måte, men det begynner å nærme seg innenfor en del domener. I hvertfall tydelig avgrense det ved f.eks hvis det er snakk om mammografibilder og hele spørsmålet dreier seg om man ser bilde av noe som kan være brystkreft eller ser man det ikke. Da er det ikke så mye kulturell forståelse som trengs, da er det mer kun å studere selve pikslene i bildet og se om dette tyder på krefttilfelle eller ikke. Men i mange andre sammenhenger er det som du antyder at det å få forstå hvorfor en undersøkelse er tatt og vite mer bakgrunnsinformasjon om pasienten osv er en viktig del av totaliteten av det radiologer gjør. Der er det mye lenger til man kan se for seg at det kan automatiseres. 

 

Silvija: Når excel-arket kom så var det en del folk som sa at nå er det slutt på jobber for regnskapsførere for nå skal alt gjøres i den flotte greia vår. Men det viste seg at det aldri har vært så mye å gjøre for finansfolk som når vi har de nye verktøyene. Jeg tenker at kanskje vil oppgaven til radiologene bestå av å bestille de riktige kombinasjoner av bilder som maskinen kan postprodusere. Det er hvordan vi skal bruke de nye automatiske verktøyene for å nå de riktige diagnosene som kanskje blir en oppgave for mennesker. Eller tror du at det også kommer til å automatiseres? 

 

Fredrik: Det tror jeg du har helt rett i. Hvertfall på de nærmeste tiårene. Hvis man ser veldig langt fram så kan verden bli veldig forskjellig. Hvis vi ser noen få tiår fram så ser jeg for meg at det blir akkurat som du sier. 

 

Silvija: Jeg har lyst til at du forklare litt mer hva resultatet av det du gjør er. For folk, det å høre at du trener opp noen nevrale nett, det høres ut som science fiction av science fiction. Hva betyr det? Hva lager man når man trener opp en maskin? 

 

Fredrik: Ikke hva man bruker det til mener du, men hvordan selve tingen fungerer? 

 

Silvija: Ja. 

 

Fredrik: Man kan beskrive det på forskjellige måter. Nær sagt en mer science fiction måte å fremstille det på er at man har laget noen slags matematiske modeller av hvordan hjerneceller sender signaler til hverandre. Også lager man en slags elektronisk variant av det samme og trener opp disse kunstige nervecellene til å sende riktige signaler til hverandre sånn at sluttresultatet blir det man ønsker. Man kan godt se på det enklere også. Si at det dreier seg bare strukturerte regnestykker som går gjennom mange regnet trinn hvor man nær sagt har mange knapper å skru på. Man har mange frie parametre inne i beregningene som påvirker sluttresultatet. Det denne maskinlæringen går ut på er bare automatiske metoder som tilpasser alle hjelpe parameterne sånn at beregningene blir riktig. Det er på en måte to forskjellige perspektiver på den samme prosessen. Det handler bare om store, kompliserte regnestykker som gjennom å prøve og feile på mange eksempler setter alle sine hjelpeverdier til å bli riktig sånn at man får de resultatene man ønsker. 

 

Silvija: Kjempestore ligninger som på en eller annet vis baker i seg disse parameterne som gjør at de forstår i anførselstegn nye inputverdier som da er bilder eller tekster i ditt tilfelle. 

 

Fredrik: Ja. I f.eks i dette radiologi eksemplet hvor da inputen til systemet er en strøm av tekst som er radiologi-rapporten. Så har man en radiolog med i prosjektet som har gått gjennom mange tusen av slike eksempler og produsert den riktige fasiten, altså nærmest gullstandarden. Så har radiologen en stor mengde eksempler av rapporter, så har han angitt hva det riktige svaret er, når det er ja og når det er ja. Også kjører man alle disse eksemplene gjennom denne neural nett-modellen. Det algoritmene gjør da er å skru og vri på alle parametre den har for å få svaret den kommer ut med å stemme best mulig med det den menneskelige eksperten sier. Også tester man etterpå om det også svarer riktig på eksempler som ikke var med på denne treningsrunden. 

 

Silvija: Er det noen i verden som inspirer deg spesielt godt ift forskningen din. Litt i bred forstand kanskje, maskinlæring osv. 

 

Fredrik: Jeg har egentlig ikke noen enkeltpersoner som jeg ser på som ledestjerner. Verden er vel blitt sånn at det handler mer om store firmaer og store samarbeidsprosjekter heller enn enkeltmennesker som er geniale. På en måte er Edison og andre oppfinneres tid for en stor del over. Det er klart det er enkeltpersoner som betyr mye og, men det er mer at man i fellesskap prøver ut store mengder metoder og dokumenterer hva som virker og ikke. Jeg vil nesten si at selve Google-firma og alle prosjektene de har i seg selv er nærmest fyrtårnet som lyser opp et område. 

 

Silvija: Jeg er enig. En ting er hva de gjør gjennom deepmind og det som anvendes på både spill og bilder derfra, og tensorflow osv. Si litt om Google translate. Jeg tror ikke folk er klar over hva slags gjennombrudd vi har sett der. 

 

Fredrik: Hvis vi går 10 års tid tilbake så var det en stor sport på internett å nær sagt gjøre narr av google translate sine oversettelser. At man kunne få de mest absurde tekster til å komme ut med de rareste forslag til hva ting betydde. Ordstilling ble ofte feil og bøyningsformer ble feil, og alt som var av overført betydning kunne bli fullstendig misforstått. Hvis du skulle oversette “dette er mine fisker” så ville fort google oversette ordet “mine” med “mind”. Det hadde store problemer med å forstå hvordan ord virker når de har forskjellige betydninger. Det man gjør nå er at man bruker neural nett-metodene til å trene opp sånne språkmodeller basert store mengder ferdig oversatt tekst. Man har altså store mengder med tekster på forskjellige språk som betyr det samme, så har man trent opp neural nett-modeller til å forstå oversettingen mellom dem nær sagt. Dette fungerer veldig mye bedre i dag enn det gjorde for bare noen få år siden. Fortsatt er det noen ganger den misforstår. F.eks er det et annet forskningsprosjekt jeg har vært inne i hvor jeg ledet et prosjekt som drev med analyse av hvordan det går med slagpasienter. Vi gjorde statistiske beregninger på de og hvor mange pasienter som kom i fremtiden osv. Da skulle jeg skrive et populærvitenskapelig sammendrag på norsk og engelsk og da som forsøk skrev jeg det først på norsk og kjørte det gjennom google translate for å se hva som kom ut. Nesten alt sammen var god engelsk med korrekte oversettelser med ett eneste unntak, at ordet “slagenhet” som altså er den avdelingen på sykehuset som behandler slagpasienter ble oversatt med “slaughterhouse”. Det var da et lite eksempel på morsomhetene man hadde mye av for 5-10 år siden hvor maskinene oversatte ganske mye riktig, og plutselig avslører at de egentlig ikke skjønner noen ting av hva det handler. Gjorde faktisk en ny test av det for noen måneder siden og da hadde algoritmene forbedret seg og klarte å oversette “slagenhet” til “stroke unit”. Her det altså ikke sånn at det er noen som programmerer inn hva hvert ord betyr. Det er ingen som programmerer inn nøyaktig setninger bygges, om subjektet og verbalet er etter hverandre og slike ting. Det er nesten utelukkende basert på store mengder faktisk tekst som er forhånds oversatt av mennesker og maskinlæring algoritmer som selv klarer å forstå hva hvert enkelt ord betyr og hvordan man setter sammen setninger på de forskjellige språkene. 

 

Silvija: Hva tror du er relevant kunnskap for fremtiden hvis du skulle gi råd itl folk som studere i dag, hva ville du sagt at de skal lære seg mer om? 

 

Fredrik: Jeg tror at denne maskinlæring boomen er noe som kommer til å fortsette og at det kommer til å prege samfunnet vårt mer og mer. Som vi har vært inne på på bildebehandling siden så har man kommet veldig langt. Der er det nærmest sånn at det nesten ikke er et forskningsområde lenger. Det har nesten blitt et anvendelsesområde, nesten som etter at Edison fant opp lyspæren, så var det ikke så nødvendig å forske mer på det. Da handlet det mer om å strekke ledninger og sørge for å ha strømtilførsel der man trengte det. Noen miljøer mener at vi i ferd med å komme dit på bildebehandling, at algoritmene er i grunn på plass. Hvis man først har store mengder bilder med korrekt klassifisering så kan man ofte trene opp maskiner til å klassifisere de like bra som mennesker. Yrker som baserer seg på at mennesker skal se på et todimensjonalt bilde og forstå hva det er bilde av, er nok noe det kommer til å bli mindre av. Vi har vært inne på radiologene som driver en del med det og så patologene som ser på typiske vevsprøver for å forstå om det blant annet det er kreft det er snakk om. Jeg tror ikke de vil forsvinne, det kan hende det blir flere av dem, men det vil forandre seg mye. Der vil det være store endringer. Den andre hovedbølgen er det som jeg er en bitteliten del av som handler om analyse og forståelse av tekst. Der er det mye mer vanskelig å vite hvor langt man kommer og hvor fort det går. Det er definitivt noe som kommer til å prege samfunnet mye. Uten at jeg skal komme med prediksjoner av hvilket yrker som blir borte, det tror jeg jeg vil overlate til andre. 

 

Silvija: Jeg tror at mange yrker består, men bare hvis de bruker de nye verktøyene på en klok måte. Da er spørsmålet om kanskje læringsviljen er avgjørende i de yrkene. 

 

Fredrik: Hvis vi ser historisk på det så er det også yrker som har blitt borte. Typografene klarte gjennom fagbevgelsen å holde stand ganske lenge. Hvis jobben gikk ut på å faktisk plukke metallbokstaver fra en boks og sette de etter hverandre for å produsere aviser, den oppgaven har blitt borte. 

 

Silvija: Hvis jeg skal være provoserende på dette, så tenker jeg at av det de hadde av kjernemner, det er å tenke et godt design for en side. Evnen til å få innhold til å se attraktivt er viktigere enn noensinne, men da må de kunne bruke de nye verktøyene. 

 

Fredrik: Sånn er det nok enda. At mange yrker blir forandret. På den positive siden så er det gjerne de trivielle sidene av jobben som blir borte, mens de mest interessante kan bli igjen. 

 

Silvija: Så det webside-designere må være instinktivt gode på er ikke så ulikt det typologiene måtte være gode på. Det er bare at de bruker helt nye verktøy og media. 

 

Fredrik: Hvis man skal trekke fram forskjeller til hvordan verden ser ut nå fra da jeg var barn, så husker jeg at det var nær sagt bankfilialer på hvert hjørne i en by. Folk som satt og tok i mot regninger, og ga dem penger tilbake. Alt det foregår nå på internett. De jobbene er borte. Jeg ser det utelukkende på positivt. Det er ikke mangel på oppgaver i samfunnet vårt, så hvis vi kan rasjonalisere bort noen flere av de mer trivielle oppgavene så er det desto mer arbeidskraft som kan drive med viktigere ting. 

 

Silvija: Jeg spør deg om Norge gjør noe unikt godt i ditt felt. Du sier akkurat innenfor dette feltet, da tenker jeg du mener maskinlæring på tekst, så er ikke Norge akkurat et lokomotiv, men vi burde antagelig stå på litt hardt for å være verdensmester i analyse av norsk språk. Det er jeg helt enig i. Uten at jeg er helt sikker på om det går an å gjøre det for det går an å trene opp disse fantastiske gode verktøyene til Google til nye språk relativt fort. Jeg tror det er et område hvor Norge har både data og prosessforståelse som er ganske unik. Det er de store industrielle prosessene og automatisering av det. Kan noe av det du gjør anvendes på enda bedre automatisering og maskinlæring? Eller til og med dyp læring? Automasjon av store industrielle, krevende prosesser. 

 

Fredrik: Dette er utenfor det som er mitt spesialområde. Det vil jeg absolutt tro. I det hele tatt, maskinlæring på kilder som består av tall istedenfor tekst er i utgangspunktet minst like godt egnet. Dette vil kanskje grense opp til robotikk, hvis vi skal tre-dele den store omveltningen som skjer som har med kunstig intelligens å gjøre så er det noen som gjerne omtaler det som den tredje. Vi har bildeprosessering, tekstanalyse og robotteknologi som de tre hovedpilarene. 

 

Silvija: Hvor skal vi gå for å lese mer? Du anbefaler en av mine favorittbøker “superpowers”. Finnes på engelsk i lydformat og der er den kjempefin. Har du noen kortere ting folk kan bruke for å komme i gang med AI? 

 

Fredrik: Jeg har egentlig ikke så mye gode kilder på det. Faktum er at hvis jeg skulle komme med anbefalinger så er det første jeg ville gjøre er å google det selv og se hva google kommer opp med. Hvis man gjør et google søke på de aktuelle begrepene man er ute etter så vil de treffene være bedre enn det jeg kan komme på. 

 

Silvija: Du nevner også en science artikkel om hva maskinlæring kan gjøre spesielt med implikasjoner for arbeidsstyrken. Det har vi diskutert her. Jeg synes kommentaren din er veldig tankevekkende. Du sier at “den er jo også på engelsk”. Det er litt tankevekkende at du egentlig ikke forholder deg til norsk språk annet enn i forskningen din. Det du sier er at vi bør formidle og skrive mer om kunstig intelligens på norsk. I Norge i hvertfall. 

 

Fredrik: Det mener jeg man bør gjøre. Innenfor vårt språkområde så er det viktig å ha god litteratur som dekker de viktige temaene. 

 

Silvija: Vi får samle det. Det finnes folk som skriver, men jeg tenker vi trenger å samle et lite bibliotek der. Også på litt forskjellige nivåer av matematikk. Jeg tror ikke alle trenger å lære seg masse statistikk for å kunne forstå greia med AI. De fleste skal bare være brukere, men de burde vite hvordan de kommer i gang med å være brukere. 

 

Fredrik: Det er jeg enig i. Det er ikke nødvendig at man forsøker å gå inn i dybden av algoritmene og hvordan ting virker helt på bunn, så lenge man ser det store bildet, hva det kan brukes til og hva slags problemer det kan løse. 

 

Silvija: Har du et sitat? 

 

Fredrik: Jeg har prøvd å tenke på det. Har hatt noen forskjellige alternativer. Det er sitat som er litt kontroversielt og som jeg ikke nær sagt vil fremme som mitt eget, men som likevel illustrerer litt av denne kontroversen. Det er ikke akkurat det samme som jeg snakket om tidligere om strukturering av språk. Når man analyserer språk er det også tradisjonelt lingvistene som driver med det. At de bygger grammatikk regler for hvordan substantiver og verb plasseres etter hverandre, hva slags type ord man har og bøyning ord osv. Man forsøker å bygge formelle modeller av hvordan språket virker. Denne maskinlærings tradisjonen er litt på det, innimellom så henter maskinslærings tradisjonen også inspirasjon fra lingvistene, men det er berømt sitat som på norsk går nesten som følger at “hver gang vi sier opp en lingvist så blir språkmodellene bedre”. Det er en slags illustrasjon på at vi nå er inne i en mer datadrevet tid, så det å ha store mengder faktisk tekst som viser hvordan folk bruker ordene ofte er vel så nyttig som det å ha teoretiske modeller på hvordan språket er. 

 

Silvija: Maskinene lærer kanskje raskere enn ekspertene.

 

Fredrik: Det er like mye at språket vårt er så komplisert. Det er så mange unntak og unntak fra unntakene, at det å forsøke å lage en formell beskrivelse av hvordan språket virker, ofte snubler i alle unntakene. 

 

Silvija: Hva er det viktigste vi har snakket om?

Fredrik: Det viktigste vi har snakket om av det som angår forskning som jeg er inne i er det vi startet med som er litt mer ned på jorda. Som handler om at det finnes veldig mye verdifull informasjon som legene og andre helsearbeidere skriver i journal tekstene som ikke utnyttes fullt ut. Maskinlærings-metoder er nært sagt klar til å bistå der og hvis vi får til gode målrettede prosjekter så kan vi få til bedre pasientbehandling og mer effektiv bruk av ressurser med å utnytte alt som står skrevet om pasientene i journalene. 

 

Silvija: Altså maskinlæring på medisinsk desk er bruksklar og kan virkelig hjelpe. Fredrik Dahl, seniorforsker på Akershus universitetssykehus som har lært oss masse om kunstig intelligens på tekst, spesielt på medisinske tekster 

Quiz for Case #C0652

Du må være Medlem for å dokumentere din læring med å ta quiz 

Allerede Medlem? Logg inn her:

Du må være Medlem for å kunne skrive svar på refleksjonsspørsmål

Allerede Medlem? Logg inn her: