LØRN case C0046 -

Lise Randeberg

President

Tekna

Fysikk + statistikk = diagnostistikk

I denne episoden av #LØRN snakker Sunniva med professor ved NTNU og president i TEKNA, Lise Randeberg, om data- og sensorsystemer som gir leger bedre verktøy for å ta beslutninger. Lise jobber med sensorteknologi og ble interessert i Big Data fordi hun til slutt skjønte at de satt på veldig detaljerte og komplekse data som var umulige å skjønne uten hjelp fra en datamaskin. I samtalen mellom Sunniva og Lise, gjennomgåes teknologi som har hjulpet folkehelsa, som smart-klokker med pulsmåling, smart-telefoner som kan predikere gulsott hos nyfødte, og det reflekteres rundt de enorme mulighetene som ligger i en etisk bruk av all den dataen som finnes lagret i offentlig helsesektor, om den utnyttes med grunnlag i den unike tilliten som allerede finnes i Norge.?
LØRN case C0046 -

Lise Randeberg

President

Tekna

Fysikk + statistikk = diagnostistikk

I denne episoden av #LØRN snakker Sunniva med professor ved NTNU og president i TEKNA, Lise Randeberg, om data- og sensorsystemer som gir leger bedre verktøy for å ta beslutninger. Lise jobber med sensorteknologi og ble interessert i Big Data fordi hun til slutt skjønte at de satt på veldig detaljerte og komplekse data som var umulige å skjønne uten hjelp fra en datamaskin. I samtalen mellom Sunniva og Lise, gjennomgåes teknologi som har hjulpet folkehelsa, som smart-klokker med pulsmåling, smart-telefoner som kan predikere gulsott hos nyfødte, og det reflekteres rundt de enorme mulighetene som ligger i en etisk bruk av all den dataen som finnes lagret i offentlig helsesektor, om den utnyttes med grunnlag i den unike tilliten som allerede finnes i Norge.?
Facebook
Twitter
LinkedIn
Email

18 min

Choose your preferred format

Hei og velkommen til denne episoden av LØRN. I dag er temaet big data. Jeg heter Sunniva Rose. Og med meg har jeg Lise Randeberg, professor ved NTNU og preisdent i techda.


SR: Du sier selv at du brenner for etisk AI og dataforståelse. Og du kombinerer fysikk og statistikk for å gjøre diagnostikk som vanligvis tar 3-6 måneder på to minutter. Jeg synes det veldig stas og sitte med en fysikker her på LØRN. Men først, hva er big data for deg?

LR: Analyse av big data er ett verktøy for å finne system i kaos. For meg er det en nødvendighet når jeg satt med store komplekse datasett. Jeg har sittet utallige timer og sett på disse datasettene og tenkt at det skal dukke opp en sammenheng, men det skjer ikke. Vi mennesker har begrensinger, da trenger vi hjelp fra datamaskiner.

SR: For reelle data fra naturen er jo ikke pene og på en rett linje. De er veldig komplekse og det er sjeldent du kan se mønsteret med en gang.

LR: Ja. I så fall har du en veldig enkel problemstilling. Jeg jobber med medisinsk forskning og mennesker. Som er veldig komplekse ting. Og da er det veldig mange faktorer som påvirker hvordan datasettet ser ut.

SR: Hva er det konkret du jobber med?

LR: Jeg jobber med medisinsk sensorteknologi hvor vi prøver å bruke lys til å diagnostisere sykdommer.

SR: Hva slags sykdommer da?

LR: For eksempel leddgikt. I dag hvis du har leddgikt må du gå til flere ulike spesialister. Du må ta røntgen, MR. Og gjøre mange forskjellige typer undersøkelser. Også prøver mann å analysere den dataene for å stille en diagnose. Det tar gjerne 3-6 måneder. Samtidig som du har ett vindu på å behandle sykdommen som er 3-6 måneder hvis du skal unngå å få skadet leddene dine for framtiden. Vi jobber med å samle inn masse ulike parametere og data fra hver enkelt person for å se om vi finner noe mønster som er karakteristisk for de ulike typene leddgikt. Målet er å gjøre ett scann, samtid dataanalyse mens vi scanner.

SR: Dere vil gjøre ett scann av mennesket, samle alle dataene, analysere alle disse dataene as you go og får ett resultat rett etterpå. Ting som egentlig tar 3-6 måneder? Det høres jo for godt ut til å være sant.

LR: Vi er i prosessen nå. Men vi tror vi skal lykkes med det, og det ser veldig positivt ut. Det vi må gjøre er å kombinere kunnskap innenfor biologi og fysikk med dataverktøy for å forstå mønstrene i dataen. Du er helt avhengig av å forstå systemet du jobber med. Så kan du bruke forskjellige verktøy fra ulike fagområder, men du må tilpasse til din applikasjon og skjønne hva som kommer ut av det. Og det går litt på det etiske. For meg er det vanskelig å jobbe med en «svart boks».

SR: En svart boks som at noen har skrevet en kode og du ikke vet hva som ligger i den?

LR: Ja. Da kan du bare putte inn data, og du får ett svar, men du vet ikke hvorfor svaret blir som det blir. Så vi har behov for å koble på fysikken for å forstå hva det er stordata analysen gir oss.

SR: Jeg lurer. Du bruker lys for å diagnostisere. Er det vanlig lys?

LR: Når du blir syk endrer kroppen din seg. Får du en hudsykdom for eksempel, er det lett og se at huden ser annerledes ut. De endringene kan vi måle. Og ser det annerledes ut er det også annerledes hvordan lys vekselvirker med vevet ditt. Og dette kan vi måle. Også kan vi måle spektrale fingeravtrykk av sykdommen og ett friskt vev. Dette kan være synlig lys, IR, UV. Egentlig hva som helst. Og da får vi masse komplekse data som er vanskelig å visualisere. Vi mennesker har ett ganske enkelt synssystem som bare klarer å ta til seg begrenset mengde data, og da trenger vi hjelp for å trekke ut essensen og forstå helheten.

SR: Hvordan funker denne analysen egentlig?

LR: Statistikk. Det handler om å bruke statistikk til å se mønster, eller finne ting som skiller seg ut. Samme som man leter etter firkløver om sommeren og er heldig hvis man finner en. Kan man fortelle en data hvordan en trekløver ser ut, også skal den finne alt som ikke er trekløver, så gjør datamaskinen det ganske raskt. Og den er god på å gjøre ting som gjentar seg. Ett eksempel fra medisin er patologi. Hvis du blir syk og går til legen så tar han en prøve. Av for eksempel en føflekk som du tror det er noe galt med. Også prøver legen å se i ett mikroskop etter unormale mønster. Dette er også sted hvor stor dataanalyse virkelig kan gjøre en forskjell i medisinsk diagnostikk.

SR: Er det noen skumle ting med big data?

LR: Det er ganske mange ting. For det første, det jeg allerede har nevnt at det er ikke sikkert du vet hvorfor. «Black box» problemet. Du har ikke forutsigbarhet på hvorfor du får det svaret du gjør. Men det er også når vi begynner å snakke om mennesker og oppførsel og tar informasjon om en befolkning for å spå hva ett enkelt individ kommer til å gjøre. Da blir det skummelt.

SR: Er ikke det uansett feil å bruke statistikk regnet for en stor gruppe på ett enkelt individ.

LR: Ja. Og derfor er det skremmende når myndigheter begynner å tenke sånn. Nemlig at mann skal spå ut ifra det. Jeg var en gang i en politisk debatt om sikkerhet og dataanalyse. Og hvilke data man skal se på. I forbindelse med ett digitalt grenseforsvar for Norge hvor man skal samle inn stor data. Da utfordret jeg myndighetene på hva de så etter. Og de svarer de for eksempel er interessert i å vite om. Noen har for eksempel googlet hvordan man bygger en bombe. Også tenker jeg «Det har jeg også gjort. Jeg er jo fysikker». Så sier jeg det. Og da sier «Ja, men det var ikke deg jeg tenkte på for du har jo ikke vært på ferie i Afghanistan». Så det er noe om hvordan man velger å bruke den type opplysninger som kan være veldig skremmende.

SR: Jeg mener at det viktig at befolkningen forstå mer om statistikk for å skjønne de forskjellige algoritmene vi blir utsatt for.

LR: Du må skjønne at de ulike algoritmene faktisk er en oppskrift. Og at den gjør akkurat det du ber den om. Så hvis det går galt, er det deg selv som har problemet.

SR: På patologi, er det noe skummelt innenfor det?

LR: Før du analyserer dataen din, er det viktig å renske datakvaliteten for fjerne støy i systemet. Alle vi som har jobbet med virtuelle forskjeller vet det ofte er fryktelig mye støy, og det skaper problemer. Så igjennom støyfjerning og rydding i datasett så kan det skje ting hvis man bruker kjente mønster og stordataanalyse og trene det for å fjerne den støyen. Jeg har sett ett veldig godt eksempel fra Tyskland hvor man gjorde det med microskopidata. Altså, man filmet fra ett mikroskop hvor det var celler og noe som skjedde inni en celle. Da så de på hvordan insulin beveget seg. Og det så helt fantastisk ut. Jeg satt i salen på konferansen og var helt satt ut. Du så molekylene som beveget seg fram og tilbake. Men så sier han som har laget algoritmen at en tredjedel av de insulin molekylene dere ser på skjermen nå finnes ikke. Så da hadde algoritmen laget fake data. Den var begravd i støy og trodde den hadde sett ett mønster som da altså ikke var der. Så foreløpig trenger vi at mennesker og maskiner jobber sammen, og at vi har en kritisk holdning til at det ikke er alt som kommer ut av en algoritme som er sannheten.

SR: Men det er jo gode nyheter for de som tror at mennesker er på vei til å bli automatisert bort.

LR: I vertfall ikke enda. Og vi har sett på innenfor patologi hvor godt en maskinlærings algoritme gjør det alene, og hvor godt en patolog gjør det alene. Og begge gjør det relativt bra, men hvis

du kombinerer de så blir det suksess.

SR: Hvis du skal komme med ditt beste eksempel på big data foruten om de tingen vi har snakket om?

LR: Jeg ser du har en smartklokke på deg. Nettopp det synes jeg er ett fantastisk verktøy. Og jeg har vært inne og sett litt på hva som er patentert på det området. Patenter er jo en måte for å publisere dine innerste tanker på en veldig komplisert måte. Så der står alle detaljer for hvordan de faktisk regner på denne dataen. Og etterhvert kommer det en ny klokke som kan gjør ekg. Og kan du i tillegg legge til funksjoner hvor de kan lære ditt mønster, din hjertefrekvens og mønstrene i dine hjerteslag sånn at du kan forutse når det begynner å skje ting.

SR: For medisinen ser på gjennomsnittsmennesket, men vi er jo individer.

LR: Persontilpasset medisin med wearables, altså ting du kan ha på deg kommer til å bli større og større. Og det som er morsomt med dette fagfeltet er at du kan ta de algoritmene du bruker for å se på hjertefrekvens og hvordan det fungerer og bruke de i landbruk for å se hvordan det går ut med plantene dine. Og på den måten få presis data om akkurat hvor mye gjødsel plantene trenger, så sparer du miljøet samtidig ved å ikke over å gjødsle.

SR: Vi må begynne å bevege oss mot slutten. Hva i Norge er vi unikt gode på når det kommer til dette?

LR: Vi har ett unikt samfunn med masse tillitt. Og det gir oss en kjempe fordel. Vi har gode offentlige data og mengder med helsedata blant annet, som det går an å skape masse ut av. Vi har også personnummer, og det er det mange store land som ikke har. Og det gir oss en mulighet til å koble sammen alle arkivene vi har med data og slik kan vi kartlegge veldig mye.

SR: Mange som hører dette vil kanskje tenke at det høres skummelt ut?

LR: Ja. Og derfor er det viktig med etisk AI. Nemlig at du tenker det godt igjennom og bevarer tillitten. Og kan vi være en frontrunner på å ta etiske hensyn, så kan det bli ett konkurransefortrinn for norge når vi skal bygge nye næringer. Vi kan til og med si til internasjonale aktører at de bør komme til oss da vi har ett godt system som fungerer.

SR: De som sitter og lytter vi kanskje lære mer. Har du noen tips?

LR: Nybegynner bør lære av erfarne «fjellfolk». Man kan ikke bare ta en algoritme og bruke den. Den må tilpasses ditt datasett og da må man forstå hva som foregår. Også vil jeg at folk skal se mer science fiction «my noroty deport» for den handler nettopp om prediktiv analyse.

SR: Har du ett poeng du vil lytteren skal sitte igjen med?

LR: Store data gir store muligheter, men du må også tenke på etikken.

SR: Tusentakk for at du kom og delte kunnskapen din her i Lørn, Lise Randeberg. Og tusentakk til deg som lyttet.



To linjer om din «claim to fame»?

Jeg vil redde verden, brenner for etisk AI og dataforståelse, kombinerer fysikk og statistikk for å gjøre diagnostikk som vanligvis tar tre–seks måneder, på bare to minutter, og jeg ønsker å forbedre livskvaliteten til pasienter få bryr seg om.

Hvem er du, og hvordan ble du interessert i big data?

Jeg er professor ved NTNU og jobber med sensorteknologi. Ble interessert i big data fordi jeg til slutt skjønte at vi satt på veldig detaljerte og komplekse data som var umulige å skjønne uten hjelp fra en datamaskin. Stordataanalyse ble rett og slett en nødvendighet for å forstå hva jeg drev med.

Hva gjør dere på jobben?

Vi bygger og bruker skreddersydde sensorsystemer: Vi tester dem, samler data og prøver å forstå dem gjennom å finne biologiske «fingeravtrykk». Alt dette gjør vi for å gi leger bedre verktøy for å ta beslutninger.

Hva er egentlig big data?

Du kan bruke ganske primitive verktøy og mye datakraft til å finne mønster som mennesker ikke kan se.

Hvorfor er det så spennende?

Det hjelper oss å se det vi ikke klarer å systematisere selv, nesten som å tolke usynlig skrift.

Hvorfor kan det være skummelt?

Det kan være skjevheter i datamaterialet som påvirker resultatet uten at du er oppmerksom på det. Jeg synes big data og prediktive algoritmer brukt på adferd, er skikkelig skummelt. Det er også skummelt om vi ikke skjønner hvorfor resultatene er som de er.

Ditt beste eksempel på big data?

Prediksjon av gulsott hos nyfødte med smarttelefon.

Har du andre gode eksempler på big data, internasjonalt og nasjonalt?

Pulsmålinger fra en smartklokke.

Hvordan funker det egentlig?

Tenk deg at du leter etter firkløver i en eng med nesten bare trekløver. Da prøver du å finne det mønsteret som skiller seg ut i mengden, og det kan datamaskinen hjelpe deg med. Dersom du viser den hvordan en normal kløver ser ut, og hvordan en firkløver eller femkløver ser ut, kan den sortere hele enga for deg raskt som bare det.

Er det noe vi gjør her i Norge som er unikt?

Vi har masse gode data, så det er vår største verdi. Hvis vi klarer å få delt alle offentlige data på en trygg og etisk riktig måte, har vi en vinneroppskrift!

Et favoritt big data sitat?

Store data, store muligheter.

Lise Randeberg
President
Tekna
CASE ID: C0046
TEMA: AI AND BIG DATA TECHNOLOGY
DATE : 181012
DURATION : 18 min
YOU WILL LØRN ABOUT:
Etisk AI Dataforståelse Sensorsystemer
QUOTE
"Mitt favoritt eksempel er pulsmålinger fra en smartklokke. Tenkt hva man kan si om verdens hjertehelse med tilgang til de datene? Med stadig flere sensorer i disse klokkene blir de stadig viktigere som verktøy for å finne ut når du holder på å bli syk og hva som feiler deg."
More Cases in topic of AI AND BIG DATA TECHNOLOGY
#C0044
AI AND BIG DATA TECHNOLOGY
Big Data og geometrisk modellering

Heidi Dahl

Forsker

Sintef

#C0043
AI AND BIG DATA TECHNOLOGY
Slik kan Big Data predikere fremtiden

Sverre Kjenne

Leder

BaneNor

#C0042
AI AND BIG DATA TECHNOLOGY
Data som beskriver den industrielle virkeligheten

Geir Engdahl

CTO

Cognite