Intelligent og automatisk bildeanalyse

LØRN Case #C0201

I denne episoden av #LØRN snakker Fredrik med forskningsleder i Norsk Regnesentral, Line Eikvil. Line fattet interesse for bildeanalyse allerede under informatikkstudiet, og har nå jobbet i over 30 år med problemstillinger knyttet til bildegjenkjenning og AI. I Norsk Regnesentral driver de oppdragsforskning innenfor statistisk analyse, bildeanalyse og maskinlæring. I episoden forteller Line om hvordan dyp læring har revolusjonert bildegjenkjenning, hvordan intelligent bildeanalyse kan brukes til mammografi, ultralyd og satellittdata, i tillegg til mange flere spennende eksempler.

Line Eikvil

Forskningsleder

Norsk Regnesentral

"For AI generelt og bildeanalyse, har dyp læring, blitt en av de viktigste teknologiene. Her skjedde det nærmest en revolusjon i 2012, da en gruppe ved universitetet i Toronto benyttet denne metodikken til gjenkjenning i bilder og knuste tidligere rekorder i en bildegjenkjenningskonkurranse."

Varighet: 16 min

LYTTE

Ta quiz og få læringsbevis

Du må være medlem for å ta quiz

Bli medlem (Gratis)

Ferdig med quiz?

Besvar refleksjonsoppgave

Bli medlem (Gratis)

Hvem er du, og hvordan ble du interessert i AI?

Informatiker, forsker og forskningsleder for bildeanalyse og maskinlæring. Interessen for bildeanalyse startet allerede under informatikkstudiet, hvor jeg ønsket å forstå hvordan en kunne få datamaskinen til å se. Har siden jobbet med problemstillinger knyttet til automatisk tolkning og gjenkjenning i bilder i over 30 år.

Hva gjør dere på jobben?

Vi driver med oppdragsforskning innenfor statistisk analyse, bildeanalyse og maskinlæring. Innen mitt område jobber vi med metoder for automatisk gjenkjenning og tolkning i ulike typer bilder, alt fra medisinske bilder, satellittbilder, scannede dokumenter, ekkoloddbilder av fisk, seismikk fra oljesektoren, osv.

Hva er de viktigste konseptene i AI?

For AI generelt og bildeanalyse spesielt har dyp læring (deep learning) blitt en av de viktigste teknologiene.

Hvorfor er det så spennende?

Det er både en spennende teknologi og spennende at en kan få datamaskinen til å se og bidra til å utvikle løsninger for dette. Dype nevrale nettverk har gjort oss i stand til å løse problemer vi ikke klarte å løse før.

Hva synes du er de mest interessante kontroversene?

Urealistiske forventninger. Troen på at maskinene kan lære av seg selv.

Dine egne prosjekter innen AI?

Vi jobber med svært mange prosjekter relatert til intelligent bildeanalyse. Noen eksempler: – dyp læring og big data i mammografiprogrammet (Kreftregisteret) – intelligent ultralydscanner (GE Vingmed) – dyp læring for tolkning av seismikk (Equinor) – automatisk bildeanalyse for marinetjenester (Havforskningsinstituttet) – AI for satellittdata (European Space Agency) – finne kulturminner fra lidar data (Riksantikvaren)

Har du andre gode eksempler på AI internasjonalt og nasjonalt?

Et eksempel er selvkjørende biler. Men det er langt fram for at en selvkjørende bil skal kunne kjøre på en hvilken som helst vei under alle værforhold og tolke alle situasjoner.

Er det noe vi gjør her i Norge som er unikt?

Utstrakt bruk av teknologi og innsamling av data (f.eks. oljesektor, marin sektor) kan gi et godt utgangspunkt.

Kan du anbefale noe stoff om AI?

For dyp læring for bildeanalyse: Stanford-kurset CS231 (video av forelesninger på nett).

Et favorittsitat om AI?

Yann LeCun: «If intelligence was a cake, unsupervised learning would be the cake, supervised learning would be the icing on the cake, and reinforcement learning would be the cherry on the cake. We know how to make the icing and the cherry, but we don’t know how to make the cake.»

Hvem er du, og hvordan ble du interessert i AI?

Hva gjør dere på jobben?

Hva er de viktigste konseptene i AI?

For AI generelt og bildeanalyse spesielt har dyp læring (deep learning) blitt en av de viktigste teknologiene.

Hvorfor er det så spennende?

Hva synes du er de mest interessante kontroversene?

Urealistiske forventninger. Troen på at maskinene kan lære av seg selv.

Dine egne prosjekter innen AI?

Har du andre gode eksempler på AI internasjonalt og nasjonalt?

Et eksempel er selvkjørende biler. Men det er langt fram for at en selvkjørende bil skal kunne kjøre på en hvilken som helst vei under alle værforhold og tolke alle situasjoner.

Er det noe vi gjør her i Norge som er unikt?

Utstrakt bruk av teknologi og innsamling av data (f.eks. oljesektor, marin sektor) kan gi et godt utgangspunkt.

Kan du anbefale noe stoff om AI?

For dyp læring for bildeanalyse: Stanford-kurset CS231 (video av forelesninger på nett).

Et favorittsitat om AI?

Vis mer

Tema: AI- og datadrevne plattformer

Organisasjon: Norsk Regnesentral

Perspektiv: Forskning

Dato: 181218

Sted: OSLO

Vert: FW

Dette er hva du vil lære:

Dette lørner du:Dype nevrale nettverk
AI
Bildeanalyse
Maskinlæring

Del denne Casen

Din neste LØRNing

Dette er LØRN Cases

En LØRN CASE er en kort og praktisk, lett og morsom, innovasjonshistorie. Den er fortalt på 30 minutter, er samtalebasert, og virker like bra som podkast, video eller tekst. Lytt og lær der det passer deg best! Vi dekker 15 tematiske områder om teknologi, innovasjon og ledelse, og 10 perspektiver som gründer, forsker etc. På denne siden kan du lytte, se eller lese gratis, men vi anbefaler deg å registrere deg, slik at vi kan lage personaliserte læringsstier for nettopp deg.

Vi vil gjerne hjelpe deg komme i gang og fortsette å drive med livslang læring.

Vis

Flere caser i samme tema

Digitale tvillinger

Michael Link

Forsker

Kongsberg

Gå til case →

#C0044

AI- og datadrevne plattformer

Big Data og geometrisk modellering

Heidi Dahl

Forsker

Sintef

Gå til case →

#C0043

AI- og datadrevne plattformer

Slik kan Big Data predikere fremtiden

Sverre Kjenne

Leder

BaneNor

Gå til case →

Utskrift av samtalen: Intelligent og automatisk bildeanalyse

Fredrik Winther: Velkommen til LORN.TECH mitt navn er Fredrik Winther jeg skal ha en samtale med Line Eikvil, hun er forsknings leder i norsk reinsentral og jobber med intelligent og automatisk bildeanalyse og litt større tema kunstig intelligens som vi kommer inn på. Kan du aller først Line, si litte granne om deg selv og hva du gjør inn i norsk reinsentral.

Line Eikvil: Ja, jeg har bakgrunn som informatiker, jeg jobber da som sagt som forsker og forskningsleder for norsk reinsentral og jeg jobber med bilde analyse. Min vei inn i bilde analyse var fra informatikkstudiet hvor jeg for første gang kom borti disse kursene og hvor jeg syntes dette var veldig spennende at man kunne klare å få datamaskin til å se. Det begynner å bli lenge siden jeg studerte, men jeg fortsatte å synes at dette da var veldig spennende og jeg har jobbet med dette da i ca 30 år nå.

Fredrik: Bilde av visuelle data har jo blitt veldig hot i det siste, skal vi komme mye tilbake på til, men akkurat hva norsk reinsentral er og hva dere gjør på jobben. Hvordan vil du beskrive det?

Line: Ja, vi er ett forsknings institutt som driver med oppdragsbasert forskning. Det jeg jobber innenfor er jo da bilde analyse vi jobber også med maskinlæring, og statistisk modellering innenfor ikke bare bilder men andre typer data også litt mer sånn generell it.

Fredrik: I mediet bildet eller generelt de siste årene så dukker kunstlig intelligens og AI og maskinlæring opp overalt og er knapt nokk et område som ikke blir berørt, både etiske trusselbilder og hvordan det automatiserer og overtar arbeid. Er det noen, eller hvis du skulle si noe ut ifra ditt perspektiv hva tenker du er de viktigste perspektivene på dette akkurat nå?

Line: Ja, tenker du på hvordan kunstlig intelligens overtar eller? Hvor vi er hen eller?

Fredrik: Ja, litt, hva skal man si. Kunstlig intelligens og maskinlæring har jo litt lang historie, overaskende lang historie, tilbake til 50 og 60 tallet og hva er forskjellen denne gangen?

Line: Ja, man trodde jo allerede. Begrepet var jo kanskje introdusert på 40-50 tallet allerede. Også kom man ut over på 50- tallet så tenkte man at kunstlig intelligens kunne overta alle intelligente, mensklige oppgaver om 20 år, så har vi ikke kommet helt der.

Fredrik: Det er det samme vi sier i dag.

Line: Og vi sier det samme i dag. Og vi er kanskje ikke der om 20 år heller. Så ja, man har hatt en del høye forventninger som ikke har blitt helt oppfylt. Og det har vel gjort at kunstlig intelligens og droner har vært veldig uglesett, men.

Fredrik: Kan man for eksempel si at om kunstlig intelligens så har det vært vinter eller?

Line: Ja altså det har jo vært to sånne såkalte AI vintere. En på 70-tallet og en på 90- tallet.

Fredrik: Hva skjedde der?

Line: Nei, det var jo akkurat det som skjedde, at man bygde opp forventingene og at de ble veldig høye. Også viste det seg at man ikke klarte å innfri de, så mistet alle troen på at alt mulig.

Fredrik: Ja, nå snakker man om en ny revolusjon, hvis vi skal si hva som er annerledes denne gangen, er det så stor hastighet eller hva er det?

Line: Ja, det har vært en slags revolusjon innenfor kunstlig maskin læring som er, det store, store gjennombruddet som skjedde kanskje i 2012. av nettopp innafor bilde analyse og det som skjedde da var at noen fra Toronto som klarte å knuse alle tidligere rekorder for bilde gjenkjenning på en sånn årlig konkurranse som ble gjennomført der med automatiske metoder da. Og grunnen til at de fikk til det akkurat da det var blant annet at det kom mye mer data og de skjønte at det krevde mer data for å lære opp disse nye metodene. Det andre som skjedde var at han fikk mye mer regnfrakt, gpu-er for å kverne gjennom og regne gjennom disse dataene sånn at man faktisk klarte å lære noe i løpet av innenfor rimelig tid. Og det siste som skjedde var at, skal vi si, metodikken som ble brukt her ble kalt det dype nevralnettverk og disse nevrale nettverkene var jo da blitt samme kunstig intelligens veldig uglesett i noen tiår, men det var en gjeng med skarpgjenger i Canada som ikke ga seg, noen forskere som ikke ga seg og fortsatte jobbe med dette og kom fram til noen lure triks som da førte til at man fikk lære noen av disse modellene og på masse data, og da fikk man resultater.

Fredrik: Så det er dype nevrale nettverk, økt prosessor hastighet og ikke minst da tilgang på data. De tre tingene som har spilt sammen som gjør det kanskje litt annerledes denne gangen.

Line: Det er det som er den store forskjellen enn på det som var tidligere og samtidig så har man jo faktisk fått en del resultater, man får til en god del ting bedre enn før.

Fredrik: Man hører jo stadig om veldig imponerende resultater og maskiner som med helt nye strategier slår de beste spillerne på go-et og sånne ting.

Line: Ja de lærer på en helt annen måte og dermed kan de få til nye ting og bedre ting.

Fredrik: Og på ditt felt bilde gjenkjenning, mer visuelle. jeg tenker at det er knyttet til mere automatiserte kjøretøy og selvkjørende biler som også er veldig i vinden i media må jeg si. Hvordan ser det ut? Fra forsknings siden eller fra din erfarings bakgrunn.

Line: Ja akkurat. Når det kommer til selvkjørende biler så selv om man har oppnådd utrolig mye med disse metodene så klarer man mye mer enn man gjorde før. Altså en av bakgrunnene til at man får til eller klarer ting i bildeanalyse som man ikke gjorde før er jo at man tidligere så måtte du bestemme egenskapene også måtte du bestemme hva som betyr noe, eller ett objekt fra ett annet. Det gjør disse egenskapene automatiske. En opplivelse av biler og fotgjenger den finner selv ut hvordan de skal se ut og hvordan det er best å representere den eller skille de fra hverandre og det gir jo helt andre muligheter også for selvkjørende biler så har du jo da muligheten til å skjenne igjen ting på en helt annen måte. og du har, du kan sette på så mange sensorer du vil, altså kameraer og mange andre type sensorer, kan få se i dør vinkelen som kanskje ikke noen mennesker er så gode på, men samtidig så er det nokk et godt stykke igjen før vi får disse selvkjørende bilene går på en hvilken som helst vei, under hvilket som helst vært forhold.

Fredrik: Så vil du tørre å gjette på når vi har de første bilene? Man får inntrykk på at det er rett rundt hjørnet.

Line: Jeg tro ikke det er rett rundt hjørnet. Jeg tror det er litt mer som skal til, en ting er jo å ha disse bilene i litt mer tilrettelagte områder og på tilrettelagte veier. Noe annet er å få det til å da få den til å kjøre på landveier på veit til hytta når det snør på tvers.

Fredrik: Så det kan fortsatt motivere datteren min til å spare til å få lappen.

Line: Det tror jeg absolutt hun kan.

Fredrik: Skal vi se, dere er ett forsknings institutt. Hvis vi skal gå inn i de konkrete casene og oppdragene dere løser, hva ser vi da?

Line: Nei, vi. Så i utgangspunktet på bilde analyse da så fokuserer vi gjerne på de områdene om kanskje har litt spesielle typer av bilde data, hvor det er spesielt utfordrende å drive med gjenkjenning, og hvor det kanskje er spesielle behov. Så vi jobber blant annet med medisinske data, mammografi bilder. Hvordan kan man utnytte disse teknikkene til å hjelpe hverandre i ideologene, eller i seismiske data kan man hjelpe til å bidra til tolkningen av seismisk og måle ut sektorer de bruker for å finne ut hvor de helst må borre hen i akustiske ekkolodd data som havforskerne bruker til å få oversikt over hvor fiskene går og hva slags fisk som er der.

Fredrik: Så overordna så er det rett og slett å få maskinene til å se, for vi vet jo hvor viktige øynene er til å løse oppgaver og se oss rundt i verden. Så virker som om det er ett grenseløst felt å jobbe med.

Line: Det er veldig spennende og det er veldig mange områder hvor man kan bruke det og hvordan vi ser at det er nyttig og viktig.

Fredrik: Vi har jo hørt at det er data som er den nye oljen og det er tilgangen på data som er avgjørende for at disse systemene skal fungere. For de store aktørene sånn som Facebook og google så hjelper vi jo til hver og en av oss hver eneste dag ved å fore de med data, men på noen av disse områdene dere jobber med så er det vel litt annerledes med hvordan eller hvor rask tilgangen kommer.

Line: Ja det er jo en av utfordringene med disse metodene, at de krever veldig mye data. Så de kan lære mye av data, men de krever også mye data for å lære og for å kunne gjøre det bedre enn kommersielle metoder. Om data da så er det ikke bare rå data, det er ikke bare råolje vi snakker om, men vi trenger den raffinerte oljen til, vi trenger den raffinerte dataen, trenings dataene. Og det vil si at du trenger data hvor du faktisk vet fasiten, du vet hva det inneholder. Og de på lære sammenhengen mellom bildedata og at dette er et bilde og det inneholder data, så begge de to tingene må da vite for å kunne lære.

Fredrik: Så hvis jeg skjønner deg riktig nå da så må man ha den menneskelige kompetansen som gir de den strukturen i lærings dataene.

Line: Det er du helt avhengig av og det er jo klart att det er jo mer utfordrende enn på mere sånne spesielle bilde type data, som i medisin, seismikk og sånne ting i forhold til de vanlige bilder du tar med mobilen din hvor du kanskje tagger innholdet.

Fredrik: Vi har jo også sett at det er analektiske utfordringer knyttet til intelligens og at et ofte brukt eksempel er jol kinas utsøktes bruk av ansikts gjenkjennelse og det å overvåke hvor folk er og hvordan de beveger seg og hva de gjør. Er det også innenfor ditt bilde gjenkjennings området?

Line: Nå jobber jeg akkurat med den typen ting per nå, men det er jo klart at denne metodikken kan jo brukes til det også og det kan brukes og de kan alltids brukes til teknologi til ting som ikke er så bra.

Fredrik: Er det sånne åpenbare utfordringer som dukker opp i din hverdag eller hva er det?

Line: Ikke så mye i min hverdag, men det er jo klart at teknologien i seg selv kan jo brukes til ting du kanskje ikke helst hadde lyst til at det skulle brukes til.

Fredrik: Jeg har tenkt noen ganger på spørsmålet, er det noen områder mennesker ikke kan bli bedre i eller få hjelp av kunstlig intelligens? Fordi man får inntrykk av at det kan bidra overalt og nesten erstatte mennesker på en del områder til ett sånt litt større filosofisk spørsmål, er det noen steder vi ser at dette er noe datamaskinen vil ta over uansett?

Line: Altså maskinene de er veldig gode til å huske, de er veldig gode til å prosessere data, men de er jo dårligere på tenke abstrakt, de er dårlige på å være kreative. og de kan jo bare bruke det du har vist dem på kanskje nye måter og i nye kombinasjoner, men de klarer ikke å komme opp med noe genuint nytt, å være kreative på den måten mennesker kan. Og de klarer heller ikke å abstrahere ting til overordnet begreper slik ett menneske kan.

Fredrik: Og ett eksempel på det vil vel kanskje være veien for kunst eller sånne ting. At de kan se blant tusen bilder og så lage bilde nummer 1001, men de kan ikke lage noe nyere kunst retning.

Line: Nei det blir ikke noe munk av det.

Fredrik: Blir ikke nye munk av å se mange versjoner. Vis det er noe de som hører på skal huske helt til slutt i all dette, det er ett stort tema. Er den noe spesielt lytterne vil sitte igjen med?

Line: Det som jeg ser er i hvert fall at disse metodene nå i løpet av ett 10 år har gitt oss mulighet til å løse problemer vi ikke klarte for en tid tilbake. Samtidig så blir ikke resultatene bedre enn de treningsdataene du har, så det er ett behov for både forstå dataene og forstå metodene, og forstå begrensingene som ligger i der. Samtidig som det er masse muligheter, men det betyr fortsatt behov for veldig mye ekte intelligens.

Fredrik: Ja, det er betryggende. Sånn som er en fin oppsummering av samtalen Line. Så takk for at du tok tiden.

Line: Takk skal du ha

Line Eikvil

Forskningsleder

Norsk Regnesentral

Varighet: 16 min

LYTTE

Ta quiz og få læringsbevis

Du må være medlem for å ta quiz

Ferdig med quiz?

Besvar refleksjonsoppgave

Dette er hva du vil lære:

Din neste LØRNing

Din neste LØRNing

Din neste LØRNing

Dette er LØRN Cases

Digitale tvillinger

Big Data og geometrisk modellering

Slik kan Big Data predikere fremtiden

Utskrift av samtalen: Intelligent og automatisk bildeanalyse

Quiz for Case #C0201