LØRN case C0048 -
LØRN. RESEARCH

Anders Løland

Forsker

Norsk Regnesentral

Ansvarlig bruk av stordata

I denne episoden av #LØRN snakker Inge med assisterende forskningssjef ved Norsk Regnesentral, Anders Løland, om en lun lånerobot og hvordan de bruker maskinlæringsmetoder for å løse problemer. Under samtalen om Big Data forteller for eksempel Anders om teknologien bak ansiktsgjenkjenning, og om hvordan Big Data muliggjør samfunnstjenester som yr.no. Han gir oss også en forskers forfriskende optimisme om utfordringene samfunnet møter med Big Data, og deler sine synspunkter på hvordan vi i Norge klarer å balansere personvern og alle de nye mulighetene.
LØRN case C0048 -
LØRN. RESEARCH

Anders Løland

Forsker

Norsk Regnesentral

Ansvarlig bruk av stordata

I denne episoden av #LØRN snakker Inge med assisterende forskningssjef ved Norsk Regnesentral, Anders Løland, om en lun lånerobot og hvordan de bruker maskinlæringsmetoder for å løse problemer. Under samtalen om Big Data forteller for eksempel Anders om teknologien bak ansiktsgjenkjenning, og om hvordan Big Data muliggjør samfunnstjenester som yr.no. Han gir oss også en forskers forfriskende optimisme om utfordringene samfunnet møter med Big Data, og deler sine synspunkter på hvordan vi i Norge klarer å balansere personvern og alle de nye mulighetene.
Facebook
Twitter
LinkedIn
Email

15 min

Choose your preferred format

Velkommen til Lørn.Tech – en læringsdugnad om teknologi og samfunn med Silvija Seres, Sunniva Rose og venner.

 

IH: Hei og velkommen til Lørn og denne podcasten som handler om Big.Data – eller Stordata! Jeg heter Inge Harkestad og jeg har med meg Anders Løland som er Assisterende forskningssjef i Norsk Regnesentral og co-director i BigInsight som da er et senter for forskningsdrevet innovasjon. Så Velkommen Anders!

AL: Tusen takk.

IH: Du driver jo med mye greier som er high-tech, men på bare folkelig: hva er egentlig Stordata?

AL: Stordata er så mye data at ting blir tungvint. Det går ikke an å trekke en eksakt grense. Det kan være at det som var Storgata for fem år siden ikke er Stordata lenger fordi vi har fått større datamaskiner. Det kan være at det som er stort for deg er lite for meg eller omvendt. Så jeg tenker at når det er så mye data eller så mange ulike formater og typer data – at ting blir kronglete, da begynner det å bli Stordata. Så mye av det vi hører om av eksempler på ting som funker bra i dag er egentlig ikke stordata, det bare en god del data som en helt vanlig datamaskin klarer å håndtere.

IH: Så vi burde nesten omgjort dette til å hete Kronglete Data mer enn Stordata, hehe.

AL: På en måte ja, hehe! Det er en riktige beskrivelse kanskje.

IH: Hva er egentlig greia med Stordata når vi snakket om det? Og hva bør folk vite?

AL: Jeg tenker at med Stordata som vi har hatt noen år nå, og kanskje har vi hatt det enda flere år uten å vite om det, er at det fører med seg store muligheter. Litt ”keiserens nye klær” og noen farer.

IH: ”Keisernes nye klær” sier du. Hva mener du med det?

AL: Jeg mener vel litt det at en i næringslivet av og til finner på litt nye ord på ting som vi har gjort tidligere, men at vi gjør det litt mer nå er litt større eller noe sånt, og Stordata er jo bare mye data og kanskje beslektet med analyse av disse dataene. Og det er jo egentlig god gammaldags dataanalyse av litt store datamengder.

IH: Så det er analyse og litt statistikk og den type ting?

AL: Ja.

IH: Men har det blitt hypet opp og litt oppskrytt? Har det vært mange flinke selgere her kanskje?

AL: Hehe, vel om det er altfor hypet, så hehe – er det vel et problem, men det er vel litt sånn. For 5 år siden skulle alle drive med Big.Data og nå skal alle drive med AI, eller Kunstig Intelligens, også er det litt samme suppa.

IH: Det er interessant å bare høre noen praktiske eksempler på ting som dere da i Norsk Regnesentral og Big Insight. Hva jobber dere med? Hva er liksom den praktiske nytten av Stordata?

AL: Det vi først og fremst er opptatt av er å løse virkelige problemer og utvikle nye metoder; sånn anvendt forskning og grunnforskning. En morsom ting jeg jobber med er det jeg kaller en lun låne robot! Så det som det kanskje bli mer og mer av er at det istedenfor at det sitter en mann eller dame – for det var oftere enn mann - som du kunne ringe til å spørre om du kan få lån, så ja; jeg har en sånn liten sparebank som jeg bruker og når jeg ringer de som alltid er like hyggelig, så snakker vi litt også: ”greit du skal få lån”. Men i fremtiden så er det kanskje sånn at det blir en datamaskin som bestemmer om du skal få lån. Og hva skal den se på? Det vi har sett er at det å mate en sånn datamaskin og det å mate en algorytme med kontobevegelser til mange kunder for så å sammenstille det med hvordan de har klart å nedbetale lånet sitt, så kan vi ganske treffsikkert si at du kommer til å betale ned lånet ditt. Så kan vi ganske treffsikkert si om du kommer til å betale ned lånet ditt og på den måten så kan vi kanskje automatisere innvielsen av lån. Vi kan i hvert fall klare å sile ut de som enkelt kan ses å være grønne kunder; de som er ok.

IH: Ja, for det er jo klart at noen må jo sitte og se på og bestemme om man skal få lån basert på gitte kriterier. Kontobevegelser er vel neppe kanskje noe som har vært brukt før. Det har kanskje vært ting som alder og ulike andre ting?

AL: Ja, alder, hvor du bor kanskje, hvor mye du tjener ikke minst!

IH: For da har du funnet ut av at kontobevegelser gir en veldig god informasjon?

AL: Det gir en veldig god praksis. Og her er det snakk om anonymiserte kontobevegelser, så det er ikke snakk om at du har handla ditt eller datt eller bruker ditt kort i utlandet, her er det snakk om hvor mye penger som går inn og ut av kontoen din hver dag.

IH: Ja, så de ser ikke på hvor jeg har vært?

AL: Nei. Og faktisk ikke heller akkurat hvor mye penger som går ut. Det ses mer på trender og svingninger. Du kan tenkte deg hvis du er litt ute og kjører så er det litt en fallende trend eller kanskje det går veldig opp og ned fordi du må låne litt penger også venner og betale tilbake. Så det er ikke så vanskelig å måtte tenke seg hvordan kontoen din svinger sier mye om hvordan privatøkonomien din er eller kan være.

IH: Så disse nye metodene gir nye måter å finne ut hvem som får lån. Alle blir vel ikke automatisert innvilget av disse lånene tenker jeg. Man kan grovsortere som du sier til grønne kunder.

AL: Ja. Og vi har ikke noe bank så det er ikke opp til oss, men en bank vil vel typisk kanskje måtte automatisere brorparten av kundene, også er det noen få som blir tvilstilfeller som går over til manuell behandling for at ikke den nekter noen lån som burde fått lån da.

IH: Ja. Bra. Har du andre eksempler på ting dere gjør?

AL: Jeg jobber med å jakte på svindlere i dette etterforskningssenteret BigInsight. Det er snakk om forsikringssvindel, hvitvasking og momsunndragelse. Og der er det aktuelt å bruke store datamengder, men samtidig så er det en veldig vanskelig polering for de fleste er jo heldigvis ikke svindlere. Det går mange millioner transasksjoner gjennom en bank hver dag og bare en veldig-veldig liten andel av de er potensielle hvitvasking transaksjoner. Så det er en Stordata-problemstilling, men hvor det er sånn ”nålen i høystakken problematikk”. Da må vi være lure!

IH: Ja, og det er dere!

AL: Vi prøver!

IH: Andre gode eksempler på hva vi får til her i Norge?

AL: Her er det veldig mange som får ting til! Og vi har jo vært tidlig ute med digitalisering. Norge er ikke redd for å ta i bruk ny teknologi. Jeg har lyst å søke fram Yr.no som hver dag prosesserer enorme mengder data. Det er enorme store beregninger. Og de og lager et produkt som er helt fantastisk som gjør at jeg slipper å se på Dagsrevyen hver dag, men kan få være akkurat der jeg bor. Og det videreutvikles hele tiden. Altså, dette er en kjempefin suksess!

IH: Og det er tydeligvis at det er oppdaget andre steder også. Jeg var i Kroatia i fjor også skulle jeg spørre kelneren om hvordan han fant ut av lokalet værmeldingen. Nei, nei; sånn måtte man gå inn på Yr.no!

AL: Ja, ikke sant!

IH: Så den er oppdaget andre steder den også. Men internasjonalt ja. Når vi snakker ut av landet nå, er det noen eksempler?

AL: Egentlig er det jo masse eksempler, men jeg har lyst til å trekke frem ett. Det er noe så enkelt som vanskelig som ansiktsgjenkjenning som nå er litt sånn hyllevare som brukes på mobiltelefonen din eller hva som helst. Men for 20 år siden så var det et skikkelig vanskelig problem. Som vi har jobbet med på Norsk Regnesentral tidligere, og da gikk det mye ut at det ble tatt et bilde en person – kanskje et dårlig bilde fordi digitalkamera var nokså god den gangen - også måtte en prøve å trekke ut egenskaper fra det bildet: hva er avstand mellom øynene dine, mellom øyne og munn, hvor er munnen, og sånne ting. Mens nye metoder som kalles dyp Læring og sånn, de er flinke til å gjøre det her mer automatisk sånn at du slipper sånne manuelle egenskapsuttrekninger i mindre grad. Og det har gitt veldig mye bedre resultater! Sånn at for eksempel Apple bruker det her til å logge inn på de nyeste telefonene sine istedenfor.

IH: Men når du nevner Dyp Læring som en form for maskinlæring i snakk om både når det gjelder Stordata, men også når det gjelder Kunstig Intelligens. Hva er egentlig disse sammenhengene her? Kan du hjelpe meg å sortere litt i hodet hva som er hva her?

AL: I det offentlige det rom så er mitt inntrykk at det her sauses sammen til én stor ting. Men vi må jo begynne med data før vi kan gjøre noe som helst og da begynner vi kanskje med Stordata istede nå da siden er mye data vi klarer å samle inn og sitter på.

IH: Det blir mye kompleks og kronglete data.

AL: Ikke sant. Og så vil vi gjerne bruke de dataene til noe og da er det maskinlæring, statistisk analyse – egentlig to sider av samme sak og kunstig intelligens. Kunstig Intelligens er egentlig også bare et litt større begrep enn maskinlæring og statistisk analyse, men i dag så brukes kunstig intelligens om det vi kanskje ville kalt maskinlæring for fem år siden. Så jeg tenker det er veldig fint å skille mellom data og hvilke modeller og hvordan vi bruker de.

IH: Ja! Di nevnte innledningsvis at det var noen muligheter, det var litt sånn ”Keiserens nye klær også var det noen farer. Hva tenkte du på da?

AL: J,o det er jo mange farer ved anvendelse av disse dataene som personvern osv. Men jeg synes vi kan snakke litt om selve dataene om hva faren de er siden det begynner der for så at kan være så flinke vi bare vil etterpå. En fare er at med Stordata og nye sensorer, billige datamaskiner osv så er det mye lettere å samle inn data. Det er lett å samle inn masse data! Men jo mer data du samler inn jo vanskeligere er det på en måte å kvalitetsikre de dataene.

IH: Nettopp.

AL: Så tidligere så hadde vi kanskje mindre datamengder, men kanskje med høyere kvalitet. Det var noen som faktisk hadde som jobb og samle inn det her og passe på at det ble ordentlig. I dag samler vi inn hva som helst også kanskje vi får bruk for det en vakker dag! Det er litt sånn at vitenskapen også har blitt litt endret. Tidligere så begynte vi med en hypotese. ”Det er i Finnmark det er verst” for eksempel. Så samlet vi inn data i Finnmark og resten av landet og så så vi om det stemte. Men nå er det snudd på hodet. Vi samler masse data først og så prøver vi etterpå og ser om det er noe vi kan bruke dataen til.

IH: Det snakkes jo da om at data er den nye oljen sies det her og der. Det høres jo da ut som at vi må samle inn mest mulig data da.

AL: Jeg synes egentlig ikke det.

IH: Du er ikke helt enig der?

AL: Nei, jeg er ikke det. Da tenker både på datakvalitet og ressursgrunner og også av personvern og sensitivitetsgrunner. Det er ikke noe poeng å datamaksimalisere - altså samle inn mest mulig bare i tilfelle fordi det har en kostnad. Den ene kostnaden er jo den at vi samler inn potensiell sensitiv informasjon eller forskning som skal sendes til smalere kilder og som kan gjøre livet ugreit for oss som enkeltpersoner og som samfunn. Så mitt mantra er at vi bør samle inn de dataene som er mest relevante for det vi tenger de til.

IH: Mhm.

AL: Som selvfølgelig kan gi store datamengder. Men hvis vi samler inn alt mulig rart av data så vil de drukne i støy til slutt. Og da er det mange av de dataene vi samler inn som ikke har noe med det fenomenet vi ønsker å predikere, forutsi eller analysere.

IH: Men så sies det også at man iblant kan oppdage nye sammenhengende og derfor er det interessant å sammenstille ukjente data. Men hva er balansegangen der mellom muligheten? For det er vel ikke alltid man vet hva man skal lete etter.

AL: Nei, så det kan jo selvfølgelig hende at du finner sammenhenger som finner gull som man ikke visste om. Men det kan også være fare for at du finner sammenhenger som er på en måte bare tilsynelatende sammenhenger, men som ikke er reelle sammenhenger. Jo mer data du samler inn, jo større øker sjansen for at du finner litt tilfeldige sammenhenger som ikke er helt relevant for reelle sammenhenger.

IH: Det har man jo sett en del ganger i statistikk. Man har sett rare samsvar som fremvekst av rasisme og oppvekst av snegler. Det er ganske tilfeldig sammenheng!

AL: Ja nettopp!

IH: Her i Norge så har vi noe datagrunnlag, men ute i verden som i USA og andre land som klarer å samle inn veldig store mengder data. Hvordan klarer vi oss i en Big.Data sammenheng? Hva er vi gode på i Norge? Hva kan vi spille på?

AL: Vi er og bør ikke være best på alt mulig av data sånn som Kina gjør, og kanskje litt USA også. Jeg syne vi bør være best på å basere personvern og tillit og å samle inn data. I det lange løp så vil det lønne seg. Det er jeg helt sikker på. Også internasjonalt fordi når amerikanske forbruker er lei av misbruk av data så kan norske bedrifter komme ut i verden og vise at vi får til det samme som amerikanere, men ansvarlig måte.

IH: Ja! Så egentlig eksportere litt den norske modellen med tillit og forsvarlig forsvarlighet?

AL: Ja! Også tenker jeg at vi har en kanskje lengre personverntradisjon enn mange andre land og den burde vi bygge videre på.

IH: Og det lar seg godt kombinere med Big.Data.

AL: Det gjør det. Det er mer enn nok data uansett.

IH: Supert. Vi går nå mot slutten her. Hvis folk vil lære litt mer på egenhånd; har du noen anbefalinger til hvordan de kan få til det?

AL: Ja. Det er selvfølgelig lurt å høre på podcaster, og å gå på konferanser og lese avisen og osv, men jeg vil slå et slag for å lese en god bok! Da har jeg trekt fram en bok her som heter ”Big Data: A Very Short Introduction” på 152 sider. Om det er ”short” kan diskuteres. Men det er også en veldig fin serie med mange andre temaer.

IH: I Big.Data sammenheng er du vel kanskje kjørt med ”bare” 152 sider!

AL: Det er helt riktig!

IH: Det er flott. Du, helt til slutt. Hvis folk skal sitte igjen med én ting fra denne samtalen. Hva synes du det skal være?

AL: Da synes jeg det er dette slagordet jeg begynte med: store muligheter, ”Keiserens nye klær” og noen farer.

IH: Det høres veldig bra ut. Da er det bare å si tusen takk for praten til deg Anders, og takk til deg som har hørt!

 

Du har lyttet til en podcast fra Lørn.Tech - en læringsdugnad om teknologi og samfunn. Følg oss i sosiale medier og på våre nettsider Lørn.tech.

 

Hva gjør dere på jobben?

Vi lager og bruker maskinlæringsmetoder for å løse problemer eller for å finne ut av ting. Noen ganger vil vi hjelpe bedrifter, andre ganger grunnforsker vi.

Hva er greia med big data?

Big data, eller stordata som jeg liker best, inneholder så mye. Det er store muligheter, litt keiserens nye klær og noen farer.

Hvorfor er det spennende?

Vi kan få til ting vi ikke kunne før og hjelpe mange flere enn før. Det som kan gå galt kan få større konsekvenser enn før.

Ditt beste eksempel på big data?

Vi har laget en lun lånerobot. Den kan se forskjell på risikable og trygge kunder fra anonymiserte kontobevegelser.

Dine andre favoritteksempler på big data, internasjonalt og nasjonalt?

Internasjonalt er det ansiktsgjenkjenning som endelig virker, og nasjonalt er det yr.no

Hvordan funker det egentlig?

Stordata + metodiske framskritt + bedre datamaskiner = suksess.

Hva gjør vi unikt godt i Norge av dette?

Vi klarer å balansere personvern og alle de nye mulighetene. Når verden får tenkt seg om, er vi klare med ansvarlig bruk av stordata.

Et kort big data-sitat?

Kunstig intelligens trenger ikke mest mulig data for å fungere godt.

Anders Løland
Forsker
Norsk Regnesentral
CASE ID: C0048
TEMA: AI AND BIG DATA TECHNOLOGY
DATE : 181012
DURATION : 15 min
LITERATURE:
Big Data: A Very Short Introduction
YOU WILL LØRN ABOUT:
Big data Bruk og lagring Nasjonale og internasjonale eksempler
QUOTE
"Kunstig intelligens trenger ikke mest mulig data for å fungere godt."
More Cases in topic of AI AND BIG DATA TECHNOLOGY
#C0045
AI AND BIG DATA TECHNOLOGY
Digitale tvillinger

Michael Link

Forsker

Kongsberg

#C0044
AI AND BIG DATA TECHNOLOGY
Big Data og geometrisk modellering

Heidi Dahl

Forsker

Sintef

#C0043
AI AND BIG DATA TECHNOLOGY
Slik kan Big Data predikere fremtiden

Sverre Kjenne

Leder

BaneNor