LØRN Case #C0114
Kan AI erstatte Google?
I denne episoden av #LØRN snakker Silvija med CEO i Keenious, Frode Opdahl. Frode fattet interesse for maskinlæring og natural language processing (NLP) under studiene og bestemte seg senere for å starte opp Keenious for å gjøre det enklere å jobbe med all den informasjonen som finnes tilgjengelig på nettet. I Keenious jobber de innen et felt som ikke har utviklet seg mye på flere tiår, og de har de kommet opp med en løsning for automatiske nettsøk basert på kunstig intelligens. Med dette håper Frode å revolusjonere måten man jobber på innen undervisning. «Hvis du bestemmer deg for å printe ut hele det engelske Wikipedia så ender du opp med 7500 bøker på 700 sider hver» forteller Frode i episoden.

Frode Opdahl

CEO

Keenious

"Det å skrive og formidle kunnskap er kanskje det som er den viktigste drivkraften for utvikling av framtiden. Hvis vi kan gjøre det noen prosent bedre og mer effektiv, så kan vi ha en stor effekt på framtiden."

Varighet: 15 min

LYTTE

Tema: AI- og datadrevne plattformer
Organisasjon: Keenious
Perspektiv: Gründerskap
Dato: 181026
Sted: TROMS OG FINNMARK
Vert: Silvija Seres

Dette er hva du vil lære:


MaskinlæringAIInternettNLP

Del denne Casen

Utskrift av samtalen: Kan AI erstatte Google?

Velkommen til Lørn.Tech – en læringsdugnad om teknologi og samfunn med Silvija Seres, Sunniva Rose og venner.

 

Silvija Seres: Hei, og velkommen til Lørn.Tech. Jeg Silvija Seres og i dag skal vi snakke om kunstig intelligens, eller artificial intelligence, eller AI. Jeg er i Tromsø og min gjest er Frode Opdahl som er daglig leder i et selskap som heter Keenious. Velkommen Frode.

 

Frode Opdahl: Tusen takk.

 

Silvija: Han ser veldig ung ut. Nesten nybakt voksen. Det er ikke lenge siden han holdt på med masteroppgaven det kom et fantastisk selskap ut av.  Så Frode, kan ikke du fortelle oss litt om hvem du er og hva du gjør?

 

Frode: Jo. Så, jeg ble ferdig utdannet sivilingeniør innen informatikk fra UiT i fjor.

 

Silvija: Univeristet i Tromsø?

 

Frode: Ja, helt riktig. Rett etter det dro jeg på Gründerskolen gjennom Universet i Oslo. Der jobbet jeg som intern i et startup i Silicon Valley. Der ble jeg bitt av basillen og av gründerskap og sånt. Jeg hadde jo jobbet med et litt mer innovativt produkt på masteroppgaven som jeg så det var mulig å faktisk lage noe ut av. Så når jeg kom tilbake fra Silikon Valley til Norge i fjor høst så bestemte jeg meg at jeg skulle prøve å satse 100% på det her jeg hadde laget og se om jeg klarte å få til et produkt utover som folk faktisk hadde lyst til å bruke. Så produktet er egentlig et verktøy for studenter og forskere som skal hjelpe deg med å finne forskningsartikler og relevante artikler uten at dem egentlig trenger å gjøre noen søk selv. Systemet fungerer med at det leser teksten din automatisk i mens du sitter å skrive på for eksempel en oppgave, noen notater eller noe sånt, så finner den relevante forskingsartikler automatisk live på under ett sekund som vil være relevant for akkurat det du sitter å skriver om.

 

Silvija: Hvordan gjøres dette?

 

Frode: Ja, så vi bygger på to datasett nå. Vi har tatt et stort datasett med offentlig tilgjengelige forskningsartikler på engelsk og der har vi nå 17 millioner forskningsartikler som vi har analysert. Samt at vi har tatt hele engelske Wikipedia. Grunnen til det er jo at dette er datasett som er enkelt tilgjengelig som man bare enkelt kan laste ned. Vi er bare to personer og det er bare jeg som programmerer, så er det enkelt å laste det ned sånn at vi ikke må være i kontakt med masse selskaper for å få deres interne databaser som er veldig uheldig lukket nå innenfor forskningsmiljøet. Skulle ønske det generelt var mer tilgjengelig der. Men vi bruker det og analyserer dette med algoritmer som jeg har laget selv og bygger da en forståelse for hvert eneste dokument. Så når du sitter å skriver på teksten din, så analyserer vi teksten din også, og så ser vi etter sammenhenger som vi sjekker opp med databasen våres og ser likhetene mellom hva som blir skrevet og datasettet vi har. Direkte så anbefaler vi da flere hundre dokumenter live på under et sekund. Så dette kan du gjøre imens du sitter å skriver også vil den bare kontinuerlig oppdatere seg. Det vil også fokusere mer spesifikt på deler av teksten sånn at du kan fokusere på det som står der.

 

Silvija: Lærer den om deg underveis sånn at den skjønner å kunne anbefale ting du ikke ville ha funnet ved å google veldig bra?

 

Frode: Akkurat nå så er det ingen form for det.  Så det er stateless som det heter; vi ser ikke på brukeren og hva den har lest tidligere osv.

 

Silvija: Så dere bygger ikke en modell av selve brukeren?

 

Frode: Nei. Vi ser jo at det kan være veldig brukbart. Det er jo noe Google og alle de gjør. Ser på hva du har søkt på tidligere. Men vi har fokusert veldig på å bare få den her algoritmen veldig ren og se at den fungerer – for hvis den fungerer, så kan du legge til alle de her metodene. Så maskinlearning’en kommer av analysen av dokumentene. Den går gjennom hele datasett og ser dem ved hjelp av machinelearning. Så den klarer å differensiere.

 

Silvija: Hva betyr det? Hjelp lytterne våres med å forstå hvordan man analyserer noe med hjelp av machinelearning; hva skjer da? 

 

Frode: Ja. Så machinelearning innebære jo egentlig ordet maskinlæring. Måte den lærer på i våres modell da, er litt annerledes enn det nevrale nettverket som mange snakker om for vi bruker ikke det nevrale nettverket akkurat nå. Vi bruker en litt mer spesifikk versjon som går mer på tekst. Det modellen gjør er å finne et tema utifra tekst så du kan differansiere. 

 

Silvija: Det du sier forskjellen er hvordan du modellerer universet ditt?

 

Frode: Mhm.

 

Silvija: Og det gjør du, hva sa du, med å finne modeller i teksten?

 

Frode: Ja. Så det er mange måter å gjøre machinelearning på. Vi har valgt en måte som kanskje er litt enklere å eskalere. Vi klassifiserer ingenting. Det vi gjør er at vi bruker den her modellen – de ser på masse dokumenter, så du mater rett og slett dokumenter inn til en algoritme, én og én og én osv etter hverandre, og så prøver den å se etter temaer. Så si at den finner x-antall temaer, så si at hvis du har et stort datasett, så kan psykologi være et tema, eller underdeler ikke sant, ingeniørmessig kan være et tema.

 

Silvija: Så den klassifiserer?

 

Frode: Ja, så den lærer. Den lærer opp masse forskjellige temaer. Og det er bare å se på mange dokumenter, også ser den for eksempel: ”åh, de 2 ordene går ofte sammen”. Og da går den ikke ofte med ”det her ordet”. Og da kan den bygge en sånn her: ”ok, det snakkes ofte om bil og hjul og sånt”- som går sammen, og da forstår den at hvis ordene brukes ofte så blir det det og det temaet. Og jo flere dokumenter  du har jo mer kan den forstå. Du gir den jo bare mer data. Og der er vi veldig heldige med at vi har Wikipedia og at forskningsartiklene er tilgjengelig og veldig mye data. Så vi kan lære opp ganske gode modeller på den her måten. 

 

Silvija: Jeg har lyst å du skal kommentere litt på hvordan dette her gikk seg til, for du var gjennom et veldig bra program hos Norges forskningsråd. Kan du si litt om det?

 

Frode: Det er en veldig fin ordning som er laget for studentene – det som kommer ut av studentarbeider på masternivå faktisk skal få mulighet til å bli noe i virkelighet. Det blir ikke bare liggende i en liten skuff for den studenten. Så det er en ordning hvis du har vært student og har jobbet med en master og er nettopp ferdig studert med muligheten til å lage noe. Da kan du søke om 1 million fra  forskningsrådet. Vi sendte inn en søknad i januar eller i februar i år. Så kom vi videre til pitching, og så dro vi ned og pitchet nedpå Forskningsrådet, og dem likte det vi hadde. Da fikk vi 1 million til å jobbe med dette produktet i et år. Det er jo veldig greit for oss siden vi da kan jobbe fulltid. 

 

Silvija: Jeg kan innrømme at jeg har vært dommer i noen av disse her, og det er noe av det mest inspirerende jeg har gjort i løpet av året. Det har noe med at du finner utrolig relevante unge gründere som kan teknologi og kan også tenke kommersialisering av teknologi. Det er veldig mange gründere for å være ærlig som driver med livsstils gründerskap, ikke sant. Man skal lage en liten enkel app og tjene masse penger på det. Mens dette her er det motsatte, og her spiller man på noen av de ekstreme styrkene vi har innenfor teknologiutdanning blant annet i dette landet.  Får du brukt nærheten til universitetet til noe nå når du jobber med selskapet?

 

Frode: Ja. Det er en veldig stor del av det vi jobber med siden vi lager produkter direkte for studenter og forskere. Det som er veldig greit med at vi sitter veldig nært universitetet, så kan jo vi bare hoppe rett opp og spørre om tilbakemelding på det vi jobber med, hva er problemene deres, hvordan kan vi løse det. Og siden det er så kompakt så kan vi snakke med veldig mange avdelinger fort. Det er ikke spredd utover store områder der vi må reise mye. Dem er jo rett oppi bakken for oss. Og det er veldig flinke folk så vi får veldig gode tilbakemeldinger. Samt har fokuset på informatikk vært på store systemer og skalerbare systemer, og det har jeg fått veldig mye ut av sånn at systemet vårt skal støtte veldig mange  brukere. Og det har jeg fått mye av fra det universitetet her. 

 

Silvija: Jeg har lyst å gå litt inn på tematikken om utdanning. Jeg prøvde å klassifisere deg og ditt selskap og teknologi under Ed.Tech, men så pushet du litt tilbake og sa det at du ikke visste hva det var engang. At det er alt og ingenting; teknologi for utdanning. Og så spurte jeg deg om et favoritt eksempel, og da svarer du med YouTube. Det tenkte jeg var ganske kult. Vi tenker ikke lenger på hvor vanvittig viktig sånne ting som Facebook og YouTube er for oss. Nå kritiserer vi dem bare, ikke sant. Men så nevner du noe som: ”en universitetsgrad er ikke alt man kan se på lengre”. Og det er jeg veldig opptatt av. Jeg tror at måten vi utvikler høyere utdanning på er for treig og alt for forsiktig og konservativ, og den kan gjøre seg selv irrelevant hvis ikke vi finner en mer fleksibel måte å utdanne både unge og voksne folk på. Men hva gjør man? Hvor går man da for å lære det fremtiden krever?

 

Frode: Så mine tanker rundt dette her har jeg lært veldig mye fra YouTube, podcast, blogger og sånt, og alt som er tilgjengelig på nettet. Men du må oppsøke den informasjonen. Det hjelper å ha et problem, eller det hjelper å ha et prosjekt som man skal jobbe med. ”Jeg har lyst til å finne ut av dette”, eller: ”jeg har lyst til å jobbe med dette”. Da blir du på en måte utsatt for å måtte grave deg mot alle disse kildene som kan hjelpe deg. Det er ingen som sier det til deg. Det er jo det som er litt vanskelig med at alt er tilgjengelig også: ”det her må du kunne og dette må du gjøre”. Det er universitet veldig flink til. I hvert fall når du kommer direkte ut fra videregående så har du jo ikke kunnskapen om hva du har lyst til å gå inn på. Men når du begynner å få litt forståelse, så er internett med YouTube og alle de her veldig bra fordi du kan oppdage hva som er løsningen for deg til å lære, og så kan du sette deg ned og fokusere på det helt alene. Og da kan du på en måte bygge mot din egen grad! Det er mye av den teknologien jeg bruker som ikke blir eller har blitt lært bort på universitetet her, eller i resten av Norge – jeg vet ikke. Men jeg har bare funnet forskjellige plasser og på en måte bare bygd opp fra YouTube som en stor kilde. Det er masse gode forelesninger der! Det er jo et problem når det kommer til rekruttering. Det er jo mye lettere å se på en grad: ”ja, da vet vi at du kan det og det”. Men nå som det er så mye lettere å få tak i kunnskap overalt så er det ikke så lett å se hva du kan for noe. Så da tror jeg man kanskje må finne på nye måter å måle kunnskapen og måle hva folk kan. Ikke bare se på graden men mer på tester og lignende. Altså tester som programmering og…

 

Silvija: Meningsfulle tester?

 

Frode: Ja, som hjemmelekser der du får et prosjektarbeid på 2-3 dager, og så får du løst problemet på akkurat den måten du vil, og så går de over og ser på hvordan du gjorde det. Du blir ikke stengt inne i dems: ”kan du dette her, kan du dette her” osv, ikke sant. 

 

Silvija: Vi nærmer oss slutten. Jeg spurte deg om et faktum som du synes ville vært morsomt å dele og da nevnte du dette med størrelsen på Wikipedia. Husker du det?

 

Frode: Ja. Jeg kom over det når det var en person som hadde en kunstutstilling. Han hadde printet ut hele det engelske Wikipedia i bøker. Det han endte opp med da var jo 7500 bøker på 700 sider hver. Så gikk jeg for å regne ut: ”hva hvis jeg har lyst til å printe ut all den her kunnskapen; hva koster det?”. 1 million kroner ca. Og det var bare kun for materialet. 

 

Silvija: Og ganske mye trær!

 

Frode: Ja, og trær og alt. Og tenk deg, du trenge en veldig enkel internettforbindelse og et veldig enkelt device, som er billig nå for veldig mange, og så får du direkte tilgang til den her informasjonen! Tenk deg for hundre år siden da så hadde det ikke vært en tanke om at man kunne gjort det her.

 

Silvija: Men du skjønner; du er litt poster-boy for hva vi prøver å gjøre her i Lørn. For det er helt riktig det du sier om at masse informasjon finnes tilgjengelig der ute, men som du sier, du må ha et ønske om å lære og du må kunne styre deg selv litt for et godt selvlaget og selvvalgt pensum!  Jeg har inntrykk av at det er noe som veldig mange unge gjør intuitiv. Spørsmålet er da hvordan vi får med oss alle de voksne også.

 

Frode: Ja. Det er vanskelig. Jeg tror man må trekke fram de som klarer å gjøre det. Sånn at folk ser. Fordi hvis du kommer fra en litt eldre generasjon enn min da, så har du kanskje vært vant til å følge det her løpet, og så har alle gjort det her løpet fordi det ikke var noe alternativ. Du visste ikke at det var en tanke, ikke sant. Men nå har det nylig kommet fram da, relativt sett, den her måten at du kan tilegne deg masse kunnskap og ferdigheter utenfor det som er vanlig. Og kanskje hvis man klarer å trekke de her fram med å ta fram at de har kommet fra den delen og den delen, så kan folk forstå…  

 

Silvija: Gode eksempler.

 

Frode: Ja, gode eksempler. Kanskje folk da tenker mer at det ikke bare er kun dét og dét som er mulig. Da kan dem kanskje tenke selv at: ”ja, det her kan jeg også gjøre”, forhåpentligvis. 

 

Silvija: Du, tusen takk Frode! Lykke til med Keenious. Det blir spennende å se om dere revolusjonerer - i hvert fall forskernes hverdag. Takk for at du kom hit og lærte oss om kunstig intelligens. 

 

Frode: Takk for at jeg fikk være her! 

 

Silvija: Og takk til dere som lyttet. 

 

Du har lyttet til en podcast fra Lørn.Tech - en læringsdugnad om teknologi og samfunn. Følg oss i sosiale medier og på våre nettsider Lørn.tech.