LØRN case C0318 -
LØRN. STARTUP

Marit Rødevand

Daglig leder

Mito

Hva er NLP?

I denne episoden av #LØRN snakker Silvija med gründer og daglig leder i Strise (tidligere Mito.ai), Marit Rødevand. Strise bruker maskinlæring til å analysere ustrukturert data på internett. Formålet er innhenting av informasjon om eksempelvis selskaper, produkter og markeder, og dataen kan integreres i CRM og ERP-systemer for å effektivisere salg og kundeprosjektering. Strise og deres løsning har fått internasjonal oppmerksomhet, og Marit ble blant annet intervjuet på Google Next-konferansen i San Fransisco med over 25 000 deltakere. I episoden forteller Marit mer om hvordan de jobber med natural language processing (NLP), samt om både muligheter og kontroverser rundt denne teknologien.
LØRN case C0318 -
LØRN. STARTUP

Marit Rødevand

Daglig leder

Mito

Hva er NLP?

I denne episoden av #LØRN snakker Silvija med gründer og daglig leder i Strise (tidligere Mito.ai), Marit Rødevand. Strise bruker maskinlæring til å analysere ustrukturert data på internett. Formålet er innhenting av informasjon om eksempelvis selskaper, produkter og markeder, og dataen kan integreres i CRM og ERP-systemer for å effektivisere salg og kundeprosjektering. Strise og deres løsning har fått internasjonal oppmerksomhet, og Marit ble blant annet intervjuet på Google Next-konferansen i San Fransisco med over 25 000 deltakere. I episoden forteller Marit mer om hvordan de jobber med natural language processing (NLP), samt om både muligheter og kontroverser rundt denne teknologien.
Facebook
Twitter
LinkedIn
Email

21 min

Choose your preferred format

SS: Hei og velkommen til Lørn. Mitt navn er Silvija Seres og tema i dag er kunstig intelligens, AI. Gjesten min er Marit Rødevand som er grunder og leder av et selskap som heter Mito.ai. Vi har drodla sammen før ved flere anledninger. Jeg husker deg som en student grunder da du bestemte deg for å være med å starte et selskap som heter Rendra som drev med byggteknologi. Så gikk du tilbake til NTNU og var entrepreneur in residence. Så har du startet et kunstig intelligens selskap. Nå har jeg fortalt litt om deg, men har jeg glemt noe viktig?

MR: I denne konteksten høres det veldig oppsummerende og riktig ut.

SS: Jeg vil at du skal fortelle oss om entreprenørskolen. Det var der du var når du starta Rendra og den er kjempekul. Hva gjør man der?

MR: Det er toårig masterprogram. Jeg tok det på mine to siste år som sivilingeniørgraden. Hvor man skal drive med entreprenørskap gjennom å starte en egen bedrift. Da starta jeg Rendra sammen med 4 medstudenter som laget en software til byggebransjen. Selskapet ble solgt til et kanadisk selskap i fjor.

SS: Før du gikk på entreprenørskolen studerte du også på NTNU. Teknisk kybernetikk. Det tror de fleste jenter at de ikke er interessert, men det stemmer ikke.

MR: Når jeg studerte så var det få jenter. Men jeg har lest at det nesten er 40 prosent jente andel på studiet nå.

SS: Hvorfor er teknisk kybernetikk gøy?

MR: Man lærer om autonome systemer og matematisk modellering.

SS: Hva betyr det?

MR: Hvordan man kan beskrive verden, også få en maskin eller et datasystem til å kontrollere og påvirke den. Vi lærte mye om matematikken bak noe som kalles kunstig intelligens, selv om det hadde mye mindre fancy navn som lineær, lytnemerisk optimering og alegra etc.

SS: Lytnemerisk optimering, litt statistikk også har du kunstig intelligens. Folk tror det er kjedelig, men poenget er at det er sånn vi kommer til å påvirke våre sosiale og finansielle systemer, og våre biologisk system som kroppen vår. Da er det like greit å vite hvordan det funker. Hva gjorde dere i Rendra?

MR: Vi laget en løsning man kan bruke til byggeplassen hvor man kunne se store 3D modeller på mobile enheter. Gjøre rapportering og få ut informasjon slik at man bygde mer korrekt og med mindre feil.

SS: Hvorfor var det vanskelig?

MR: Når vi starta så var det evnen til å faktisk rendre 3D modeller på en mobil enhet. Vise de fort nok.

SS: Det skjer en del beregninger før du ser bildet på en mobil?

MR: Ja, utgangspunktet vårt var en sånn teknologi. Vi lette rundt etter hvor vi kunne anvende det og kom i kontakt med de som lagde nye St. Olavs hospital og fant en god match for teknologien.

SS: Så gikk du tilbake til NTNU for å være entrepreneur in residence. Hva gjør man da?

MR: Det var en ettårig jobb hvor man skal skanne gjennom prosjektporteføljen til NTNU og se om man fant et kult forskningsprosjekt som man tenkte det var gøy å starte et selskap på. Det gjorde jeg. Da kom jeg i kontakt med et forskningsprosjekt som jobbet med å trene datamaskiner til å forstå tekst på samme måte som mennesker gjør på tvers av språk. Det å forstå relevant kontekst, semantikk. Mening, som er en av områdene innen kunstig intelligens hvor man har kommet kort fordi det er lett å tro at kunstig intelligens kan ta over i morgen når man ser eksempler på bildegjenkjenning. Men når man fortsatt sliter å forstå forskjellen på ‘apple’ og ‘Apple’, så blir man mer ydmyk over hvor langt vi har kommet på veien til singularitet som mange snakker om og forteller om hele tiden. VI jobber mye med det.

SS: Når det gjelder bildegjenkjenning har man faktisk kommet langt. Der er det ofte detaljer og lettere å se mønstre på et nivå som en datamaskin håndterer bra. Problemet med språk er at det er så mye usagt i alt det som er sagt. Det å forstå det usagte og fargen av det du leser, forstå hva poeten egentlig mente. Du må ha levd litt. Hvordan jobber dere med det?

MR: Utgangspunktet er at vi har laget en stor kunnskaps graf som er en representasjon av hvordan verden ser ut som en datamaskin kan tolke. F.eks at Apple er et selskap, det holder til i USA, CEO Tim Cook, det ble startet av Steve Jobs. At du får streket opp alle slike relasjoner i en stor graf struktur. Figurativt snakket, så man putter man teksten gjennom en graf struktur for å kunne skjønne sammenhenger og hva det handler om. Klare å finne ut av relevans og putte inn innhold sammen, og oppsummere innholdet, klassifisere innhold etc.

SS: Det er det man omhandler om NLP, natural language processing på engelsk.

MR: Man har holdt på med det i all tid, men det er fortsatt utrolig vanskelig fordi en datamaskin har ikke en bevissthet. Den skjønner ikke impone ting som hjernen vår skjønner ved å se på tekst eller høre naturlig språk. Det er mye spennende forskning som skjer der for tiden. Det er et gøy område å være i.

SS: Når Google viste fram eksempelet med timebestilling hos en frisør ble gjort av en datamaskin, men hun hørtes menneskelig ut, så ble folk sjokkert av det. Så har folk trodd at plutselig funker språkprosesseringen fantastisk, men det de ikke vet er at det er en kontrollert demo.

MR: Det er ofte sånn.

SS: Du ville ikke fått like morsom samtale hvis du snakket vilkårlig med et menneske.

MR: Veldig mange imponerende eksempler er ofte svært avgrenset eksperiment. På et snevert område hvor datamaskiner kanskje er gode, men hvis man ser bredere på det så funker det ikke generelt. Det er mye spennende som skjer for tiden innenfor NLP. Google, Microsoft og Research lab open sourcer en del spennende ny teknologi som kom i fjor høst.

SS: Kan du forklare hva som kom i fjor høst? Biblioteket for opplæring.

MR: Det kom en modell som heter Bert-embeddings som er en modell hvor du inputer et ord også får du ut en vektor, en 200 dimensjonal vektor. Som sier mye om ordet, så du får omgjort tekst til tall fordi maskin læringsmodeller skjønner ikke tekst. Du må omgjøre det til et tall for å gjøre noe med det. Da kan du begynne med en del dyp læring på tekst hvor man putter inn mange vektorer inn i et nauralt nettverk, så kan den finne ut av “på vektor plass nr. 193, hvis tallet 0,74 står der, så handler det om finans”. Det er forbi oss mennesker å kunne skjønne det.

SS: VI klarer kanskje 7 parametere.

MR: Datamaskinen kan håndtere det fordi vi kan se på teksten og skjønne hva den handler om. Mens nå har man muligheten til å omgjøre store mengder tekst til tall, og putte det inn i et nauralt nettverk og få til sånne ting.

SS: For det første, når folk hører ting som tensorflow eller bert, så tenker de at det er beyond me. Men hvis de skjønner at det er et bibliotek som hjelper deg og etterhvert bruker mange verktøy for å prosessere tekst eller bilder, så er det ikke så magisk.

MR: Det kommer ikke til å være store fortrinn i metode framover for alt metodene opensourcer. Tensorflow er opensource. Men det er evne til å ta det i bruk og stille et kritisk spørsmål som du ønsker svar på, ha den rette dataen og putte det gjennom, det er der fortrinnet kommer til å være i framtiden. De som evner det. De som sitter på gode spørsmål hvor man har god data og ta det i bruk. Alle verktøyene er der ute. Mange av metodene er de samme som man holdt på med for mange år siden. Det er en oppfatning om at det er kun naurale nettverk som er den beste metoden. Det er ikke en metode som er bedre eller dårligere enn andre. Det handler om hvilken data du har tilgjengelig og hva du ønsker å få ut av den. Selv om tensorflow er open source, så er det ikke trivielt å ta i bruk. Det kreves masse kompetanse for å få det inn i et stort skala IT-system i produksjon som gir verdi.

SS: Jeg tror det kommer til å bli bedre pakket inn. Nettopp av selskaper som dere hvor man kanskje slipper å kunne så mye. Det er greit å vite at sånn funker og så er det dette jeg vil bruke det til som blir det vanskelig spørsmålet

MR: Man trenger ikke å kunne akkurat hvordan de fungere i detalj. Bare skjønne at de er der og vite at man har noe man har lyst til å oppnå. Vite at man har data, så trene i vei.

SS: VIte at det er mulig. Jeg leste en bok som heter ‘prediction engines’ som beskriver de forskjellige store gjennombrudd i AI. Begynner med ting som når deepmind vant over kasparov i sjakk, hva måtte til for å få det til å funke? Når Watson vant over gutta i jeopardy. Da begynte man med de 200 parameterne osv. Hvordan velger hva som er de riktige parameterne for å fange mening med spillet. Det er utrolig mye spennende lek med tall og data. Jeg tror ikke folk skjønner hvor gøy det er, men det gjør dere.

MR: Det er veldig gøy. Man blir ikke helt overbevist om at kunstig intelligens skal ta over verden når man jobber med tekst. Man ser hvor dårlige de er selv om mye spennende skjer. Jeg blir ikke helt konvertert til singularitet eller de som tenker at det skal skje i nær framtid, det gjør man virkelig ikke når man jobber med tekst.

SS: Det er ikke tvil om at det er mange grunner til at AI er spennende, men det er viktige kontroverser. At AI tar over har vi diskutert med noen andre før, men tanken er at det tar over jobbene fordi den er bedre på analyse og data enn oss mennesker. Der har du en interessant reaksjon. Du sa “det har jo allerede tatt over. Vi må bare forstå hvor det har tatt over og hvordan vi får brukt det som et godt verktøy”:

MR: Det er helt usannsynlig, selv om man tenker det er logisk mulig, så er det lett å si hvis det kommer en super AI, så kommer den til å ta over verden. Men det er et ‘hvis så’ argument, det er gyldig, men det kommer ikke til å skje. Maskinene har jo blitt bedre enn oss på mange ting pga data og computational power. De er rundt oss hele tiden og påvirker oss. Vi tror vi er frie som mennesker, men er vi så frie når det er en datamaskin som bestemmer hva vi skal kjøpe, hva vi skal se på internett og hva vi skal se på facebook? De er her kanskje allerede og tar over på en annen måte enn mange tror når det blir sagt at AI skal ta over.

SS: Jeg tror kunsten skjer når du kombinerer all smal AI som er nisje fokuserte på din unike måte og vet hva du vil med dem. Det er mye systemisk samfunnsendring også som du sier når det er mange av dem og brukes på feil måte.

MR: Det er interessant at mantra om at AI kommer til å ta over jobbene. Det er verdt å utforske for hvem er det egentlig en ibone dårlig ting. Det er kanskje ikke det, men samfunnet vi lever i er det dårlig fordi det er ingen annen måte å overleve på enn å ha en jobb. Det har i all tid blitt brukt et argument om at noen er villige til å gjøre en jobb villigere enn du er til å gjøre den selv for at du skal fortsette å jobbe. Nå brukes automasjon på samme måte og skaper litt frykt.

SS: Det blir spennende for det første for det utfordrer oss til å ta et kjærlig og tøft blikk på oss selv. Hva er det mennesker gjør bedre enn maskiner? Det er massevis som bare mennesker kan gjøre uansett hvor smart AI er fordi vi har et annet menneske på andre siden av den jobben. Det andre er det med hva en jobb er verdt? Jeg tror de sosiale jobbene kommer til å bli mye mer verdt for oss i framtiden fordi de analytiske jobbene er så mye bedre på en gratis maskin.

MR: En liten planke ikke tykkere enn det der kan fortelle deg hva du skal kjøpe. Det er utrolig. Jeg leste nylig om fotomnation.

SS: Du har en to spennende statements. Det ene er at AI er enda ikke magi, men fremstilles slik. Det andre er at 40 prosent av AI startups bruker ikke AI. Det viser litt om hvor buzzet opp det er. Si litt om det.

MR: Det er ikke magi enda eller kunstig intelligens. Det er ikke en maskin som har en bevissthet. Det er fortsatt et menneske som har trent den til å bli skikkelig god på en ting. Akkurat hvordan den klarer å bli så god er litt vanskelig å forstå til og med for nettverkene, men det er ikke noe mer enn en statistisk modell.

SS: Det er kanskje sånn vi skal se på det. 40 prosent av AI selskaper bruker ikke AI, hva betyr det? De kaller seg bare AI?

MR: Det var en morsom kommentar i en artikkel som jeg nylig så hvor det var en stor undersøkelse blant europeiske startups. Hvor det viser seg at det er lett å slenge rundt seg med ordet uten at man faktisk har maskinlæring som en kjernekomponent i produktet man lager. Vi lager data fra tekst som en maskinlærings pipeline gjør. Uten en maskinlærings pipeline har ikke vi noe produkt. AI er kjernen i alt vi gjør. Da blir man kjent med hva det kreves å faktisk få opp storskala maskinlærings pipelines. Hvor omfattende det er. Det vanskelige er ikke modellene, det er å ha kontroll på dataen din og at du produksjons setter ting som faktisk blir bedre.

SS: AI kan bli skadet av at alt kalles AI og da blir skuffelsen deretter. Jeg vil høre deg kort på Cicero rapporten som dere har jobbet med.

MR: Vi traff Cicero Consulting på en liten konferanse og stor applaus til de. Fra vi traff dem og til vi hadde en kontrakt gikk det kun noen få uker. Raskeste i corporate Norge noensinne. Da tok vi for oss hele 2018 og analyserte mediebildet for bankbransjen for å finne ut av de store trendene. Så analyserte vi alle jobbannonser bankene har lagt ut for å se hva de ansetter for. Så analyserte vi det toppledere har sagt på kvartalsrapporter en god stund tilbake for å se hva de sier. Da bruker vi innsikten til å se om det er forskjell på hva som skjer i markedet, hva gjør de og hva sier de.

SS: Om kunstig intelligens spesielt?

MR: Det var generelt innenfor tema som bankbransjen er opptatt av.

SS: Fant dere spennende forskjeller?

MR: Ja, uten at jeg har helt kontroll.

SS: Rapporten kan vi finne hos Cicero?

MR: Ja, den er solgt til de store bankene i Norge, så det var gøy.

SS: Hvor skal folk gå for å lære mer?

MR: Youtube er den beste kilden for å lære om kunstig intelligens mener jeg. Det finnes ekstremt mange korte videoer hvor flinke folk forklarer hvordan maskinlæring funker og nauralt nettverk funker, og demystifiserer det. Jeg sendte en link til deg. I tillegg har jeg noen essay som er bra om hvorfor det er lett å si det og det kommer aldri til å skje, men hva man burde tenke på istedenfor. Et om om fotonation, med at AI kommer til å ta over jobbene og brukes mer som et fryktbasert argument overfor en del av arbeidsbefolkningen. I 2013 så protesterte en del fastfood arbeidere i USA. De ville ha 15 dollar i lønn, og en konservativ tenketank tok en side i Wall Street Journal og fortalte om hvis de faktisk får 15 dollar i timen så kommer McDonald’s til å måtte automatisere alt. Det har ikke skjedd, så det brukes som et argument for å skape frykt.

SS: Har du et sitat?

MR: Det er et Winston Churchill sistat som kan passe bra i kunstig intelligens konstekt som er “we shape our buildings, and then the buildings shapes us”. Det er det som skjer nå. Vi skaper masse kunstig intelligens i alle appene vi bruker overalt på internett. Verden er full av sensorer. De kommer ikke til å våkne opp med en bevissthet og drepe oss i morgen, men de påvirker oss fra innsiden ved å få oss til å gjøre ting vi ikke var klar over.

SS: Pluss å predikere oss på en måte som blir en selvoppfyllende profeti. Hvis man skal huske en ting fra samtalen?

MR: Jeg tenker at man må ikke være redd for at singularitet skal skje i den nærmeste framtid og heller ikke være redd for at kunstig intelligens skal komme å ta over jobben din, men heller prøver å sette seg inn i det og hvordan det faktisk kan bidra og gjøre oss bedre som mennesker. Endre de store problemene i verden.

SS: Marit Rødevand, grunder og leder av Nito.ai, tusen takk for at du var her hos Lørn og lærte oss om kunstig intelligens. Takk til dere som lyttet.

Hvem er du, og hvordan ble du interessert i AI?

Jeg ble interessert i AI da jeg begynte på Teknisk kybernetikk på NTNU og fikk lære om autonome systemer.

Hva er det viktigste dere gjør på jobben?

Vi er en startup, så det viktigste er å klare å bevege seg raskere enn big corporates. Når det kommer til AI, er det å klare å komme til det krysningspunktet hvor datakvaliteten er så god at det gir mening å bruke maskiner fremfor mennesker til å løse et forretningsproblem.

Hva fokuserer du på innen AI?

NLP – lærer datamaskiner å forstå tekst like godt som mennesker.

Hvorfor er det så spennende?

NLP er en av de områdene hvor man har kommet kortest innenfor AI. Dette er fordi det er kjempevanskelig for datamaskiner å forstå menneskelig språk.

Hva synes du er de mest interessante kontroversene?

1) Mange snakker om at AI kommer til å ta over, men har den ikke på en måte allerede gjort det? Alle signaler som styrer ditt digitale liv er laget av algoritmer: hva du får på Facebook, Instagram, nyheter, reklame osv. Det er ikke sikkert at det er killer robots som tar over, men at kunstig intelligens manipulerer våre egne hjerner og dermed tar over. 2) «AI kommer til å ta over jobbene våre». Forhåpentligvis kan maskiner automatisere kjedelige menneskelige jobber, men dette trenger ikke å være noen ulempe. Men det er ikke så bra når vi har et system som er basert på at alle må jobbe 8–16 for å kunne overleve. I tillegg finnes det flere eksempler på at argumentet «AI kommer til å ta over jobbene» blir brukt til å presse ytterligere på lønn og arbeidstakerrettigheter for lavtlønnede arbeidere i manuelle industrier. 3) De flinkeste innen AI jobber i kommersielle bedrifter, og hvordan vil de påvirke framtiden til fagfeltet? Vil alt fortsette å være open sourced? 4) AI er ikke magi, selv om det framstilles slik i dag. Det er fortsatt deterministisk. 5) 40 % av AI startups bruker ikke AI.

Dine egne relevante prosjekter siste året?

Cicero rapport: brukt kunstig intelligens til å undersøke hvor gode banker er på kunstig intelligens.

Har du andre gode eksempler på AI internasjonalt og nasjonalt?

Bert embeddings – open sourced word-embeddings, som for eksempel Google Research Lab open-sourced i 2018.

Marit Rødevand
Daglig leder
Mito
CASE ID: C0318
TEMA: AI AND BIG DATA TECHNOLOGY
DATE : 190322
DURATION : 21 min
LITERATURE:

YouTube: How Machines Learn YouTube: Neurale nettverk Lesestoff: Bør du egentlig være bekymret for at robotene tar over jobben din? Lesestoff: Skalering av AI-startups

YOU WILL LØRN ABOUT:

NLP (Natural language processing)AI (Artificial Intelligence)

QUOTE
"NLP er en av de områdene hvor man har kommet kortest innenfor AI, det er kjempevanskelig for datamaskiner å forstå menneskelig språk."
More Cases in topic of AI AND BIG DATA TECHNOLOGY
#C0045
AI AND BIG DATA TECHNOLOGY
Digitale tvillinger

Michael Link

Forsker

Kongsberg

#C0044
AI AND BIG DATA TECHNOLOGY
Big Data og geometrisk modellering

Heidi Dahl

Forsker

Sintef

#C0043
AI AND BIG DATA TECHNOLOGY
Slik kan Big Data predikere fremtiden

Sverre Kjenne

Leder

BaneNor