education

Education


Round Corner
Department of Computer and Information Science

Oppgaveforslag

Fra hendelsesdata til aggregert analyseinput

En av de mer tidkrevende oppgavene vi møter på når vi skal lage prediktive modeller er å finne en optimal aggregering av data på hendelsesnivå (klikk i nettbank, transaksjon på konto etc.). For at slike data skal kunne benyttes i tradisjonelle prediktive analyser, må de aggregeres for hver kunde for å kunne fungere som en forklaringsvariabel. Et eksempel på et slikt utfall vi ønsker å predikere kan være kundeavgang, mislighold eller produktkjøp.


For eksempel vil data fra nettbanken være i form av en linje per klikk kunden har gjort. Dette kan aggregeres per sesjon\innlogging, eller per dag, som igjen kan aggregeres til et gjennomsnitt innlogginger per dag, et gjennomsnitt av antall klikk per innlogging per dag, eller hver uke, eller siste måned osv.

Dette kan aggregeres på svært mange ulike måter, noe som krever mye manuelt arbeid, og som ikke garanterer at man finner den beste måten å aggregere data på for å sikre best mulig forklaringskraft.

Hvordan kan vi effektivisere denne prosessen? Kan man benytte en brute-force algoritme for å kverne gjennom ulike aggregeringsmåter som sjekker dette opp mot utfallet man ønsker å predikere? Kan en slik metode gi innspill på om man bør se på om beste aggregering er


• antall klikk eller antall innlogginger?
• gjennomsnitt, trimmet gjennomsnitt, median eller sum?
• siste 3 dager, 30 dager eller siste kalendermåned?

Eller er det helt andre metoder som bør benyttes? Er det etablert en best practice for denne utfordringen?

SpareBank 1 SMN er et av regionens ledende finanskonsern. Markedsleder i privat- og bedriftsmarkedet, og lokalisert på 42 steder i regionens kommuner med i alt 49 kontor. Hovedkontoret ligger i Trondheim. Konsernet sysselsetter ca 1200 årsverk og omfatter også datterselskapene SpareBank 1 Finans Midt-Norge, EiendomsMegler 1 Midt-Norge, Allegro Finans og SpareBank 1 Regnskapshuset SMN. SpareBank 1 SMN er største aksjonær med eierandel på 33 prosent i BN Bank.

 

Faglærer

Jon Atle Gulla Jon Atle Gulla
Professor
114 IT-bygget
735 91847 
 
NTNU logo