education

Education


Round Corner
Department of Computer and Information Science

Oppgaveforslag

Data miningsfunksjon for AsterixDB

I denne oppgaven skal du utvikle en funksjon (User Defined Function (UDF)) for å lese inn datastrøm inn til et Big Data-håndteringssytem kalt AsterixDB (se https://asterixdb.apache.org). Ideen er at en slik funskjon skal kunne fungere som et verktøy for feks. klassifisering av datastrøm (som feks. Tweets) før dataen blir lagret og håndtert videre i et bigdatasystem for analyse e.l.

Oppgaven forutsetter at du har evnen til å sette deg inn i et nytt system og har god programmeringsevne. Det er også en forutsetning at du har forståelse for data mining (feks. gjennom å ha tatt faget TDT4300 Datagruvedrift eller tilsvarende).

Dersom prosjektet blir gjennomført som en masteroppgave vil det være en forventing om at metoden kan sammenliknes med andre metoder som feks. Spark med hensyn til hastiget og skalerbarhet.

Faglærer

Heri Ramampiaro Heri Ramampiaro
Associate Professor
205 IT-bygget
735 91459 
 
NTNU logo