education

Education


Round Corner
Department of Computer and Information Science

Oppgaveforslag

Evaluering og verifisering av semantiske data

Mye data gjøres tilgjengelig som semantisk web data - spesielt fra bibliotek, arkiv og museer. Dette er data som er skapt over mange tiår med forskjellige standarder og formater.  Når data legges ut som linked open data, er det gjerne basert på transformasjon til modeller med eksplisitt semantikk. Utfordringen er at store mengder av det som publiseres er av dårlig kvalitet og bare utgjør støy som ikke har noen gjenbruksverdi. 

I denne oppgaven skal studentene se på kvalitetsmetrikker for semantisk data og hvordan konfidens score kan brukes i transformasjoner av store datasamlinger slik at en etterpå kan trekke ut data en med rimelig stor grad av sikkerhet vet har tilstrekkelig kvalitet for publisering som linked open data.
 

I oppgave er det fokus på bibliografiske data fra forskjellige bibliotek og studentene skal bygge videre på et system for regelbasert migrering som finnes fra før.

 

Faglærer

Trond Aalberg Trond Aalberg
Adjunct Associate Professor
213 IT-bygget
735 97952 
 
NTNU logo