FORMÅL
Formålet med projektmodulet er, at studerende får viden,
færdigheder og kompetencer i forhold til valg og brug af avancerede
data mining teknikker i forhold til specifikke
applikationsscenarier med det formål at udtrække indsigt fra stor
skala, heterogen, kompleks og ustrukturerede data
BEGRUNDELSE
Datamining henviser til processen med at analysere store datasæt
(big data) for at udtrække eller opdage mønstre, der er nyttige i
sammenhænge af et bestemt applikationsscenarier. Data mining kan
gøre brug af statistisk læring og statistiske metoder generelt.
Anvendelser af data mining spænder over domæner som detailhandel,
underholdning, medier, web, fremstilling og IoT. F.eks. Kan
købsdata, der indsamles i detailhandelen, udvindes for at forstå
kundens indkøbsmønstre, der kan bruges til reklame
demonstrere viden om funktionen og relevante egenskaber ved hoveddataminingsteknikker, herunder teknikker, der er målrettet mod ustrukturerede data og semistrukturerede data
demonstrere viden om anvendelsen af dataminingsteknikker i forhold til forskellige typer data og use cases
demonstrer viden om big datateknologier og deres indvirkning på skalerbarhed
demonstrere kendskab til de metoder og teknikker, der kræves for at måle og validere kvaliteten og pålideligheden af resultaterne fra de forskellige datadriftsteknikker
finde og forbehandle datasæt for at anvende dataminingsteknikker til at løse et specifikt dataanalyseproblem
vælge og anvende passende data mining teknikker til at udtrække relevant indsigt fra datasæt inden for et givet applikationsscenarie
kombinere forskellige data mining teknikker på nye måder at løse et realistisk applikationsscenarie
foretage en systematisk evaluering af dataminingsteknikker
forstå og udnytte Big Data -teknologier og metoder til at anvende data mining -tilgange til store datasæt
identificer mulige alternative løsninger, der anvender relevante data miningsteknikker til et givet applikationsscenarie, og argumenter for deres mulige fordele og ulemper
reflektere over de anvendte løsninger og metoder
Projektarbejde
Det forventes at den studerende bruger 30 timer per ECTS, hvilket for denne aktivitet betyder 450 timer.
Prøvens navn | Avanceret data mining |
Prøveform | Mundtlig pba. projekt |
ECTS | 15 |
Bedømmelsesform | 7-trins-skala |
Censur | Ekstern prøve |
Vurderingskriterier | Vurderingskriterierne er angivet i Universitetets eksamensordning |
Kontakt: Studienævn for datalogi via cs-sn@cs.aau.dk eller 9940 8854
Engelsk titel | Advanced Data Mining |
Modulkode | DSNDVB421 |
Modultype | Projekt |
Varighed | 1 semester |
Semester | Forår
|
ECTS | 15 |
Undervisningssprog | Dansk og engelsk |
Undervisningssted | Campus Aalborg |
Modulansvarlig |
Uddannelsesejer | Bachelor (BSc) i datavidenskab og machine learning |
Studienævn | Studienævn for Datalogi |
Institut | Institut for Datalogi |
Fakultet | Det Teknisk Fakultet for IT og Design |