Avanceret data mining

2024/2025

Modulets indhold, forløb og pædagogik

FORMÅL
Formålet med projektmodulet er, at studerende får viden, færdigheder og kompetencer i forhold til valg og brug af avancerede data mining teknikker i forhold til specifikke applikationsscenarier med det formål at udtrække indsigt fra stor skala, heterogen, kompleks og ustrukturerede data

BEGRUNDELSE   
Datamining henviser til processen med at analysere store datasæt (big data) for at udtrække eller opdage mønstre, der er nyttige i sammenhænge af et bestemt applikationsscenarier. Data mining kan gøre brug af statistisk læring og statistiske metoder generelt. Anvendelser af data mining spænder over domæner som detailhandel, underholdning, medier, web, fremstilling og IoT. F.eks. Kan købsdata, der indsamles i detailhandelen, udvindes for at forstå kundens indkøbsmønstre, der kan bruges til reklame

Læringsmål

Viden

  • demonstrere viden om funktionen og relevante egenskaber ved hoveddataminingsteknikker, herunder teknikker, der er målrettet mod ustrukturerede data og semistrukturerede data

  • demonstrere viden om anvendelsen af ​​dataminingsteknikker i forhold til forskellige typer data og use cases

  • demonstrer viden om big datateknologier og deres indvirkning på skalerbarhed

  • demonstrere kendskab til de metoder og teknikker, der kræves for at måle og validere kvaliteten og pålideligheden af ​​resultaterne fra de forskellige datadriftsteknikker

Færdigheder

  • finde og forbehandle datasæt for at anvende dataminingsteknikker til at løse et specifikt dataanalyseproblem

  • vælge og anvende passende data mining teknikker til at udtrække relevant indsigt fra datasæt inden for et givet applikationsscenarie

  • kombinere forskellige data mining teknikker på nye måder at løse et realistisk applikationsscenarie

  • foretage en systematisk evaluering af dataminingsteknikker

  • forstå og udnytte Big Data -teknologier og metoder til at anvende data mining -tilgange til store datasæt

Kompetencer

  • identificer mulige alternative løsninger, der anvender relevante data miningsteknikker til et givet applikationsscenarie, og argumenter for deres mulige fordele og ulemper

  • reflektere over de anvendte løsninger og metoder

Undervisningsform

Projektarbejde

Omfang og forventet arbejdsindsats

Det forventes at den studerende bruger 30 timer per ECTS, hvilket for denne aktivitet betyder 450 timer.

Eksamen

Prøver

Prøvens navnAvanceret data mining
Prøveform
Mundtlig pba. projekt
ECTS15
Bedømmelsesform7-trins-skala
CensurEkstern prøve
VurderingskriterierVurderingskriterierne er angivet i Universitetets eksamensordning

Yderligere informationer

Kontakt: Studienævn for datalogi via cs-sn@cs.aau.dk eller 9940 8854

 

Fakta om modulet

Engelsk titelAdvanced Data Mining
ModulkodeDSNDVB421
ModultypeProjekt
Varighed1 semester
SemesterForår
ECTS15
UndervisningssprogDansk og engelsk
UndervisningsstedCampus Aalborg
Modulansvarlig

Organisation

UddannelsesejerBachelor (BSc) i datavidenskab og machine learning
StudienævnStudienævn for Datalogi
InstitutInstitut for Datalogi
FakultetDet Teknisk Fakultet for IT og Design