Datamodeller og analyseteknikker

2022/2023

Modulets indhold, forløb og pædagogik

Den studerende opnår viden om og praktisk erfaring med anvendelser af data mining og machine learning metoder og værktøjer anvendt på både ustrukturerede og strukturerede Big Data-eksempler. Den studerende får et dybt kendskab til skalerbare teknikker og værktøjer og bliver i stand til at forberede data (vha. præprocessering) og benytte dem til både at udtrække indsigt fra og lave forudsigelser (predictions) for komplekse data.

Enkeltfaget dækker grundlæggende data mining og machine learning

Læringsmål

Viden

Gennem enkeltfaget skal den studerende opnå viden om teorier, metoder, teknikker og værktøjer inden for følgende områder:

Praktiske metoder til præprocessering af tekst, f.eks. struktureret og ustruktureret data, f.eks tekst og netværksdata.

Fundamentale data mining og machine learning metoder, herunder

  • Prædiktive metoder såsom regression og klassifikation; finde f.eks. meninger (sentiments) om produkter eller services baseret på reviewtekster, likes, klik, etc.
  • Deskriptive metoder såsom gruppering af dataobjekter (clustering), finde f.eks. kunde-/brugergrupper  i sociale netværk

Regulariseringsmetoder til behandling af højdimensionelle data.

Der lægges vægt på metoder, der er skalerbare til Big Data, så der sammenhæng med det efterfølgende enkeltfag.

Den studerende skal ydermere kunne forholde sig kritisk og refleksivt i forhold til ovenstående emner; specielt er det vigtigt at den studerende opnår færdighed i at udvælge den rigtige type af machine learning metode til brug i en given kontekst.

Færdigheder

Den studerende skal kunne anvende teorier, metoder og modeller fra ovennævnte områder til at identificere, analysere, vurdere og komme med forslag til løsning af konkrete data-funderede problemstillinger. Den studerende skal kunne argumentere for relevansen af de valgte teorier, metoder og modeller samt for det udarbejdede løsningsforslag. Desuden skal den studerende kunne reflektere over betydningen for den sammenhæng løsningen indgår i. Konkret forventes det at den studerende efter gennemførelse af fagpakken er i stand til:

  • At forstå og anvende en række data mining og machine learning metoder til vidensopdagelse i både ustrukturerede og strukturerede data-eksempler.
  • At forstå og sammenligne algoritmerne bag forskellige data mining og machine learning metoder
  • At matche og eventuelt kombinere metoder til et fornuftigt brug i en given praktisk kontekst

Kompetencer

  • At træffe informerede valg omkring anvendelse af avancerede data mining og machine learning teknikker.
  • At parameterisere avancerede data mining og machine learning algoritmer til et givet data materiale, inkl. ustruktureret tekst og behandling af højdimensionelle data.
  • At designe og udvikle en komplet løsning for en kompleks, realistisk problemstilling.
  • At formidle og diskutere løsningerne med fagfæller og ikke-specialister.

Undervisningsform

Undervisningen bestå af tre seminardage med kombinerede forelæsninger og øvelsessessioner. Mellem seminarerne læser den studerende faglitteratur og laver øvelser/opgaver. Desuden udarbejder de studerende i grupper et miniprojekt til en realistisk problemstilling.

Eksamen

Prøver

Prøvens navnDatamodeller og analyseteknikker
Prøveform
Mundtlig pba. projekt
Ekstern mundtlig evaluering med udgangspunkt i projektrapporten for miniprojektet.
ECTS5
Bedømmelsesform7-trins-skala
CensurEkstern prøve
VurderingskriterierVurderingskriterierne er angivet i Universitetets eksamensordning

Yderligere informationer

Tjek detaljer på https://www.master-it-vest.dk/fagpakker/softwarekonstruktion.html

Fakta om modulet

Engelsk titelData Models and Analysis Techniques
ModulkodeDSNITEV11
ModultypeKursus
SemesterTjek detaljer på https://www.master-it-vest.dk/fagpakker/softwarekonstruktion.html
ECTS5
UndervisningssprogDansk
UndervisningsstedCampus Aalborg
Modulansvarlig

Organisation

StudienævnStudienævn for Datalogi
InstitutInstitut for Datalogi
FakultetDet Teknisk Fakultet for IT og Design