Big Data-systemer

2021/2022

Modulets indhold, forløb og pædagogik

BEGRUNDELSE    
I dette modul tilegner de studerende sig viden om modeller, teknikker og systemer til lagring, håndtering og processering af Big Data, herunder multidimensionelle data. Efter endt modul vil de studerende kunne modellere multidimensionelt data og designe passende skemaer og/eller lagringsformater. De vil kunne transformere data fra forskellige kilder til et integreret analytisk datalager. De vil kunne formulere analytiske forespørgsler over store datamængder og implementere skalerbare løsninger vha. gængse Big Data-platforme. Endelig vil de for en given Big Data-problemstilling kunne træffe reflekterede valg af modeller, teknikker og systemer.

Læringsmål

Viden

Gennem kurset skal de studerende opnå viden om teorier, metoder, teknikker og værktøjer inden for følgende områder:

Principper for Big Data-skalering, herunder

  • Typiske maskinelplatforme til Big Data-håndtering
  • Basale modeller for distribueret databehandling

Teknologier og værktøjer til Big Data-skalering, herunder

  • Opsamling og lagring af Big Data
  • Processering

Data Warehousing, herunder

  • Integration af mange datakilder.
  • Opbygning af et data warehouse: Extract, Transform, Load (ETL).
  • Data warehouse værktøjer.

Multidimensionelle databaser, herunder

  • Grundlæggende multidimensionel modellering.
  • Håndtering

On-line Analytical Processing (OLAP), herunder

  • OLAP-forespørgsler
  • OLAP-værktøjer

De studerende skal kunne forholde sig kritisk og refleksivt i forhold til disse teoretiske emner.

Færdigheder

Efter at have gennemført kurset skal de studerende kunne anvende teorier, metoder og modeller fra ovennævnte områder til at identificere, analysere, vurdere og komme med forslag til løsning af konkrete problemstillinger i praksis. De skal kunne argumentere for relevansen af de valgte teorier, metoder og modeller samt for det udarbejdede løsningsforslag. Desuden skal de kunne reflektere over betydningen for den sammenhæng, løsningen indgår i.

Konkret forventes det, at de studerende efter gennemførelse af kurset er i stand til at:

  • Modellere et analytisk datalager vha. ved hjælp af grundlæggende multidimensionel modellering
  • Designe og implementere passende skemaer og/eller lagringsformater for analytiske datalagre. f.eks. et data warehouse
  • Integrere og transformere data fra flere forskellige datakilder, herunder benytte Extract-Transform-Load værktøjer
  • analysere data ved hjælp af On-Line Analytical Processing (OLAP) værktøjer.
  • designe og implementere en skalerbar løsning på et gængs Big Data-system,

 

Kompetencer

Efter gennemførelse af kurset er det målet, at de studerende har opnået kompetencer til at:

  • træffe reflekterede valg omkring modeller, teknikker og systemer til Big Data
  • designe, udvikle og anvende en passende Big Data-løsning for en realistisk problemstilling

Undervisningsform

Undervisningen tilrettelægges i henhold til de generelle undervisningsformer for uddannelsen, jf. § 17.

Omfang og forventet arbejdsindsats

Det forventes at den studerende bruger 30 timer per ECTS, hvilket for denne aktivitet betyder 150 timer.

Eksamen

Prøver

Prøvens navnBig Data-systemer
Prøveform
Skriftlig eller mundtlig
ECTS5
Bedømmelsesform7-trins-skala
CensurIntern prøve
VurderingskriterierVurderingskriterierne er angivet i Universitetets eksamensordning

Yderligere informationer

Kontakt: Studienævn for datalogi via cs-sn@cs.aau.dk eller 9940 8854

 

Fakta om modulet

Engelsk titelBig Data Systems
ModulkodeDSNDVB402
ModultypeKursus
Varighed1 semester
SemesterForår
ECTS5
UndervisningssprogDansk
TompladsJa
UndervisningsstedCampus Aalborg
Modulansvarlig

Organisation

StudienævnStudienævn for Datalogi
InstitutInstitut for Datalogi
FakultetDet Tekniske Fakultet for IT og Design