Big data processer

2022/2023

Modulets indhold, forløb og pædagogik

Læringsmål

Viden

Dataforberedelse, såsom datakvalitet, datarensning, outlier detektion, datagenerering og udvidelse, datatransformation og data wrangling
Dataintegration, såsom skema matching, skema mapping, skemaintegration, global og lokal som view, wrappers/mediatorer, avanceret ETL, ændringsdetektering og -styring og metadata og masterdatastyring.
DataOps, såsom dataflowspecifikation, test og styring, versionering, implementering, robusthed/modstandsdygtighed, dataovervågning og -kontrol, kontinuerlig integration, test og distribution og performance tuning på en distribueret infrastruktur.
Begreberne ovenfor er illustreret ved avancerede realistiske use cases, typisk baseret på åbne data.

Færdigheder

Skal være i stand til at integrere data fra flere datakilder fra separate udbydere i en integreret og konsistent repræsentation
Skal være i stand til at rense og forberede realistiske Big Data -sæt med relevante værktøjer, samtidig med at styre volumen, hastighed, variation og sandhed
Skal kunne anvende DataOps ved hjælp af bedste praksis om realistiske datastrømme, der kører på en distribueret infrastruktur. ntegrere data fra flere datakilder fra separate udbydere i en integreret og konsekvent repræsentation

Kompetencer

Skal være i stand til at vælge relevante teknikker til dataintegration, dataforberedelse og DataOps til et givet realistisk Big Data -scenario.
Skal være i stand til at forstå og begrunde resultatet af Big Data -processer.

Undervisningsform

Undervisningen tilrettelægges i henhold til de generelle undervisningsformer for uddannelsen, jf. § 17.

Omfang og forventet arbejdsindsats

Det forventes at den studerende bruger 30 timer per ECTS, hvilket for denne aktivitet betyder 150 timer.

Eksamen

Prøver

Prøvens navn	Big data processer
Prøveform	Skriftlig eller mundtlig
ECTS	5
Bedømmelsesform	7-trins-skala
Censur	Intern prøve
Vurderingskriterier	Vurderingskriterierne er angivet i Universitetets eksamensordning

Yderligere informationer

Kontakt: Studienævn for datalogi via cs-sn@cs.aau.dk eller 9940 8854

Fakta om modulet

Engelsk titel	Big Data Processes
Modulkode	DSNDVK103
Modultype	Kursus
Varighed	1 semester
Semester	Forår
ECTS	5
Undervisningssprog	Dansk
Tomplads	Ja
Undervisningssted	Campus Aalborg
Modulansvarlig	Lone Leth Thomsen

Organisation

Studienævn	Studienævn for Datalogi
Institut	Institut for Datalogi
Fakultet	Det Teknisk Fakultet for IT og Design

AAU Moduler

Big data processer

2022/2023

Modulets indhold, forløb og pædagogik

Læringsmål

Viden

Færdigheder

Kompetencer

Undervisningsform

Omfang og forventet arbejdsindsats

Eksamen

Prøver

Yderligere informationer

Fakta om modulet

Organisation

Organisation

Strategi & udviklingskontrakt

Kvalitetssikring af uddannelser

International samarbejde

Problembaseret læring (PBL)

historie, priser og hæder

Facebook

Youtube

Flickr

LinkedIn

AAU Moduler

Big data processer

2022/2023

Modulets indhold, forløb og pædagogik

Læringsmål

Viden

Færdigheder

Kompetencer

Undervisningsform

Omfang og forventet arbejdsindsats

Eksamen

Prøver

Yderligere informationer

Fakta om modulet

Organisation

Søg i modulbasen

Relaterede Links