Modulets indhold, forløb og pædagogik
 
Læringsmål
Viden
- Dataforberedelse, såsom datakvalitet, datarensning, outlier
detektion, datagenerering og udvidelse, datatransformation og data
wrangling
  - Dataintegration, såsom skema matching, skema mapping,
skemaintegration, global og lokal som view, wrappers/mediatorer,
avanceret ETL, ændringsdetektering og -styring og metadata og
masterdatastyring.
  - DataOps, såsom dataflowspecifikation, test og styring,
versionering, implementering, robusthed/modstandsdygtighed,
dataovervågning og -kontrol, kontinuerlig integration, test og
distribution og performance tuning på en distribueret
infrastruktur.
  - Begreberne ovenfor er illustreret ved avancerede realistiske
use cases, typisk baseret på åbne data.
 
Færdigheder
- Skal være i stand til at integrere data fra flere datakilder
fra separate udbydere i en integreret og konsistent repræsentation
  - Skal være i stand til at rense og forberede realistiske Big
Data -sæt med relevante værktøjer, samtidig med at styre volumen,
hastighed, variation og sandhed
  - Skal kunne anvende DataOps ved hjælp af bedste praksis om
realistiske datastrømme, der kører på en distribueret
infrastruktur. ntegrere data fra flere datakilder fra separate
udbydere i en integreret og konsekvent repræsentation
 
Kompetencer
- Skal være i stand til at vælge relevante teknikker til
dataintegration, dataforberedelse og DataOps til et givet
realistisk Big Data -scenario.
 - Skal være i stand til at forstå og begrunde resultatet af Big
Data -processer.
 
Undervisningsform
Undervisningen tilrettelægges i henhold til de generelle
undervisningsformer for uddannelsen, jf. § 17.
Omfang og forventet arbejdsindsats
Det forventes at den studerende bruger 30 timer per ECTS,
hvilket for denne aktivitet betyder 150 timer.
Eksamen
Prøver
| Prøvens navn | Big data processer | 
| Prøveform | Skriftlig eller mundtlig  | 
| ECTS | 5 | 
| Bedømmelsesform | 7-trins-skala | 
| Censur | Intern prøve | 
| Vurderingskriterier | Vurderingskriterierne er angivet i Universitetets
eksamensordning | 
Yderligere informationer
Kontakt: Studienævn for datalogi via
cs-sn@cs.aau.dk eller
9940 8854