Introduktion til Data Science

2019/2020

Modulets indhold, forløb og pædagogik

Den studerende introduceres til data science-begrebet og opnår viden om praktisk erfaring med basale statistiske metoder og software til håndtering, bearbejdning og visualisering af konkrete data. Den studerende lærer at udføre basale statistiske analyser understøttet af statistik software

Enkeltfaget dækker grundlæggende data science, statistiske metoder og statistisk software.

Læringsmål

Viden

Gennem enkeltfaget skal den studerende opnå viden om hvorledes man i praksis kan danne sig et overblik over større datasæt, hvordan man kan finde og rette fejl og inkonsistens i data samt hvordan statistisk software kan understøtte god statistisk praksis.

Konkrete emner:

• Introduktion til data science: begreber, konkrete eksempler, muligheder og begrænsninger

• Indlæsning af data; data i forskellige formater, kombination af data fra forskellige kilder.

• Udforskning af data; visualisering, data summaries, detektion af outliers

• Praktisk præprocessering og rensning af data

• Programmering i og avanceret brug af software (eksempelvis R)

• Dokumentation og reproducerbarhed af analyser

• Relevante statistiske analyser med statistisk software, eksempelvis regressionsmodeller

 

Den studerende skal ydermere kunne forholde sig kritisk og refleksivt i forhold til disse teoretiske emner

Færdigheder

Den studerende skal kunne bruge statistisk software i indledende undersøgelser af større datasæt.
Den studerende skal kunne anvende teorier, metoder og modeller fra ovennævnte områder til at identificere, analysere, vurdere og komme med forslag til konkrete statistiske analyser. Den studerende skal kunne argumentere for relevansen af de valgte teorier, metoder og modeller samt for det udarbejdede løsningsforslag.

Kompetencer

Den studerende skal kunne reflektere over betydningen af resultaterne af de udarbejdede analyser samt hvordan disse kan anvendes i praksis. Derudover skal den studerende kunne formidle og diskutere løsningerne med fagfæller og ikke-specialister.
 

Ydermere skal den studerende kunne træffe informerede valg omkring statistiske metoder, herunder hvordan et givet datasæt skal undersøges, bearbejdes og analyseres.

Undervisningsform

Undervisningen bestå af tre seminardage med kombinerede forelæsninger og øvelsessessioner. Mellem seminarerne læser den studerende faglitteratur og laver øvelser/opgaver. Desuden udarbejder de studerende i grupper et miniprojekt til en realistisk problemstilling.

Eksamen

Prøver

Prøvens navnIntroduktion til Data Science
Prøveform
Mundtlig pba. projekt
Intern mundtlig evaluering med udgangspunkt i projektrapporten for miniprojektet.
ECTS5
Bedømmelsesform7-trins-skala
CensurIntern prøve
VurderingskriterierVurderingskriterierne er angivet i Universitetets eksamensordning

Yderligere informationer

Tjek detaljer på https://www.master-it-vest.dk/fagpakker/softwarekonstruktion.html

Fakta om modulet

Engelsk titelIntroduction to Data Science
ModulkodeDSNITEV10
ModultypeKursus
SemesterTjek detaljer på https://www.master-it-vest.dk/fagpakker/softwarekonstruktion.html
ECTS5
UndervisningssprogDansk
UndervisningsstedCampus Aalborg
Modulansvarlig

Organisation

StudienævnStudienævn for Datalogi
InstitutInstitut for Datalogi
FakultetDet Tekniske Fakultet for IT og Design