Den studerende introduceres til data science-begrebet og opnår viden om praktisk erfaring med basale statistiske metoder og software til håndtering, bearbejdning og visualisering af konkrete data. Den studerende lærer at udføre basale statistiske analyser understøttet af statistik software
Enkeltfaget dækker grundlæggende data science, statistiske metoder og statistisk software.
Gennem enkeltfaget skal den studerende opnå viden om hvorledes man i praksis kan danne sig et overblik over større datasæt, hvordan man kan finde og rette fejl og inkonsistens i data samt hvordan statistisk software kan understøtte god statistisk praksis.
Konkrete emner:
• Introduktion til data science: begreber, konkrete eksempler, muligheder og begrænsninger
• Indlæsning af data; data i forskellige formater, kombination af data fra forskellige kilder.
• Udforskning af data; visualisering, data summaries, detektion af outliers
• Praktisk præprocessering og rensning af data
• Programmering i og avanceret brug af software (eksempelvis R)
• Dokumentation og reproducerbarhed af analyser
• Relevante statistiske analyser med statistisk software, eksempelvis regressionsmodeller
Den studerende skal ydermere kunne forholde sig kritisk og refleksivt i forhold til disse teoretiske emner
Den studerende skal kunne bruge statistisk software i indledende
undersøgelser af større datasæt.
Den studerende skal kunne anvende teorier, metoder og modeller fra
ovennævnte områder til at identificere, analysere, vurdere og komme
med forslag til konkrete statistiske analyser. Den studerende skal
kunne argumentere for relevansen af de valgte teorier, metoder og
modeller samt for det udarbejdede løsningsforslag.
Den studerende skal kunne reflektere over betydningen af
resultaterne af de udarbejdede analyser samt hvordan disse kan
anvendes i praksis. Derudover skal den studerende kunne formidle og
diskutere løsningerne med fagfæller og ikke-specialister.
Ydermere skal den studerende kunne træffe informerede valg omkring statistiske metoder, herunder hvordan et givet datasæt skal undersøges, bearbejdes og analyseres.
Undervisningen bestå af tre seminardage med kombinerede forelæsninger og øvelsessessioner. Mellem seminarerne læser den studerende faglitteratur og laver øvelser/opgaver. Desuden udarbejder de studerende i grupper et miniprojekt til en realistisk problemstilling.
Prøvens navn | Introduktion til Data Science |
Prøveform | Mundtlig pba. projekt
Intern mundtlig evaluering med udgangspunkt i projektrapporten for
miniprojektet. |
ECTS | 5 |
Bedømmelsesform | 7-trins-skala |
Censur | Intern prøve |
Vurderingskriterier | Vurderingskriterierne er angivet i Universitetets eksamensordning |
Tjek detaljer på https://www.master-it-vest.dk/fagpakker/softwarekonstruktion.html
Engelsk titel | Introduction to Data Science |
Modulkode | DSNITEV10 |
Modultype | Kursus |
Semester | Tjek detaljer på https://www.master-it-vest.dk/fagpakker/softwarekonstruktion.html |
ECTS | 5 |
Undervisningssprog | Dansk |
Undervisningssted | Campus Aalborg |
Modulansvarlig |
Studienævn | Studienævn for Datalogi |
Institut | Institut for Datalogi |
Fakultet | Det Teknisk Fakultet for IT og Design |