
Python & Dataanalyse
Beskrivelse
Python er blevet det foretrukne sprog til dataanalyse og data science – og med rette. På dette kursus lærer du at udnytte Pythons stærkeste værktøjer til databehandling: NumPy til hurtige beregninger, Pandas til effektiv datamanipulation og Matplotlib til visualisering.
Vi starter med at sætte miljøet op i en IDE eller Jupyter Notebook, så du hurtigt kan komme i gang med at arbejde hands-on med data. Herefter lærer du at:
- Indlæse og gemme data fra forskellige kilder og filformater
- Strukturere og analysere data med Pandas DataFrames og Series
- Udføre beregninger og transformationer med NumPy arrays
- Klargøre og rense data, inkl. håndtering af manglende værdier, kategoriske data og tekstdata (fx med regular expressions)
- Visualisere datasæt og analyseresultater med Matplotlib og Pandas plotting-funktioner
- Arbejde med tidsserier og større datasæt
Undervejs arbejder vi med konkrete cases, så du får erfaring med de vigtigste teknikker, du skal bruge i praksis til rapportering, analyser og beslutningsstøtte.
Efter kurset vil du have en solid værktøjskasse til at arbejde med data i Python – uanset om du er analytiker, udvikler eller arbejder med BI og data science.
Certificeringspakker
Moduloversigt
- Modul 1Kom i gang med Python, pakker og værktøjer
- Pandas, NumPy og matplotlib
- IDE og/eller Jupyter Notebook
- Modul 2Introduktion til numpy
- Numpy ndarray
- Numpy Array vs Python List
- Arrays og Vektoriserede beregninger
- Modul 3Kom i gang med Pandas
- Series, DataFrame og Index objects
- Vigtig funktionalitet
- Indexing, Selection and Filtering
- Integer Indexes
- Aritmetik og Data alignment
- Boolean Indexes
- Axis Indexes
- Sortering og rangorden
- Opsummeringer og beskrivende statistikker.
- Options og indstillinger
- Modul 4Dataindlæsning, gem og filformater
- Læs og skriv data
- Modul 5Dataoprensning og -klargøring
- Håndtering af manglende data
- Streng håndtering bl.a med regular expressions
- Modul 6Data tilpasning: Join, Combine og Reshape
- Kombiner og sammensæt datasets
- Modul 7Plotting og visualisering
- Introduktion til matplotlib
- Plotting med pandas
- Modul 8Data Aggregering og Gruppe Operationer
- Group By
- Data Aggregering
- Apply
- Modul 9Tidsserier
- Analyse og håndtering af tidsbaserede data med Pandas
- Modul 10Advanced Pandas
- Categorical Data
- Håndtering af større dataset
Er du i tvivl?
Det ligger os meget på sinde, at du finder det kursusforløb, der skaber størst værdi for dig og din arbejdsplads. Tag fat i vores kursusrådgivere, de sidder klar til at hjælpe dig!
