
Machine Learning Fundamentals
Beskrivelse
Machine Learning (ML) er en af nøgleteknologierne bag moderne dataanalyse, automatisering og AI-løsninger. På dette kursus får du en solid og praksisnær introduktion til, hvordan du anvender ML i Python til at skabe modeller, der kan forudsige, klassificere og finde mønstre i data.
Vi starter med en introduktion til grundprincipperne i ML, herunder forskellen på supervised, unsupervised og reinforcement learning, samt hvordan ML adskiller sig fra klassisk programmering.
Herefter arbejder vi med data preparation i Pandas og NumPy, hvor du lærer at rense datasæt, udføre feature engineering, skalere data og visualisere sammenhænge. Vi går videre til regression (prediction af numeriske værdier) og classification (opdeling i kategorier) med konkrete cases som boligprisprognoser og e-mailklassificering.
Kurset dækker også tree-based models som Decision Trees og Random Forest, samt en kort introduktion til unsupervised learning med clustering og PCA. Du lærer at evaluere model performance, undgå overfitting, tune hyperparameters og gøre dine modeller klar til deployment.
Undervisningen er case-baseret og afsluttes med et mini-projekt, hvor du bygger en fuld ML pipeline – fra data preparation til deployment.
Efter kurset kan du:
- Forberede og analysere data i Pandas og NumPy
- Udvælge og anvende ML-algoritmer til regression og classification
- Evaluere model performance og undgå overfitting
- Implementere tree-based models og simple unsupervised-metoder
- Tune hyperparameters og optimere model performance
- Gemme, genindlæse og integrere ML-modeller i applikationer
Moduloversigt
- Modul 1Introduktion til Machine Learning
- Hvad er ML? Eksempler fra virkeligheden
- ML vs klassisk programmering
- Typer af ML: supervised, unsupervised, reinforcement
- Modul 2Data Preparation med Pandas og NumPy
- Data loading og cleaning (NaN, duplicates, datatyper)
- Feature engineering og data transformation (one-hot encoding, scaling)
- Data exploration og visualisering (correlation, distribution plots)
- Modul 3Regression – prediction af numeriske værdier
- Linear regression med scikit-learn
- Fortolkning af coefficients og performance metrics (R², MAE, MSE)
- Case: Predicting boligpriser
- Modul 4Classification
- Logistic regression og Naive Bayes
- Evalueringsmetrikker: accuracy, precision, recall, confusion matrix
- Case: Email classification eller churn prediction
- Modul 5Tree-based models
- Decision Trees og Random Forest
- Visualisering og feature importance
- Introduktion til ensemble learning
- Modul 6Introduktion til unsupervised learning
- Hvornår bruger man unsupervised learning?
- K-means clustering
- PCA (Principal Component Analysis)
- Modul 7Model validation og overfitting
- Train/test split og cross-validation
- Bias-variance tradeoff og learning curves
- Modul 8Hyperparameter tuning
- Hyperparameters og model optimization
- GridSearchCV og RandomizedSearchCV
- Hands-on: Tuning af max_depth i Decision Tree
- Modul 9Model persistence og deployment
- Gemme modeller med pickle/joblib
- Integration i applikationer (REST API, batch processing)
- Driftsovervejelser: retraining, versioning
- Modul 10Mini-projekt: Byg en fuld ML-pipeline
- Fra data preparation til deployment
- Præsentation og refleksion
Er du i tvivl?
Det ligger os meget på sinde, at du finder det kursusforløb, der skaber størst værdi for dig og din arbejdsplads. Tag fat i vores kursusrådgivere, de sidder klar til at hjælpe dig!
