Projecten

Terug naar overzicht
Vakgebieden

Data science voor alfa en gamma

Vakgebieden Exact en Informatica
Soort innovatie MOOC

Big Data zijn niet meer uit het onderwijs weg te denken. Om studenten te trainen in het verzamelen en analyseren van data, ontwikkelden Tilburg University en de Open Universiteit de MOOC ‘Data science voor alfa en gamma’.

Instelling

Tilburg University en de Open Universiteit

Doel en doelgroep

Big data spelen een steeds belangrijker rol in onderzoek. Daarom is het belangrijk dat ook studenten zonder programmeerkennis leren omgaan met extreem grote databestanden. In de MOOC ‘Data science voor alfa en gamma’ leren studenten hoe ze via data analytics en datamining inzicht krijgen in grote databestanden. De MOOC richt zich niet alleen op het verzamelen en analyseren van data, maar leert studenten ook hoe ze verbanden en conclusies kunnen presenteren.

Resultaten

De MOOC ‘Data science voor alfa en gamma’ omvat een breed scala van open leermaterialen, zoals een introductie in de vorm van zes videolezingen, video-testimonials van data-scientists uit de praktijk en hands-on opdrachten gebaseerd op Orange en WEKA. Voor de MOOC  is gebruik gemaakt van een combinatie van een Canvas-omgeving met YouTube video’s en iPython Notebooks. Het ondersteunende materiaal is beschikbaar via GitHub, zodat docenten naar eigen inzicht delen van de module kunnen overnemen.

Ontwikkelde materialen

6 video lectures ter introductie van data science:
- Video Lecture 1 – Introduction to Data Science
- Video Lecture 2 – Representing Data
- Video Lecture 3 – Working with Text Data – Part 1
- Video Lecture 4 – Best Practices and Common Pitfalls
- Video Lecture 5 – Working with Text Data – Part 2
- Video Lecture 6 – Mining Massive Data

Op github vind je de powerpointslides voor docenten die zijn gekoppeld aan de onderstaande uitlegvideo's over het gebruik van datamining omgevingen Orange en WEKA. Ook vind je er de Jupyter Notebook voor hands-on oefeningen.

Deze introductievideo legt de basis van WEKA in ongeveer 23 minuten uit.
De introductie WEKA video’s hieronder geven een goed overzicht over de software en de basics of data mining.

  1. Introduction
  2. Exploring the Explorer
  3. Comparing Classifiers
  4. Building a Classifier
  5. Using a Filter
  6. Visualising your Data
  7. Be a Classifier
  8. Training and Testing
  9. Repeated Training and Testing
  10. Baseline Accuracy
  11. Cross-Validation
  12. Cross-Validation Results
  13. Decision Trees and Rules
  14. Generating Decision Rules
  15. Using Probabilities
  16. Decision Trees
  17. Pruning Decision Trees
  18. Nearest Neighbor
  19. Classification Boundaries
  20. Linear Regression
  21. Classification by Regression
  22. Logistic Regression
  23. Support Vector Machines
  24. Ensemble Learning

Hieronder vind je 19 tutorial video's voor data mining met Orange.

  1. Welcome to Orange
  2. Data Workflows
  3. Widgets and Channels
  4. Loading your Data
  5. Hierarchical Clustering
  6. Making Predictions
  7. Model Evaluation and Scoring
  8. Add-ons
  9. Principal Component Analysis
  10. Feature Scoring and Ranking
  11. k-Means
  12. k-Means Explained
  13. Silhouette
  14. Image Analytics – Clustering
  15. Image Analytics – Classification
  16. Text Preprocessing
  17. Text Clustering
  18. Text Classification
  19. How to Import Text Documents

Pointers naar vrij beschikbaar materiaal om basisvaardigheden Python op te doen.
- Download Python. Python documentatie. Python tutorial.
- The Coder’s Apprentice by Pieter Spronck (Dutch version) is a gentle introduction to Python.

Tips

  • Een MOOC valt of staat met een gedegen integratie in het eigen onderwijs: MOOC, face-to-face onderwijs en programmeeromgeving moeten een logische drie-eenheid vormen.
  • Maak vooraf een goede afweging bij de keuze voor een commercieel of niet-commercieel platform, en kijk daarbij vooral ook kritisch naar de kosten. 

Contactpersoon voor vragen

Marie Postma-Nilsenová:  marie.postma@uvt.nl

Stimuleringsregeling open en online onderwijs

Dit project heeft in 2015 deelgenomen aan de stimuleringsregeling open en online onderwijs.