Contents / Contenu
- Introduction, decision tree / arbres de décision.
- Slides: main_2016.pdf
- Validation
- Slides main_Validation.pdf
- Linear discrimination & Support Vector Machines
- Slides main_2016_SVM.pdf
- Big Data and stats / Grandes données: rappels de stats
- Classification, Naive Bayes / Classification et Bayesien naif
- Unsupervised learning and Expectation Maximization methods / Apprentissage non-supervisé, méthodes EM
- Projects: presentations.
TP Python
- TP1 : Introduction Python : TD1-exo Introduction Python (sept 2016).ipynb
- Correction : TD1-solutions Introduction Python (sept 2016).ipynb
- TP2 : Decision Tree + entropie TP Entropie.zip
- TP 3 : Decision Tree + Validation DecisionTree with sklearn Exos (oct. 2016).ipynb
- correction : DecisionTree with sklearn Solution (oct. 2016).ipynb
- TP 4 : SVM TP SVM Exos (oct 2016).ipynb
- correction : TP SVM (solution) (oct 2016).ipynb
- TP 5 : Bayesien Naïf
- en html : TC1-tp-BN.html
- en ipynb : TC1-tp-BN.ipynb
Bibliography / References
- Pattern Recognition and Machine Learning, Chris Bishop
- Nando de Freitas, https://www.youtube.com/user/ProfNandoDF
A coté des cours, un projet
Pourquoi | Devenir un data scientiste, acquérir la connaissance pratique de l'apprentissage |
Comment | Projet en équipe de 3 ou 4 étudiants |
Evaluation du projet
Ecrit | code + 2 pages de présentation, méthodologie et résultat |
Oral | soutenance, 10 mn présentation, 10 mn questions |
Quand | mercredi 9 ou Jeudi 10 novembre |
Liste des projets
- Challenge Otto Kaggle
- Challenges de la start-up AlixPartners. Le master remercie chaleureusement AlixPartners.
- Pb 1: On a un fichier texte qui représente des logs de session shell (environ 250) et on veut savoir combien il y a d'utilisateurs (10 ?).
- Data Problem 1 Input Data.zip
- Description Pb 1 documentation
- Pb 3: Pour apprendre il faut des données propres; nettoyer les données peut être un probleme d'apprentissage, aussi...
- Data Problem 3 Input Data.zip
- Description Pb 3 documentation
- Pb 4: Connaitre ses clients, tout est là.
- Data Problem 4 Input Data .zip
- Description Pb 4 documentation
- Pb 1: On a un fichier texte qui représente des logs de session shell (environ 250) et on veut savoir combien il y a d'utilisateurs (10 ?).
- Unsupervised Feature Learning for image classification
Affectations et ordre de passage
13h: session Kaggle
- Abdelhak Loukkal, Guillaume Lorre, Clément Thierry et Benzine Abdallah. (demande à passer le 1er)
- Florence Carton, Antonin Raffin, Alvaro Correia, Gabriel Quéré
- Bách Vũ, Mahmut Cavdar, Ngô Hồ Anh Khoa, Divya Grover
- Yaohui WANG, Xiyu ZHANG, Forcefidele KIEN, Herilalaina RAKOTOARISON
- Xiaoxiao CHEN, Dong FEI, Honglin Li, Yuxiang Wang
- Amal Targhi, Mohamed Abdelkhaleq, Mihaela Sorostinean
- Hadhami MATMATI, Asma KHOUFI,
-------Younes BENHOUMICH (disparu) - Stephen Batifol, Abdelhadi Temmar, Sihem Abdoun, Nicolas Bougie.
16h: Unsupervised feature learning
- Daro Ozad, Karim Kouki et Nawel Medjkoune
- Gabriel BELLARD, Alwine Lambert
- Ahmed Mazari, Fella Belkham, Hafed Rhouma
17h: Nettoyage de données
- Mohamed Ali FATHALLAH et Ghazi FELHI
Connaitre ses clients
- Aris Tritas et Laurent Cetinsoy
session logs
- Jonathan CROUZET, Kévin PASINI, Matthieu RÉ