Objectifs
Comprendre ce qu'est la Data Science, le Machine Learning et l’Intelligence Artificielle, de la théorie à la pratique
Identifier les différentes étapes des pipelines d’apprentissage automatique
Découvrir et s’exercer avec différents outils classiques
Public
Développeur/euse, analyste
Programme
Jour 1:
Introduction
Qu’est-ce que la Data Science? Définition et relations avec le Machine Learning et l’Intelligence Artificielle?
Machine Learning
Types d’apprentissage, types de problèmes, et cas d’utilisation pratiques
Comment ça marche?
Pipeline de l'apprentissage automatique : Des données au modèle
Collecte et préparation des données
Problèmes de données courants
Préparation et partitionnement
Extraction des caractéristiques
Sélection des caractéristiques
Réduction des dimensions
Normalisation
Entraînement et évaluation du modèle
Sélection de l'algorithme approprié
Métriques d’évaluation
Sur-apprentissage et sous-apprentissage: le dilemme biais-variance
Ajustement des hyper-paramètres
Outils du Data Scientist: Python, Jupyter Notebook, Numpy, Scikit-learn, Git, etc.
Mise en pratique
Jour 2:
Qu’est-ce que le Deep Learning?
Exemples d’applications
Traitement d’images
Traitement du langage naturel
Autres
Modèles de Deep Learning
Convolutional Neural Networks (NN)
Recurrent NN
Transformer Networks
Apprentissage par transfert (Transfer Learning)
Mise en pratique
Direction
Prof. Giovanna DI MARZO SERUGENDO, Centre universitaire d'informatique (CUI), Université de Genève