Catalogue des formations en calcul

SAISIE
    API     

Apprentissage machine pour la science des données

27 Avr - 30 Avr 2020    Toulouse, France    Cours/TP

Mots Clefs

  • Algorithmes

Objectifs

Connaître les principaux algorithmes d'analyse automatique des données et savoir les mettre en œuvre avec R et python/scikit-learn.

Objectif pédagogique

A l'issue de la formation, les participants devront être capables de :

reconnaître le type de problème qui leur est posé (apprentissage supervisé, non supervisé, par renforcement, séquentiel, etc.) ;
connaître et choisir un ou plusieurs algorithmes adaptés au traitement de ce problème ;
mettre en œuvre de cet algorithme dans un environnement de travail R ou python.

Contenu

Cette formation permet aux participants de consolider leurs bases théoriques et pratiques pour comprendre et mettre en œuvre les algorithmes d'apprentissage machine. Elle comporte la présentation des principales méthodes d'analyse statistique des données, autant sur un plan exploratoire (apprentissage non supervisé) que prédictif (apprentissage supervisé). Chaque méthode est d'abord présentée et commentée théoriquement, avant d'être illustrée numériquement sur des jeux de données sur les logiciels R et/ou python/scikit-learn.

Programme

Tous les jours de 9h à 17h30. Matin : cours. Après-midi : travaux pratiques.

Jour 1

Présentation générale de l'apprentissage statistique et de ses grands problèmes. Positionnement par rapport à la statistique classique et au machine learning.
Apprentissage non-supervisé
> Analyse en Composantes Principales
> Classification ascendante hiérarchique
> k-means, k-medoids et variantes
> évocation d'autres méthodes : affinity propagation, dbscan, etc.
Jour 2

Apprentissage supervisé 1/2 :
> k plus proches voisins
> Modèle linéaire gaussien et logistique, sélection de modèles
> Lasso et variantes
> Support Vector Machines
Jour 3

Apprentissage supervisé 2/2 :
> Arbres de décision
> Bagging, Forêts aléatoires, Boosting
> Réseaux de neurones, deep learning

Jour 4

Apprentissage séquentiel, problèmes de bandits multi-bras
Super-learning et agrégation d'experts
Apprentissage par renforcement

Prérequis

Connaissance de base statistique : probabilités élémentaires, tests statistiques, modèle linéaire gaussien.
Connaissance de base en algorithmique et programmation.
Installer Python 2.7 avec Anaconda, R 3.4.2 et IRkernel. Accès à internet lors de la session pour les éventuelles mises à jour et chargement de librairies manquantes.

Afin de s'assurer que les prérequis sont bien satisfaits, nous vous prions de bien vouloir répondre au questionnaire suivant. Vous devez obtenir 75% de bonnes réponses pour vous inscrire à cette formation.

Questionnaire 1 : https://goo.gl/forms/xL86TzPDFOC5r7ln1

Niveau de la formation

Ce cours s’adresse aux ingénieurs et informaticiens désirant consolider ou étendre leurs connaissances théoriques et pratiques de l'analyse automatique de données avec les algorithmes d'apprentissage

Entités contributrices

  • CERFACS

Contacts

Contact principal : Chantal Nasri

Autres contacts : Jean-Christophe Jouhaud

Mèl de contact : training@cerfacs.fr

Localisation

Adresse :
42 Avenue Gaspard Coriolis, 31100 toulouse, France