Vous êtes ici : Version Française > Actualités et présentation > formation doctorale

A44 (2) - Fouille de données textuelles avancées (avec introduction au deep learning) - 14H

Volume horaire total 14h

Responsables

Julien Velcin, Professeur, Université Lumière Lyon 2 & ERIC EA 3083

Pré-requis

Les pré-requis suivants sont indispensables pour suivre la formation :
  • Programmation en R (la partie deep learning peut également être suivie par des étudiants connaissant la programmation en Python 3, sous l'environnement Anaconda)
  • Notions élémentaires en fouille de données (data mining)
Les participants devront apporter leurs ordinateurs équipés avec :

- La dernière version de RStudio (logiciel gratuit et multi-plateforme, voir : www.rstudio.com)
- Libraries R suivantes : text2vec, dplyr, stopwords, SnowballC, Rcpp, RColor, Brewer, wordcloud, Matrix, glmnet, rpart

Pour la partie deep learning, il est nécessaire d’installer la librairie Keras avec le backend tensorflow.
► Plus d'informations


 

Objectifs

  • Comprendre les spécificités des données textuelles dans une tâche de fouille de données
  • Déployer des algorithmes de fouille de données sur des corpus textuels : modèles thématiques, classification automatique

Contenu

Le contenu de la formation est le suivant :
  • Rappels sur le prétraitement des données textuelles pour la fouille de données
  • Modélisation thématique (topic modeling)
  • Classification supervisée de données textuelles (éléments de deep learning)

Calendrier

9 et 10 mars 2020 | de 09h00 à 17h00
Ouverture des inscriptions : 9 janvier 2020