Vous êtes ici : Version Française > Actualités et présentation > formation doctorale

A44 (1) - Introduction à la fouille de données textuelles (niveau 1) - 21H

Volume horaire total 14h

Responsables

Julien Veclin, Professeur, Lyon 2 & ERIC EA 3083

Pré-requis

Les pré-requis suivants sont indispensables pour suivre la formation :
  • Programmation en R ou en Python ;
  • Notions élémentaires en fouille de données (data mining).
Les participants devront apporter leur ordinateur équipé de Rstudio (logiciel gratuit et multi-plateforme) ou de Python (de préférence Anaconda). 

Objectifs

  • Découvrir et comprendre les principaux outils de la fouille de données textuelles (text mining) ;
  • Conduire une analyse de text mining (recherche d’information, classification automatique) avec les langages R ou Python.

Contenu

Le contenu de la formation est le suivant :
  • Introduction et applications phares de l’analyse automatique du texte ;
  • Représentation vectorielle d’un corpus et manipulations simples (ex. : calcul de similarité) ;
  • Principaux pré-traitements des données textuelles (suppression des mots-outils, lemmatisation, etc.)
  • Mise en place de son propre moteur de recherche par mots-clefs ;
  • Classification supervisée de données textuelles (éléments de deep learning) ;
  • Clustering et modélisation thématique (topic modeling).

Calendrier

25 et 26 novembre 2019 | de 9h00 à 17h30
Ouverture des inscriptions : 25 septembre 2019