Vous êtes ici : Version Française > Actualités et présentation > formation doctorale

A43 - Introduction à la fouille de données textuelles (text mining) - 21H

Volume horaire total 21h

Responsables

Julien Veclin, MCF, Lyon & ERIC EA 3083

Pré-requis

Les pré-requis suivants sont indispensables pour suivre la formation :
  • Programmation en R ou en Python ;
  • Notions élémentaires en fouille de données (data mining).

Les participants devront apporter leur ordinateur équipé de Rstudio (logiciel gratuit et multi-plateforme) ou de Python (de préférence Anaconda). 

Objectifs

  • Découvrir et comprendre les principaux outils de la fouille de données textuelles (text mining) ;
  • Conduire une analyse de text mining (recherche d’information, classification automatique) avec les langages R ou Python.

Contenu

Le contenu de la formation est le suivant :
  • Introduction et applications phares de l’analyse automatique du texte ;
  • Représentation vectorielle d’un corpus et manipulations simples (ex. : calcul de similarité) ;
  • Principaux pré-traitements des données textuelles (suppression des mots-outils, lemmatisation, etc.) ;
  • Mise en place de son propre moteur de recherche par mots-clefs ;
  • Classification supervisée de données textuelles (éléments de deep learning) ;
  • Clustering et modélisation thématique (topic modeling).

Calendrier

8, 9 et 11 avril 2019 | de 9h00 à 17h30
Ouverture des inscriptions : 8 février 2019