Accueil > Doctorat > Se former pendant le doctorat


A19- Introduction au data mining et text mining avec le logiciel R- 28H

Objectifs:

- découvrir et comprendre les principaux outils du data mining et du text mining et leur mise en place sous le logiciel R.
- conduire une analyse de data mining et text mining sous le logiciel R.

Descriptif de la formation :

Le contenu de la formation est le suivant :
Data Mining :
- réduction de dimension (analyse en composante principale).
- clustering (kmeans, classification hierarchique)
- apprentissage supervisé : classification (k-plus proches voisins, régression logistique, arbre de décisions) et régression linéaire (simple, multiple).
Text Mining :
- représentation vectorielle d’un corpus
- principaux prétraitement des données textuelles (suppression des mots-outils, lemmatisation, etc.)
- mise en place de son propre moteur de recherche par mots-clefs
- classification supervisée et clustering sur données textuelles

Pré-requis:

Les pré-requis suivant sont indispensables pour suivre la formation :
- Notions de R (typiquement le contenu du module initiation).
- Notions de statistiques élémentaires (statistique descriptive, test statistique).
Les doctorants ayant suivi la formation Introduction à la programmation avec R seront prioritaires.


Responsable pédagogique :

Julien JACQUES et Julien VELCIN, Professeur des universités et Maître de conférences,  Lyon 2 & ERIC EA 3083.



Volume horaire :

28 H

Dates et horaires :

Première partie (data mining) : jeudi 22 et vendredi 23 mars (9h-17h30)

Deuxième partie (text mining) : mercredi 11 et jeudi 12 avril (9h-17h30)

Ouverture des inscriptions:

22/01/2018

Lieu :

Salle 103
Université de Lyon, 92 rue Pasteur , 69007 Lyon

Capacité d'accueil :

15 doctorants au maximum

Matériel:

Ordinateur avec logiciel R et Rstudio (logiciel gratuit et multi-plateforme)