Aller à : contenu haut bas recherche
 
 
EN     FR
Vous êtes ici:   UNIL > HEC Inst. > HEC App. > SYLLABUS
 
 

Text Mining

  • Enseignant(s):   M.Boldi  
  • Titre en français: Analyse automatisée de textes
  • Cours donné en: anglais
  • Crédits ECTS: 6 crédits
  • Horaire: Semestre d'automne 2020-2021, 4.0h. de cours (moyenne hebdomadaire)
  •  séances
  • site web du cours site web du cours
  • Formations concernées:
    Maîtrise universitaire ès Sciences en management, Orientation comportement, économie et évolution

    Maîtrise universitaire ès Sciences en management, Orientation business analytics

    Maîtrise universitaire ès Sciences en management, Orientation stratégie, organisation et leadership

    Maîtrise universitaire ès Sciences en management, Orientation marketing

 

Objectifs

Après avoir réussi le cours, l'étudiant sera capable de:

  • Sélectionner et appliquer des méthodes d'analyse automatique de textes pour les cas vus en cours,
  • Utiliser R pour réaliser ces applications,
  • Analyser et interpréter des résultats d'analyses automatiques de textes.

Contenus

Ce cours présente plusieurs méthodes d'analyse auomatique de textes dans un contexte de business. La liste provisoire ci-dessous sera adaptée en fonction du rythme du cours:

  • Acquisition de documents (web scraping, encodage, ...) et prétraitements des textes (stemming, lemmatisation, ...),
  • Fréquences et plongements lexicaux (TF-IDF, word2vec, ...)
  • Méthodes non-supervisées (similarités, analyse sémantique latente, modélisation thématique, ...),
  • Méthodes supervisées.

Théorie et pratique sont d'égale importance.

Références

Pas de lecture obligatoire. Des références utiles pourront être transmises durant le cours.

Pré-requis

Pas de pré-requis obligatoire mais le cours utilise de manière extensive les méthodes d'apprentissage automatique. Les étudiants sont supposés connaître ces méthodes (au niveau du cours correspondant du master). Sinon, ils sont supposés apprendre ces méthodes par eux-mêmes avant le cours. De même, de bonnes connaissances en programmation R sont nécessaires pour la réussite de ce cours.

Evaluation

1ère tentative

Examen:
Sans examen (cf. modalités)  
Evaluation:

- Un examen écrit individuel: 2hrs, organisé durant le semestre.

- Un project d'application: individuel ou en groupes, selon le nombre de participants au cours. Une présentation finale sera organisée durant le semestre.

Note finale = 0.3 examen + 0.7 projet

Rattrapage

Examen:
Ecrit 2h00 heures
Documentation:
Non autorisée
Calculatrice:
Non autorisée
Evaluation:

Le rattrapage est organisé pour la partie échouée seulement (examen ou projet).

- Examen écrit: un examen écrit de rattraprage de 2hr sera organisé

- Projet: un complément/correction au projet sera demandé.

Seule la partie échouée de la note sera mise à jour.

Note finale = 0.3 examen + 0.7 projet

Exemples:

- Note finale >= 4, pas de rattrapage

- Note finale < 4

- avec examen > 4, projet < 4 => rattrapage du projet, note examen conservée

- avec examen < 4, projet >= 4 => rattrapage de l'examen, note du projet conservée

- avec examen et projet < 4 => rattrapage des deux



[» page précédente]           [» liste des cours]
 
Recherche


Internef - CH-1015 Lausanne - Suisse  -   Tél. +41 21 692 33 00  -   Fax +41 21 692 33 05
Swiss University