Outils pour utilisateurs

Outils du site


cours_master:aao

Recueil et structuration de corpus

Première partie S1/S3

Enseignants 2019-2020

Achille Falaise et Alexandre Roulois

Pré-requis

Les étudiants souhaitant suivre ce bloc doivent obligatoirement suivre en parallèle le bloc “Base de programmation”

Objectifs et contenu principal

De la détection d'encodage à la normalisation de données en passant par l'extraction de contenus Web, les étudiants aborderont au cours de ce module les étapes préalables à la constitution d'un corpus textuel en vue de son exploitation par les outils état de l'art. Ils tireront partie de méthodes de nettoyage et de structuration automatisées (python, perl) pour produire des documents dans des formats variés (TXT, CSV, XML/TEI).

Bibliographie
  • À venir…
cours_master/aao.txt · Dernière modification: 2019/09/12 10:00 par lliegeois