TD04: FRANTEXT

Frantext est une base de donnée textuelle, qui regroupe un important corpus de textes français, du XVIième au XXième siècle, saisis sur support informatique. Le corpus est constitué d'environ 3500 oeuvres, dont environ 80 % d'oeuvres littéraires et 20 % d'ouvrages techniques.

Un logiciel de consultation permet de rechercher, dans une partie du corpus, diverses séquences et leur contexte. Par exemple, si on recherche toutes les occurrences du mot machination, on obtiendra une suite d'extraits comme le suivant :

M332/DUMAS.A PERE / LE COMTE DE MONTE-CRISTO / 1846 page 515 /
Vous comprenez, mon cher baron, la voie légale est la plus sûre en matière criminelle, c'était peut-être quelque machination contre vous.

Ce logiciel est accessible via Internet (aux organismes abonnés), par exemple avec Netscape, et c'est cette interface qui fait l'objet des manipulations d'aujourd'hui.

L'URL correspondant est : http://zeus.inalf.cnrs.fr/noncateg.htm, l'accès à l'interface de consultation (pour les utilisateurs autorisés) se fait en cliquant sur Activation de Frantext Choisir sans menus déroulants.

N'hésitez pas à utiliser abondamment les boutons d'aide, le logiciel d'interface étant assez bien documenté.

Manipulation : voir feuilles distribuées.


amsili@linguist.jussieu.fr,gendner@linguist.jussieu.fr
  Thu Nov 02, 2000 Ma maison-page