TP05: Utilisation d'un concordancier
Une concordance, dans sa forme la plus simple, est une liste alphabétique des mots d'un texte, donnés avec les contextes dans lesquels ils apparaissent. Le plus souvent on représente les mots sous la forme d'un index KWIC (KeyWord In Context), dans lequel chaque mot est centré dans une fenêtre de taille fixe (cf. figure 1).
taste it is that such | poor | cattle always have in their mouths |
of sparing the | poor | child the inheritance of any part of |
small property of my | poor | father, whom I never saw--so long |
desolate, while your | poor | heart pined away, weep for it |
Miss, if the | poor | lady had suffered so intensely |
the love of my | poor | mother hid his torture from me |
stockings, and all his | poor | tatters of clothes, had, in a long |
faded away into a | poor | weak stain. So sunken and |
on your way to the | poor | wronged gentleman, and, with a |
detachment from the | poor | young lady, by laying a brawny hand |
|
Fig. 1 - Concordance de poor dans A Tale of Two Cities (Dickens) |
Un concordancier est donc un programme permettant de réaliser de telles listes sur un corpus de son choix. En général, les concordanciers donnent aussi diverses informations statistiques sur le corpus traité.
Références
- Le concordancier que nous utiliserons est MonoConc Pro (version 1.0), développé par Michael Barlow. (version commerciale, mise à disposition pour l'enseignement.)
- Il en existe d'autres qui sont téléchargeable gratuitement. Par exemple :
- Sur l'utilisation des concordanciers pour les études littéraires (avec une présentation comparative de plusieurs concordanciers) voir Using a Concordancer in Literary Studies by Maria Rosario Caballero Rodriguez published in The European English Messenger Vol VII/2 pp 59-62, Autumn 1999
Manipulations
Les manipulations suivantes doivent être réalisées par chaque groupe, et les résultats remis à l'enseignant à l'issue de la séance.
-
- Lancer le concordancier ( Z:/Taln/Concordance/MonoConc/Monopro.exe ).
(Si le fichier n'apparait pas dans l'explorateur, aller dans le Menu Affichage | Options et cocher "Afficher tous les fichiers". Vérifier également que "Masquer les extension pour les types de fichiers connus" n'est pas cochée, pour que les extensions s'affichent)
- Charger le fichier Y:/Amsili/Hugo_ane.txt (Menu File | Load corpus )
- Essayer les différentes fonctionnalités : affichage des concordances (Menu Concordance | Search ou Advance Search + Sort) , tris par fréquence des mots, (Menu Frequency | Corpus frequency data | frequency order ou alphabetical order ), affichage des collocations (Menu Frequency | Collocate frequency data), distribution d'un terme dans le coprus (Menu Display | Distribution...
- Donner le nombre d'occurence du mot "Kant" dans ce texte
- Relever une phrase complète dans laquelle le mot ne est suivi de l'adjectif libre
- Combien trouve-t-on d'occurence de la forme négative ne? Combien trouve-t-on de séquence ne un_mot_quelconque pas?
- Comparer la distribution du mot âne et du mot homme
-
- Lancer Internet Explorer ou Netscape, et choisir un texte parmi ceux qui sont proposés sur le site http://cedric.cnam.fr/ABU/BIB/index.html.
- Sauvegarder l'oeuvre choisie au format texte seul. (Cliquer sur Texte complet - en bas à droite, puis sur HTML pour visualiser le texte au format HTML. Aller ensuite dans le Menu Fichier | Enregistrer sous du browser, pour enregistrer une version texte (.txt).
- Décharger le corpus precédent (Menu File | Unload corpus )
- Charger l'oeuvre que vous venez d'enregistrer sur votre ordinateur de travail.
- Donner les 10 mots pleins les plus fréquents.
- Relever les collocations pertinentes pour 5 de ces mots.
- Donner le nombre d'occurrences (en pourcentage), du mot en suivi par un participe présent.