TP05: Utilisation d'un concordancier

Une concordance, dans sa forme la plus simple, est une liste alphabétique des mots d'un texte, donnés avec les contextes dans lesquels ils apparaissent. Le plus souvent on représente les mots sous la forme d'un index KWIC (KeyWord In Context), dans lequel chaque mot est centré dans une fenêtre de taille fixe (cf. figure 1).

taste it is that such	poor	cattle always have in their mouths
of sparing the	poor	child the inheritance of any part of
small property of my	poor	father, whom I never saw--so long
desolate, while your	poor	heart pined away, weep for it
Miss, if the	poor	lady had suffered so intensely
the love of my	poor	mother hid his torture from me
stockings, and all his	poor	tatters of clothes, had, in a long
faded away into a	poor	weak stain. So sunken and
on your way to the	poor	wronged gentleman, and, with a
detachment from the	poor	young lady, by laying a brawny hand

Fig. 1 - Concordance de poor dans A Tale of Two Cities (Dickens)

Un concordancier est donc un programme permettant de réaliser de telles listes sur un corpus de son choix. En général, les concordanciers donnent aussi diverses informations statistiques sur le corpus traité.

Références

Le concordancier que nous utiliserons est MonoConc Pro (version 1.0), développé par Michael Barlow. (version commerciale, mise à disposition pour l'enseignement.)
Il en existe d'autres qui sont téléchargeable gratuitement. Par exemple :
- concapp http://vlc.polyu.edu.hk/pub/concapp/concapp.htm
Sur l'utilisation des concordanciers pour les études littéraires (avec une présentation comparative de plusieurs concordanciers) voir Using a Concordancer in Literary Studies by Maria Rosario Caballero Rodriguez published in The European English Messenger Vol VII/2 pp 59-62, Autumn 1999

Manipulations

Les manipulations suivantes doivent être réalisées par chaque groupe, et les résultats remis à l'enseignant à l'issue de la séance.

1. Lancer le concordancier ( Z:/Taln/Concordance/MonoConc/Monopro.exe ).
  (Si le fichier n'apparait pas dans l'explorateur, aller dans le Menu Affichage | Options et cocher "Afficher tous les fichiers". Vérifier également que "Masquer les extension pour les types de fichiers connus" n'est pas cochée, pour que les extensions s'affichent)
2. Charger le fichier Y:/Amsili/Hugo_ane.txt (Menu File | Load corpus )
3. Essayer les différentes fonctionnalités : affichage des concordances (Menu Concordance | Search ou Advance Search + Sort) , tris par fréquence des mots, (Menu Frequency | Corpus frequency data | frequency order ou alphabetical order ), affichage des collocations (Menu Frequency | Collocate frequency data), distribution d'un terme dans le coprus (Menu Display | Distribution...
  1. Donner le nombre d'occurence du mot "Kant" dans ce texte
  2. Relever une phrase complète dans laquelle le mot ne est suivi de l'adjectif libre
  3. Combien trouve-t-on d'occurence de la forme négative ne? Combien trouve-t-on de séquence ne un_mot_quelconque pas?
  4. Comparer la distribution du mot âne et du mot homme
1. Lancer Internet Explorer ou Netscape, et choisir un texte parmi ceux qui sont proposés sur le site http://cedric.cnam.fr/ABU/BIB/index.html.
2. Sauvegarder l'oeuvre choisie au format texte seul. (Cliquer sur Texte complet - en bas à droite, puis sur HTML pour visualiser le texte au format HTML. Aller ensuite dans le Menu Fichier | Enregistrer sous du browser, pour enregistrer une version texte (.txt).
3. Décharger le corpus precédent (Menu File | Unload corpus )
4. Charger l'oeuvre que vous venez d'enregistrer sur votre ordinateur de travail.
5. Donner les 10 mots pleins les plus fréquents.
6. Relever les collocations pertinentes pour 5 de ces mots.
7. Donner le nombre d'occurrences (en pourcentage), du mot en suivi par un participe présent.