TP05: Utilisation d'un concordancier

Une concordance, dans sa forme la plus simple, est une liste alphabétique des mots d'un texte, donnés avec les contextes dans lesquels ils apparaissent. Le plus souvent on représente les mots sous la forme d'un index KWIC (KeyWord In Context), dans lequel chaque mot est centré dans une fenêtre de taille fixe (cf. figure 1).

taste it is that such poor cattle always have in their mouths
of sparing the poor child the inheritance of any part of
small property of my poor father, whom I never saw--so long
desolate, while your poor heart pined away, weep for it
Miss, if the poor lady had suffered so intensely
the love of my poor mother hid his torture from me
stockings, and all his poor tatters of clothes, had, in a long
faded away into a poor weak stain. So sunken and
on your way to the poor wronged gentleman, and, with a
detachment from the poor young lady, by laying a brawny hand
Fig. 1 - Concordance de poor dans A Tale of Two Cities (Dickens)

Un concordancier est donc un programme permettant de réaliser de telles listes sur un corpus de son choix. En général, les concordanciers donnent aussi diverses informations statistiques sur le corpus traité.

Références

Manipulations

Les manipulations suivantes doivent être réalisées par chaque groupe, et les résultats remis à l'enseignant à l'issue de la séance.

    1. Lancer le concordancier ( Z:/Taln/Concordance/MonoConc/Monopro.exe ).
      (Si le fichier n'apparait pas dans l'explorateur, aller dans le Menu Affichage | Options et cocher "Afficher tous les fichiers". Vérifier également que "Masquer les extension pour les types de fichiers connus" n'est pas cochée, pour que les extensions s'affichent)
    2. Charger le fichier Y:/Amsili/Hugo_ane.txt (Menu File | Load corpus )
    3. Essayer les différentes fonctionnalités : affichage des concordances (Menu Concordance | Search ou Advance Search + Sort) , tris par fréquence des mots, (Menu Frequency | Corpus frequency data | frequency order ou alphabetical order ), affichage des collocations (Menu Frequency | Collocate frequency data), distribution d'un terme dans le coprus (Menu Display | Distribution...
      1. Donner le nombre d'occurence du mot "Kant" dans ce texte
      2. Relever une phrase complète dans laquelle le mot ne est suivi de l'adjectif libre
      3. Combien trouve-t-on d'occurence de la forme négative ne? Combien trouve-t-on de séquence ne un_mot_quelconque pas?
      4. Comparer la distribution du mot âne et du mot homme
    1. Lancer Internet Explorer ou Netscape, et choisir un texte parmi ceux qui sont proposés sur le site http://cedric.cnam.fr/ABU/BIB/index.html.
    2. Sauvegarder l'oeuvre choisie au format texte seul. (Cliquer sur Texte complet - en bas à droite, puis sur HTML pour visualiser le texte au format HTML. Aller ensuite dans le Menu Fichier | Enregistrer sous du browser, pour enregistrer une version texte (.txt).
    3. Décharger le corpus precédent (Menu File | Unload corpus )
    4. Charger l'oeuvre que vous venez d'enregistrer sur votre ordinateur de travail.
    5. Donner les 10 mots pleins les plus fréquents.
    6. Relever les collocations pertinentes pour 5 de ces mots.
    7. Donner le nombre d'occurrences (en pourcentage), du mot en suivi par un participe présent.