LC2-2 : Interface syntaxe-linguistique computationnelle

Vendredi 16h00-18h00, salle 241 (MSH)
planning en ligne
Premier cours le 18 novembre, dernier cours le 13 janvier
Pas de séance le 9 décembre
Contrôle (devoir sur table) le 20 janvier 2006, horaires habituels.

L'objectif de ce cours est d'établir un lien entre les problématiques du traitement automatique des langues (TAL, ou encore linguistique computationnelle) et celles de la linguistique formelle (syntaxe et sémantique). Pour cela, après un panorama rapide sur le domaine du TAL, on s'attachera à l'étude de quelques outils formels (mathématiques) qui se trouvent avoir une pertinence à la fois dans le domaine du TAL et dans celui de la linguistique formelle. Le domaine étant vaste, on choisira quelques points de vue particuliers. Ce choix pourra être discuté en fonction des intérêts de l'auditoire.



 

Plan indicatif

  • Panorama
  • Ch1. Grammaires formelles et problème du parsing
    1. Langages formels (poly)
    2. Grammaires formelles (exercices)
    3. Problème du parsing (poly)
  • Ch2. Compositionalité et interface syntaxe-sémantique
    1. Problème de compositionalité
    2. Lambda-calcul (poly)
    3. Vers la grammaire de Montague (poly, exercices)
    4. Quelques mots sur les quantificateurs généralisés (poly)
 

Contrôles

Devoir sur table, vendredi 20 janvier 2006, horaires habituels.
La note attribuée comptera (sans doute au pro-rata du volume horaire) pour la note finale de l'ECUE LC2.

À titre indicatif, voici l'énoncé de l'examen de l'année dernière.

 


 

Bibliographie

Pour un panorama du domaine du TAL, l'une des meilleures synthèses est sans doute (Jurafsky & Martin, 2000). En français, on pourra consulter (Fuchs et al., 1993 ; Bouillon et al., 1998).
En ce qui concerne les grammaires formelles, en particulier pour les linguistes, (Partee et al., 1993) couvre très bien le domaine, bien que d'une façon un peu superficielle.
Le problème du parsing est traité surtout dans des ouvrages consacrés à la compilation, en particulier dans les fameux "dragon books", écrits par Aho, Sethi et Ullman.
Le problème de compositionnalité, et sa mise en oeuvre avec le lambda-calcul, sont détaillés de façon satisfaisante dans (Partee et al., 1993). On peut aussi citer (Galmiche, 1991), qui constitue une bonne introduction en français au programme montagovien. Enfin, on trouve sur le web deux cours de sémantique computationnelle qui recouvent une bonne partie de ce qui a été vu au chapitre 3 : le plus ancien est celui proposé par Patrick Blackburn et Johan Bos, voir ici, très pédagogique, mais celui-ci, plus récent, et dans le même esprit, n'est pas mal non plus.
  • A. Aho, R. Sethi & J. Ullman : Compilateurs, principes, techniques et outils, Interéditions, 1989
  • Pierrette Bouillon (avec la collaboration de Françoise Vandooren, Lyne Da Sylva, Laurence Jacqmin, Sabine Lehmann, Graham Russell et Evelyne Viegas), Traitement automatique du langage naturel Aupelf-Uref - Éditions Duculot, 1998.
  • Catherine Fuchs, Laurence Danlos, Anne Lacheret-Dujour, Daniel Luzzati et Bernard Victorri. Linguistique et traitements automatiques des langues. Paris: Hachette, 1993
  • Michel Galmiche, Sémantique linguistique et logique, PUF (Paris), 1991.
  • Roland Hausser, Foundations of Computational Linguistics, Springer, 2001.
  • Jurafsky, Daniel & James H. Martin. 2000. Speech and language Processing. An Introduction to natural Language Processing. New Jersey: Prentice Hall.
  • Barbara Partee, Alice ter Meulen & Robert E. Wall, Mathematical Methods in Linguistics, Kluwer Academic Publishers, 1993.

Ma maison-page January 13 2006