Enseignements P. Amsili (Master Sciences Cognitives)

LC2-2 : Interface syntaxe-linguistique computationnelle

Vendredi 14h00-16h00, salle 242 (MSH)
planning en ligne
Premier cours le 01 décembre 2006, dernier cours le 05 janvier (?)
Planning sujet à modification.

L'objectif de ce cours est d'établir un lien entre les problématiques du traitement automatique des langues (TAL, ou encore linguistique computationnelle) et celles de la linguistique formelle (syntaxe et sémantique). Pour cela, après un panorama rapide sur le domaine du TAL, on s'attachera à l'étude de quelques outils formels (mathématiques) qui se trouvent avoir une pertinence à la fois dans le domaine du TAL et dans celui de la linguistique formelle. Le domaine étant vaste, on choisira quelques points de vue particuliers. Ce choix pourra être discuté en fonction des intérêts de l'auditoire.

Plan indicatif

Panorama Transparents
Ch1. Grammaires formelles et problème du parsing
1. Langages formels (poly)
2. Grammaires formelles (exercices)
3. Problème du parsing (poly)
Ch2. Compositionalité et interface syntaxe-sémantique
1. Problème de compositionalité
2. Lambda-calcul
3. Vers la grammaire de Montague
4. Quelques mots sur les quantificateurs généralisés

Contrôles

Un devoir sur table, en temps limité.
La note attribuée comptera (au pro-rata du volume horaire) pour la note finale de l'ECUE LC2.

À titre indicatif, voici l'énoncé de l'examen de 2004-05, et ici celui de 2005-06.

Bibliographie

Pour un panorama du domaine du TAL, l'une des meilleures synthèses est sans doute (Jurafsky & Martin, 2000). En français, on pourra consulter (Fuchs et al., 1993 ; Bouillon et al., 1998).
En ce qui concerne les grammaires formelles, en particulier pour les linguistes, (Partee et al., 1993) couvre très bien le domaine, bien que d'une façon un peu superficielle.
Le problème du parsing est traité surtout dans des ouvrages consacrés à la compilation, en particulier dans les fameux "dragon books", écrits par Aho, Sethi et Ullman.
Le problème de compositionnalité, et sa mise en oeuvre avec le lambda-calcul, sont détaillés de façon satisfaisante dans (Partee et al., 1993). On peut aussi citer (Galmiche, 1991), qui constitue une bonne introduction en français au programme montagovien. Enfin, on trouve sur le web deux cours de sémantique computationnelle qui recouvent une bonne partie de ce qui a été vu au chapitre 2 : le plus ancien est celui proposé par Patrick Blackburn et Johan Bos, voir ici, très pédagogique, mais celui-ci, plus récent, et dans le même esprit, n'est pas mal non plus.

A. Aho, R. Sethi & J. Ullman : Compilateurs, principes, techniques et outils, Interéditions, 1989
Pierrette Bouillon (avec la collaboration de Françoise Vandooren, Lyne Da Sylva, Laurence Jacqmin, Sabine Lehmann, Graham Russell et Evelyne Viegas), Traitement automatique du langage naturel Aupelf-Uref - Éditions Duculot, 1998.
Catherine Fuchs, Laurence Danlos, Anne Lacheret-Dujour, Daniel Luzzati et Bernard Victorri. Linguistique et traitements automatiques des langues. Paris: Hachette, 1993
Michel Galmiche, Sémantique linguistique et logique, PUF (Paris), 1991.
Roland Hausser, Foundations of Computational Linguistics, Springer, 2001.
Jurafsky, Daniel & James H. Martin. 2000. Speech and language Processing. An Introduction to natural Language Processing. New Jersey: Prentice Hall.
Barbara Partee, Alice ter Meulen & Robert E. Wall, Mathematical Methods in Linguistics, Kluwer Academic Publishers, 1993.

November 30 2006