Enseignements P. Amsili (Master Sciences Cognitives)

LC2-2 : Interface syntaxe-linguistique computationnelle

Mercredi 18h30-20h30, Salle à vérifier ici, nouvelle version ICI
Premier cours : 03 novembre 2004. 6 séances.
2 séance ajoutées en janvier : 05/01 et 12/01.

L'objectif de ce cours est d'établir un lien entre les problématiques du traitement automatique des langues (TAL, ou encore linguistique computationnelle) et celles de la linguistique formelle (syntaxe et sémantique). Pour cela, après un panorama rapide sur le domaine du TAL, on s'attachera à l'étude de quelques outils formels (mathématiques) qui se trouvent avoir une pertinence à la fois dans le domaine du TAL et dans celui de la linguistique formelle. Le domaine étant vaste, on choisira quelques points de vue particuliers. Ce choix pourra être discuté en fonction des intérêts de l'auditoire.

Plan indicatif

Ch1. Panorama Transparents
Ch2. Grammaires formelles et problème du parsing
1. Langages formels (poly)
2. Grammaires formelles (exercices)
3. Compilation
4. Problème du parsing (poly)
Ch3. Compositionnalité et interface syntaxe-sémantique
1. Principe de compositionalité
2. Lambda-calcul (poly)
3. Grammaire de Montague (poly)
Quelques exercices pour réviser

Contrôles

Devoir sur table, mercredi 12 janvier 2005, horaires habituels.
La note attribuée comptera (sans doute au pro-rata du volume horaire) pour la note finale de l'ECUE LC2.

Annales : Il n'y a pas à proprement parler d'annales pour ce cours nouveau en 2004/05. Voir cependant ma page d'archives.

Bibliographie

Pour un panorama du domaine du TAL, l'une des meilleures synthèses est sans doute (Jurafsky & Martin, 2000). En français, on pourra consulter (Fuchs et al., 1993 ; Bouillon et al., 1998).
En ce qui concerne les grammaires formelles, en particulier pour les linguistes, (Partee et al., 1993) couvre très bien le domaine, bien que d'une façon un peu superficielle.
Le problème du parsing est traité surtout dans des ouvrages consacrés à la compilation, en particulier dans les fameux "dragon books", écrits par Aho, Sethi et Ullman.
Le problème de compositionnalité, et sa mise en oeuvre avec le lambda-calcul, sont détaillés de façon satisfaisante dans (Partee et al., 1993). On peut aussi citer (Galmiche, 1991), qui constitue une bonne introduction en français au programme montagovien. Enfin, on trouve sur le web deux cours de sémantique computationnelle qui recouvent une bonne partie de ce qui a été vu au chapitre 3 : le plus ancien est celui proposé par Patrick Blackburn et Johan Bos, voir ici, très pédagogique, mais celui-ci, plus récent, et dans le même esprit, n'est pas mal non plus.

A. Aho, R. Sethi & J. Ullman : Compilateurs, principes, techniques et outils, Interéditions, 1989
Pierrette Bouillon (avec la collaboration de Françoise Vandooren, Lyne Da Sylva, Laurence Jacqmin, Sabine Lehmann, Graham Russell et Evelyne Viegas), Traitement automatique du langage naturel Aupelf-Uref - Éditions Duculot, 1998.
Catherine Fuchs, Laurence Danlos, Anne Lacheret-Dujour, Daniel Luzzati et Bernard Victorri. Linguistique et traitements automatiques des langues. Paris: Hachette, 1993
Michel Galmiche, Sémantique linguistique et logique, PUF (Paris), 1991.
Roland Hausser, Foundations of Computational Linguistics, Springer, 2001.
Jurafsky, Daniel & James H. Martin. 2000. Speech and language Processing. An Introduction to natural Language Processing. New Jersey: Prentice Hall.
Barbara Partee, Alice ter Meulen & Robert E. Wall, Mathematical Methods in Linguistics, Kluwer Academic Publishers, 1993.

Mon Jan 10, 2005