LI3241 : Syntaxe et sémantique des langages formels

CM: Mardi 14-16h, Salle 105 îlot Jussieu ; TD Jeudi 14h30-16h30, Salle J6.
Premier cours : 27 septembre 2004
Séances annulées les 05 octobre, 14 décembre.
Pas de séance le 11 novembre

On présentera dans ce cours les bases avancées de la théorie des langages formels, aussi bien du point de vue mathématique que des points de vue informatique et linguistique. On y évoquera : les machines à états finis (machine de Turing, automates...) ; les langages réguliers ; les grammaires formelles et la hiérarchie de Chomsky ; les notions de décidabilité, énumérabilité ; le problème et les algorithmes de parsing ; la traduction dirigée par la syntaxe.

 

Contrôle

Modalités
  • Contrôle continu : un devoir sur table (mi-semestre, 40%) et une épreuve écrite (session d'examen de janvier, 60%).
  • Contrôle final : une épreuve écrite pendant la session d'examen de janvier-février (100%). 
  • Session de rattrapage (sept.) : pour tous : une épreuve écrite pendant la session d'examen de septembre (100%). 
  • Aucune note n'est conservée entre février et septembre
Calendrier
  • Devoir sur table n° 1 : jeudi 18 novembre horaire et salle habituels (2h d'épreuve, sans documents)
  • Epreuve facultative de rattrapage : à rendre par courier électronique avant le Vendredi 21 janvier 2005
  • Examen final et cc n° 2 (pour tous les étudiants) :
    Mardi 25 janvier 14h00-17h00, salle 105 IJ
  • Session de septembre :
    Jeudi 8 septembre, 13h00 à 16h00, salle J5 patio 14/25.
 

Plan indicatif

  • Ch 0 : Introduction : les problèmes liés aux langages formels
  • Ch 1 : Langages rationnels
    • Transformation d'automates (TD)
    • Propriétés de fermeture, théorème de Kleene (TD)
  • Ch 2 : Langages algébriques
    • Grammaires hors-contexte et transformation de grammaires (TD)
    • Automates à pile
  • Ch 3 : Machines de Turing
  • Ch 4 : Problème de parsing
    • Algorithmes naïfs
    • Analyse prédictive (TD+poly)
    • Parsing tabulaire
  • Ch 5 : Traduction dirigée par la syntaxe (TD, poly)
  • Ch 6 : Lex & Yacc (essentiellement TP)
 


 

Bibliographie (en travaux)

Généralités. Les ouvrages de Alfred Aho et Jerry Ullman, presque tous traduits en français, constituent une source excellente pour tous les sujets vus dans ce cours. Mais on pourra aussi consulter avec profit l'excellent manuel (Partee, ter Meulen & Wall 93), qui traite tous les aspects de ce cours (sauf la traduction dirigée par la syntaxe et la compilation), d'une façon moins complète, mais souvent mise en perspective par rapport au traitement du langage naturel.

Les bases des automates sont présentées, avec des exercices, dans le chapitre 17 de (Partee, ter Meulen & Wall, 93), mais les algorithmes vus en cours n'y sont pas présentés. Les algorithmes de minimisation, déterminisation, élimination des epsilon-transitions sont présentés dans (Hopcroft & Ullman, 79). L'algorithme de conversion d'une expression rationnelle en automate est décrit dans tous les manuels ; celui qui convertit un automate en expression rationnelle (algorithme de Mac Naughton et Yamada) est décrit dans (Autebert 87, pp. 88) (d'une façon assez technique).

Les grammaires formelles sont traitées dans une multitude d'ouvrages.

  • Jean-Marie Autebert, Langages algébriques, Masson (Paris), 1987.
  • Barbara Partee, Alice ter Meulen & Robert E. Wall, Mathematical Methods in Linguistics, Kluwer Academic Publishers, 1993.
  • J.E. Hopcroft and Jerry D. Ullman, Introdduction to Automata Theory, Languages, and Computation, Addison Wesley Publishing Co. (Reading, Ma), 1979.
  • A. Aho, R. Sethi & J. Ullman : Compilateurs, principes, techniques et outils, Interéditions, 1989.
  • D. Jurafsky & J. Martin : Speech and Language Processing, Prentice Hall, 2000.
  • A. Aho & J. Ullman : The Theory of Parsing, Translation, and Compiling, Prentice Hall, 1972.
     
  • A. Aho & J. Ullman : Concepts fondamentaux de l'informatique, Dunod, 1992.

http://www.linguist.jussieu.fr/~amsili/Ens05/LI032EX.html Tue Sep 13, 2005 Ma maison-page