Benoît Crabbé

  • Maître de conférence
  • Areas : Computational Linguistics ; Computational syntax
  • Computational linguistics programme at Paris 7
  • This page is intentionnaly written in Franglish.


    Research

    My research activities are driven towards experimental linguistics. I try to better understand word order phenomena (word order alternations) by means of statistical and probabilistic modelling. I keep interested in developping resources supporting experimental linguistics research for French.

    Experimental linguistics (and computational psycholinguistics)

    • Prédire la position des adjectifs épithètes en français. Lingvisticae Investigationes. (in revision) (with J. Thuilier, G. Fox)
    • Do animate arguments come first? Conference Architectures and Mechanisms for Language Process (with J. Thuilier, A. Abeillé)(AMLAP 2011). Paris. septembre 2011
    • Testing the robustness of online word segmentation: effects of linguistic diversity and phonetic variation. (with L. Boruta, S. Peperkamp, E. Dupoux) ACL/HLT CMCL workshop, 2011.
    • Préférences concernant l'ordre relatif des compléments du verbe en français (with A. Abeillé, J. Thuilier) AFLS 2011
    • Fréquence, longueur et préférences lexicales dans le choix de la position de l'adjectif épithète en français. (with J. Thuilier, G. Fox) CMLF 2010.
    • Approche quantitative en syntaxe : l'exemple de l'alternance de position de l'adjectif épithète en français. TALN 2010 (with J. Thuilier, G. Fox)
    • Alternating the position of adjectives in French : an item based phenomenon, Competing Motivations at MPI Leipzig,(with J. Thuilier, G. Fox) 2010.

    I also organised a reading group in experimental linguistics (with A. Abeillé , D. Godard) (link here 2012) (link here 2011)

    Probabilistic statistical parsing

    • Expériences d'analyse syntaxique du Français (with M. Candito), TALN, 2008.
    • Analyse syntaxique du français : des constituants aux dépendances (with M. Candito, P. Denis, F. Guerin) TALN 2009
    • On statistical parsing of French with supervised and semi-supervised strategies, (with M. Candito, D. Seddah), GICL at EACL 2009.
    • Improving generative statistical parsing with semi-supervised word clustering (with M. Candito),IWPT, 2009.
    • Crossparser evaluation and tagset variation: a French treebank study.(with M. Candito, D. Seddah) IWPT 2010
    • Statistical French dependency parsing: treebank conversion and first results (with M. Candito and P. Denis), LREC 2010

    Deep Parsing (selected publications)

    • Extensible Metagrammar, (with D. Duchier, C. Gardent, J. Le Roux, Y. Parmentier), Computational linguistics, in revision.
    • Grammatical Development with XMG, Logical Aspects of Computational Linguistics,2005.
    • Metagrammar Redux (with D. Duchier), Constraint Solving and Language Processing,2004.
    • Représentation et gestion du lexique d'une grammaire d'arbres adjoints (with B. Gaiffe and Azim Roussanaly), Traitement Automatique des Langues, 43,3, 2004
    • Représentation informatique de grammaires d'arbres fortement lexicalisées : le cas de la grammaire d'arbres adjoints. Thèse de doctorat (informatique), Université Nancy 2), 2005

    Students

    Phd
    Master
    • P. Magistry
    • L. Boruta(with E. Dupoux, S. Peperkamp)
    • A. Gutman (MPRI, with A. Christophe)

    Software and ressources

    • eXtensible MetaGrammar (XMG) (link)
    • A French Tree Adjoining Grammar expressed in XMG with a small lexicon ready to use with the Tuebingen TT-MCTAG parser (will be supplied soon)
    • Some bits of docs on the French Grammar (link)
    • A statistical French Grammar extracted from the French Treebank to be used with the Berkeley parser (with M. Candito, to be supplied soon)

    Enseignement

    • Méthodes à états finis pour l'Extraction d'information, M2 Linguistique informatique (Lien)
    • Méthodes probabilistes pour le traitement automatique des langues M1 Linguistique informatique (Lien)
    • Introduction à la programmation L3 Linguistique informatique (Lien)
    • Linguistique de corpus L3 LI et LTD (Lien)
    Téléphone : +33 (0)1 57 27 57 46
    Fax : +33 (0)1 57 27 57 81
    Email : Prenom.Nom@linguist.jussieu.fr
    Addresse Postale:
    UFR de Linguistique,
    Université Paris 7
    Case 7003
    2, Place Jussieu
    F-75251 PARIS cedex 05
    Addresse terrestre:
    UFR de Linguistique
    Pièce 166, 1er étage
    30, rue du Château des Rentiers
    F-75013 PARIS