Brève présentation de mes activités de recherche

  • Contexte
    • Mes travaux visent à résoudre des aspects différents d’un problème générique, celui de la communication interpersonnelle multilingue médiatisée par la machine.
    • Ils concernent :
      1. la communication interpersonnelle multilingue écrite, réfléchie et tout terrain (TAFD) médiatisée par la machine abordée dans le cadre du projet LIDIA (projet d'équipe), et
      2. la communication interpersonnelle multilingue orale, spontanée et spécialisée (TAP) médiatisée par la machine abordée dans le cadre des projets C-STAR et NESPOLE!.
    • Dans les deux cas, il s’agit toujours de combattre le bruit et l’ambiguïté, de construire des systèmes génériques facilement spécialisables à des situations particulières, et d’évaluer soit des systèmes, soit des architectures.
  • Axes de recherche
    • Traduction Automatisée Fondée sur le Dialogue (TAFD)
      • En TAFD, mes centres d'intérêt sont :
        • – l'architecture informatique des systèmes de traduction interactive
        • – la désambiguïsation Interactive
        • – le concept de Documents Auto-Explicatifs
    • Traduction de Parole (TAP)
      • En TAP, en plus de l'animation des projets C-STAR II et NESPOLE!, je me suis intéressé à l'analyse d'entrée "bruitée" vers un pivot sémantique. Je m'y intéresse aussi, avec Laurent Besacier, dans le cadre de nos participations aux campagnes d'évaluation compétitive IWSLT.
    • Post-édition collaborative à travers le Web pour l'accès et la diffusion multilingue
      • Dans la lignée du Web 2.0, avec Christian Boitet, Valérie Bellynck et différents thésards nous travaillons sur le concept de post-édition collaborative à travers le Web qui permet d'organiser le travail collaboratif de communautés pour la diffusion et l'accès multilingue. Ces communautés post-éditent des résultats produits par des systèmes de traduction automatique pour des documents segmentés en unités de traduction. Une première version d'un tel environnement (Secrtra_w) a été réalisé qui sert de dorsal à un service d'accès multilingue à des sites Web (voir AXiMAG dans la rubrique projets).
    • Évaluation des systèmes de traduction automatique
      • En plus d'une veille importante des méthodes d'évaluation des systèmes de TA, je travaille, avec Christian Boitet et Emmanuelle Esperança-Rodier, sur des protocoles fondés sur la tâche en opposition aux méthodes évaluant des résultats bruts en dehors de tout contexte d'usage comme le font les variantes des méthodes fondées sur des traductions de référence (BLEU, NIST, ...).
    • Traduction emprique & hybride
      • Dans le cadre d'une nouvelle activité, conduite avec Laurent Besacier, nous nous intéressons à l'amélioration des méthodes actuelles mises en œuvre dans le domaine, en particulier dans le cadre des campagnes IWSLT (utilisation de données annotées). Dans le cadre de la thèse de Marion Potet nous avons aussi interrogé l'idée de la post-édition automatique statistique. Dans le cadre de la thèse de Marwen Azouzi nous nous intéressons à la traduction automatique statistique de données métier.