table {line-height: inherit;} img {-moz-force-broken-image-icon: 1;} .EDITOR div.GOOGLE\_HEADER {min-height: 2em; position:static;} .EDITOR div.GOOGLE\_FOOTER {min-height: 2em; position:static;}

Ingéniérie des langues et de la parole

Speech and Language Engineering

Resp. : Laurent Besacier, Christian Boitet

Laurent.besacier@imag.fr , Christian.Boitet@imag.fr

 

Vendredi 13h30-16h45 F118 UFRIMA

 

Pré-requis : Connaissances de base en informatique et mathématiques

Résumé

Les cours qui composent ce parcours offrent un ensemble théorique de haut niveau qui couvre le domaine de l’ingénierie des langues et de la parole. Les méthodes avancées d’analyse de signal de parole et les applications de technologies vocales associées sont tout d’abord présentées. Ensuite, le traitement automatique du langage naturel est abordé du double point de vue des méthodes empiriques d’une part, et des méthodes expertes (linguistiques et sémantiques) d’autre part. Enfin, un panorama d’applications est présenté : interaction, contenus et systèmes d’information multilingues. Ce cours s'adresse à tous les étudiants désireux d'utiliser ou de mener des recherches sur les domaines du traitement automatique de la langue écrite et parlée.

Plan

1.    Parole et technologies vocales (6h, Laurent Besacier)

1.  Analyse et modélisation du signal de parole 3/10 en F118 (13h30-16h45)

2.  Technologies vocales 10/10 (13h30-16h45)

 

2.    Méthodes empiriques pour le traitement automatique du langage naturel (7h30, Laurent Besacier)

1.   Théorie de l’information et probabilités 17/10 (13h30-16h45)

2.   SEMINAIRE sur les méthodes par l'exemple en traduction automatique 24/10 (13h30-15h, Christian Boitet)

3.   Modélisation probabiliste du langage 7/11 (13h30-15h)

4.   Introduction à la traduction automatique probabiliste 7/11 (15h15-16h45)

 

3.  Méthodes expertes pour le traitement automatique du langage naturel (10h30, Christian Boitet)

1.   SEMINAIRE sur la présentation et le résumé d'informations multilingues 14/11 (14h-15h30, Bruno Pouliquen)

2.   Buts du TALN, applications principales, notions de base sur les corpus 14/11 (16h00-17h30)

3.   Notions linguistiques de base (de la morphologie à la pragmatique) 21/11 (13h30-15h)

4.   Formalisations des énoncés (de la morphologie à la sémantique) en TALN 21/11 (15h15-16h45)

5.   Outils symboliques, algorithmes et langages spécialisés Me 26/11 en F109 (9h45-16h45) !!

6.   Introduction à la traduction automatique experte (fondée sur des connaissances explicites) Je 4/12 en F113 (9h45-13h) !!

 

4.  Informatique multilingue (6h, G. Serasset & Hervé Blanchon) 12/12 et 19/12

1.   Représentation des textes (codage, tri, recherche)

2.   Interaction multilingue (désambiguïsation interactive pour la TAO de l'écrit et de l'oral)

3.   Contenus multilingues (recherche d’information multilingue et translingue)

4.   Systèmes d’information multilingues (localisation / multilinguïsation)

Références bibliographiques

 

[1] Pierrel (éd.) J.-M. (2000) Ingénierie des langues. In Hermès, Paris, 354 p. (Ouvrage collectif)

[2] Vauquois B. (1988) BERNARD VAUQUOIS et la TAO, vingt-cinq ans de Traduction Automatique, ANALECTES. BERNARD VAUQUOIS and MT, twenty-five years of MT. C. Boitet, ed., Ass. Champollion & GETA, Grenoble, pp. 700.

[3] Boitet C. (1996) (Human-Aided) Machine Translation: a better future? In "Survey of the State of the Art of Human Language Technology", R. Cole (Editor-in-Chief), J. Mariani, H. Uszkoreit& al., ed., A. Z. G. Varile, Giardini, Pisa, pp. 251—256. (also available since 1996 at http://www.cse.ogi.edu/CSLU/HLTsurvey/)

[4] T. Schultz & K. Kirchhoff, Multilingual Speech Processing, Academic Press, 2006.

[5] "La parole : du signal à son interprétation", J.P. Haton & al., Dunod, 2006.

 

 

Travaux pratiques de Laurent Besacier pour note contrôle continu (en réaliser 1 au choix… travailler seul… CR à rendre)

 

1) Traitement et Analyse du signal de parole

 

2) Utilisation de modèles de langage statistiques pour la reconnaissance automatique de la langue d'un texte

 

3) Re-ponctuation et re-capitalisation probabilistes

 

4) “Recettes” pour la construction rapide d’un système de traduction automatique statistique fondé sur les séquences (phrase-based translation)

 

Evaluation :

 

Une note composite construite à partir d’un examen écrit (coeff. 2) et une note de CR de TP (2 TP rendus sur l’UE)

 

1/3