Marié, 2 enfants
Maître de Conférence à l’Université J. Fourier, HDR
Laboratoire d’Informatique de Grenoble, équipe GETALP
UJF BP53 38041 Grenoble Cedex 9
Tel : 0476635695
Laurent.Besacier@imag.fr
Curriculum
Vitae
Ce document est une synthèse de mon parcours et comprend, outre un résumé succinct des positions professionnelles que j'ai occupées et de mes diplômes (section 1), une description détaillée des encadrements d'étudiants réalisés (section 2), des projets nationaux et internationaux que j'ai encadrés ou auxquels j'ai participé (section 3). Il dresse ensuite une liste de mes activités scientifiques (section 4), de mes enseignements (section 5) et de mes publications (section 6).
1.1
Positions occupées
1.2
Diplômes
1.3 Domaines de recherche (Mots clés)
·
Traitement automatique du langage parlé
o
Reconnaissance automatique de la parole (aspects
multilingues, accents, langues peu dotées)
o
Traduction automatique de parole (méthodes statistiques)
·
Traitement des signaux audio et de parole
o
Extraction et analyse d’éléments non linguistiques
(locuteurs, sons)
o
Analyse de la parole multimodale
o
Reconnaissance et segmentation en locuteurs
2.1 Résumé
|
|
Thèses soutenues |
Thèses en cours |
DEA ou MASTER-R |
|
Encadrement
total |
3 |
1 |
7 |
|
Co-encadrement |
6 |
2 |
2 |
|
Total / école
doctorale (ou master) |
3 EDMI |
2.2 Thèses de doctorat
Encadrement partiel
-C. Nguyen[7] (taux d’encadrement :
30%) : Reconnaissance automatique de la parole en langue vietnamienne.
Doctorat de l’INPG, école doctorale EEATS Grenoble, thèse soutenue en
Juin 2002.
-D.
Vaufreydaz[8] (taux d’encadrement :
50%) : Modélisation statistique du langage à partir d'Internet pour la
reconnaissance automatique de la parole continue. Doctorat de l’Université
J. Fourier, école doctorale EDMI Grenoble, thèse soutenue en Janvier
2002.
-D. Istrate[9] (taux d’encadrement :
50%) : Détection et Reconnaissance des Sons pour la Surveillance
Médicale. Doctorat de l’INPG, école doctorale EEATS Grenoble, thèse
soutenue en Décembre 2003.
-V-B Le (taux
d’encadrement : 70%) : Reconnaissance automatique de la parole
pour des langues peu dotées. Doctorat de l’Université J. Fourier, école
doctorale EDMI Grenoble, thèse soutenue le 1er Juin 2006.
-Q. Vu-Minh
(taux d’encadrement : 50%) : Détection de zones d’intérêt
intonatives dans un flux audio. Doctorat de l’INPG, école doctorale EEATS
Grenoble, thèse soutenue le 20 Septembre 2007.
-N. Aboutabit (taux d’encadrement : 30%) : Modélisation et reconnaissance des mouvements du langage parlé complété, Doctorat de l’INPG, école doctorale EEATS Grenoble, thèse soutenue le 11 Décembre 2007.
-S. Seng
(taux d’encadrement : 70%) : Approche multi-niveaux pour la
modélisation statistique du langage. Doctorat de l’Université J. Fourier,
école doctorale EDMI Grenoble, soutenance prévue en 2009.
-D. Do (taux
d’encadrement : 60%) : Traduction automatique de parole pour
les langues peu dotées. Doctorat de l’INPG, école doctorale EDMI Grenoble,
soutenance prévue en 2010.
Encadrement total
-D. Moraru[10] : Segmentation en
locuteurs de documents audios et audiovisuels : application à la recherche d'information
multimédia. Doctorat de l’INPG, école doctorale EEATS Grenoble, thèse
soutenue en Décembre 2004.
-P. Mayorga[11] : Reconnaissance
vocale dans un contexte de voix sur IP : diagnostic et propositions.
Doctorat de l’INPG, école doctorale EEATS Grenoble, thèse soutenue en
Janvier 2005.
-T.T.
Ping : Modélisation des locuteurs non natifs pour la reconnaissance
automatique de la parole. Doctorat de l’Université J. Fourier, école
doctorale EDMI Grenoble, thèse soutenue le 3 juillet 2008.
-S.
Sam : Modèles acoustiques multilingues à large couverture pour le
traitement automatique de la parole. Doctorat de l’INPG, école doctorale
EDMI Grenoble, soutenance prévue en 2010.
2.3 DEA ou Masters Recherche
-C.
Bergamini : Modèle acoustique dépendant du contexte pour la
reconnaissance automatique de la parole. DEA Informatique Systèmes
Communication. Université J. Fourier, Grenoble. Juin 2000. Mention B.
-R.
Lamy : Adaptation de modèles acoustiques et traitement des vecteurs
acoustiques pour la reconnaissance automatique de la parole téléphonique.
DEA Informatique Systèmes Communication. Université J. Fourier, Grenoble. Juin
2001. Mention B.
-D.
Moraru : Segmentation de signaux en locuteurs. DEA Signal Image
Parole Telecom. INPG, Grenoble. Juin 2001. Mention B.
-V-B.
Le : Reconnaissance automatique de mots clés en anglais en conditions
bruitées. DEA Informatique Systèmes Communication. Université J. Fourier,
Grenoble. Juin 2002. Mention AB.
-Q.
Vu-Minh : Meilleur Interfaçage Reconnaissance / Analyse pour la Traduction de Parole. DEA
Informatique Systèmes Communication. Université J. Fourier, Grenoble. Juin
2003. Mention AB.
-B. Senechal[12] : Etude de
signatures audio-vidéo pour la recherche d’invariants de production.
Master-R Signal Image Parole Telecom. INPG, Grenoble. Juin 2004. Mention AB.
-A. Mahdhaoui : Contributions à la traduction de parole arabe-anglais. Master-R ICPS, UPMF. Juin 2007. Mention AB.
-A. Ben Youcef : Méthodes mixtes pour la traduction automatique de parole. Master-R IDL, Univ. Stendhal. Juillet 2008. Mention TB.
-J-B
Faddoul : Capitalizing Machine Translation & Preserving Tags and
Parentheses. Master-R Informatique, Université J. Fourier, Grenoble, Juin
2008. Mention AB.
3.1 Projets Internationaux
Achevés
Participation au projet
Européen M2VTS (1998/1999)
Pendant mon post-doctorat dans
l’équipe Traitement du Signal de l’Institut de Microtechnique de Neuchâtel
(Suisse, 98/99), je me suis intéressé au portage d’algorithmes de vérification
vocale d’identité sur une plate-forme utilisable en conditions réelles ainsi
qu’à l’évaluation de leurs performances dans ces conditions. Ce travail s’est
effectué dans le cadre du projet européen M2VTS d’authentification multimodale
de personnes.
Participation au projet
Européen NESPOLE & au Consortium C-STAR (1999/2002)
A mon arrivée au CLIPS en 1999,
j’ai été impliqué dans deux projets de traduction automatique de parole dont le
CLIPS était partenaire : CSTAR (Consortium for Speech Translation
Advanced Research) et NESPOLE (Negotiating
Through SPOken Language in E-commerce). Je suis devenu responsable de ces
deux projets pour l’équipe GEOD (dont la contribution était surtout de fournir
l’étage de reconnaissance automatique de la parole). Le but des recherches
menées au sein de ces projets était la traduction automatique de parole
spontanée avec tous les couples de langues possibles entre les différents
partenaires.
Participation à l’action
COST275 (Biometric Person Authentication over the Internet) (2001/2004)
J’ai été impliqué, entre 2001 et
2004, dans l’action européenne COST 275 traitant de la biométrie. J’ai
notamment contribué au sous-groupe « évaluation » de l’action que
j’ai co-animé avec J-F Bonastre du LIA.
Responsable des projets TALK
(Traitement Automatique de la Langue Khmère) et CORUS (Traitement de la parole
en langue vietnamienne) (2002/2005)
Ces deux projets, soutenus respectivement
par l’AUF (Agence Universitaire pour la Francophonie) et par le MAE (Ministère
des Affaires Etrangères), concrétisent une collaboration qui existe entre le
CLIPS, le centre MICA à Hanoï, et (plus récemment) l’Institut de Technologie du
Cambodge (ITC) sur le domaine du traitement automatique du vietnamien et du
khmer. Mon implication dans ces projets concerne la reconnaissance automatique
de la parole pour le vietnamien et le khmer.
Participation au projet DARPA
TRANSTAC (pendant mon séjour à IBM de Septembre 2005 à Novembre 2006)
TRANSTAC (Translation System for Tactical Use) est un projet financé par le
département de défense américain (DARPA). Ce projet évalue notamment les
technologies permettant le déploiement rapide de systèmes de traduction
automatique pour de nouveaux langages ou dialectes, ayant peu de ressources. Le
but du projet était de développer un système de traduction de parole
anglais-arabe dialectal (le dialecte concerné étant celui parlé en Irak). Ma
contribution sur ce projet a concerné surtout la reconnaissance automatique de
l’arabe Irakien et l’interfaçage entre le module de reconnaissance et le module
de traduction.
3.2 Projets nationaux achevés
Reponsable des 3
Contrats : CLIPS/GEOD – Thomson Multimédia 2000-01 ; CLIPS/GEOD –
Prosodie 2000-01 ; CLIPS/GEOD – Thalès 2001-02
La nature de ces trois contrats
était sensiblement la même. Le projet de convention portait sur une expertise
et un développement menés conjointement par le CLIPS et le partenaire
industriel (Thomson, Prosodie ou Thalès) dans le but de réaliser un système de
reconnaissance automatique de la parole et de le comparer à un système de
reconnaissance vocale de référence. La contribution du CLIPS consistait à
accompagner le développement du système au niveau de la réalisation d’un état
de l’art sur la reconnaissance du point de vue des méthodes et des algorithmes,
de l’apport de données d’apprentissage exploitables pour la modélisation
acoustique (étiquetage complet d’une base d’apprentissage), de conseils
techniques dans le développement (choix des paramètres acoustiques, modèles
acoustiques, recherche des hypothèses et modèle de langage), et du suivi
scientifique dans le développement du système de reconnaissance en prenant
comme point d’appui les résultats du système RAPHAEL du CLIPS pour comparer et
valider les résultats à toutes les étapes de la reconnaissance.
Le système propriétaire réalisé
par Prosodie, avec l’aide du CLIPS, est actuellement en exploitation dans
quelques serveurs vocaux interactifs de la société.
Responsable du contrat
CLIPS/GEOD – Université de Karlsruhe 2000-01
Dans le cadre d’un contrat de
coopération avec ISL (Interactive Systems Laboratories) de l'Université de
Karlsruhe pour le développement en commun d'une base de données de parole en
français, nous avons enregistré une large base orale (BRAF100 : Base pour la
Reconnaissance Automatique du Français avec 100 locuteurs – environ 30h de
parole).
Participant au projet RNRT
COUCOU (CLIPS, MSH, CEA, FT-R&D), 2002-05
Le laboratoire CLIPS, en collaboration avec le CNRS,
le CEA (IDEAS LAB), France Telecom, et ST Microelectronics a participé au
projet RNRT COUCOU (Conception participative Orientée Usage de services de
Communication et d’objets Ubiquistes) entre 2002 et 2005. Le but de ce projet
était, entre autres, de spécifier et commencer à implémenter deux salles
intelligentes de réunions (au CEA et au CLIPS) équipées d’outils avancés de
prise de notes et de post-traitement des données enregistrées. Mon implication
sur ce projet a concerné les aspects audio (équipement et traitement) d’une
salle intelligente.
Responsable local du projet
Technolangue AGILE/ALIZE (CLIPS, LIA, DDL, IRISA, IRIT, ENST), 2003-05
Le projet ALIZE consistait à
réaliser une plateforme logiciel libre en vérification automatique du locuteur.
L’objectif était de pérenniser le savoir-faire du consortium ELISA, acquis
grâce à des participations continues aux campagnes d’évaluation NIST depuis
1998, aux entreprises et laboratoires académiques qui souhaiteraient se lancer
dans la vérification automatique du locuteur. La contribution du CLIPS sur ce
projet a concerné la segmentation en locuteurs : participation à des
campagnes d’évaluation (NIST, ESTER) et re-écriture du système existant au
CLIPS en utilisant la plateforme ALIZE.
Participation au projet BQR
INPG 2003 « Vidéo-Sémantique » (CLIPS, LIS, LSR)
Ce projet financé par l’INPG avait
pour but de fédérer les collaborations entre trois laboratoires grenoblois dans
le domaine de l’indexation multimédia. Ma contribution, au sein du CLIPS, a
concerné le traitement automatique de la bande son de documents vidéo et la
participation annuelle aux campagnes d’évaluation TREC-Vidéo (en 2003 et 2004).
Participation au projet BQR
INPG 2004 « TELMA » (CLIPS, LIS, ICP)
Ce projet financé par l’INPG
visait à l’étude et au développement algorithmique de fonctionnalités
audiovisuelles originales à l’usage des personnes malentendantes, et à l’étude
de faisabilité de leur intégration dans un terminal autonome de
télécommunication téléphonique. Le projet avait pour objectif technique précis
d’exploiter la modalité visuelle de la parole, d’une part pour améliorer les
techniques de débruitage du son de
parole (la minimisation du bruit environnemental permettant une meilleure
exploitation des restes auditifs des malentendants), et d’autre part, en
mettant en œuvre des techniques d’analyse/synthèse de lecture labiale et de
gestes de la Langue Française Parlée Complétée (LPC). Une suite de TELMA,
financée par l’ANR a ensuite démarré en 2006.
Responsable local du projet
ACI-SI BIOMUL (CLIPS, EURECOM, LIA, INT), 2004-06
Ce projet était financé par le CNRS sur l’ACI Sécurité
Informatique (BIOMUL : Biométrie et Multimodalités). Dans ce cadre,
j’ai pu accueillir un post-doctorant au CLIPS (Nicolas Eveno, issu du
laboratoire LIS/INPG) pour travailler sur la biométrie labiale bimodale. Nous
avons également abordé au cours de ce projet la problématique de segmentation
en locuteurs dans des environnements perceptifs (salles de réunion
instrumentées).
3.3 Projets en cours
Responsable local du projet
ANR RNTS TELMA (2006-2008)
Ce projet, issu au départ d’un
BQR INPG, vise à l’étude et au développement algorithmique de fonctionnalités
audiovisuelles originales à l’usage des personnes malentendantes, et à l’étude
de faisabilité de leur intégration dans un terminal autonome de
télécommunication téléphonique. Le projet a pour objectif technique précis
d’exploiter la modalité visuelle de la parole, d’une part pour améliorer les
techniques de débruitage du son de parole (la minimisation du bruit
environnemental permettant une meilleure exploitation des restes auditifs des
malentendants), et d’autre part, en mettant en œuvre des techniques
d’analyse/synthèse de lecture labiale et de gestes de la Langue Française
Parlée Complétée (LPC). Ma contribution à ce projet concerne la reconnaissance
automatique de la parole et des gestes multimodaux. En liaison avec ce projet,
je co-encadre un étudiant en thèse au laboratoire GIPSA, Nourredine Aboutabit.
Responsable local du projet
ANR RNTL MISTRAL (2007-2008)
Ce projet s’articule autour du
thème de la biométrie multimodale avec des partenaires tels que le LIA,
EURECOM, IRIT et LIUM. Le projet MISTRAL
propose une plate-forme logicielle de type logiciel libre (OpenSource) pour
l'authentification biométrique. L'objectif de ce projet est de faciliter
l'accès aux technologies biométriques au monde académique (centre de recherche
et d'enseignement) comme au monde industriel en fournissant une plate-forme
logicielle complète, performante, modulaire, facile à maîtriser et à mettre en
oeuvre, apte à gérer différentes tâches en biométrie et différents
environnements. Une des retombées attendues du projet est l’animation d’une
forte communauté d'utilisateurs de la plate-forme MISTRAL, composée d’acteurs
académiques et industriels.
Responsable du projet BQR INPG
2007 « LANG-PI » (LIG, MICA)
Ce projet concerne le développement d’une méthodologie générique permettant de développer rapidement des technologies vocales pour des langues peu dotées. Par exemple, en reconnaissance automatique de parole, mais cela est aussi vrai pour la traduction automatique, il subsiste un certain nombre de verrous en ce qui concerne la généricité des systèmes et leur portabilité vers de nouvelles langues. L’originalité de notre approche vient de la volonté d’aborder des langues peu ou mal dotées, pour lesquelles peu ou pas de corpus sont disponibles, ce qui nécessite des méthodologies innovantes qui vont bien au-delà du simple réapprentissage ou de l’adaptation de modèles.
4.1
Participation à des jurys de thèses
|
Nombre de jury en tant que : |
Encadrant |
Examinateur |
Rapporteur |
|
|
9 |
4 |
4 |
Comme
rapporteur
-Nimaan
Abdillahi « Sauvegarde du
patrimoine oral africain : conception de système de transcription automatique
de langues peu dotées pour l’indexation des archives audio » (LIA /
Université d’Avignon) soutenue le 2/7/2007
-Daniel
Dechelotte « Traduction automatique de parole par des méthodes
statistiques » (LIMSI / Université Paris Sud) soutenue le
17/12/2007
-Xiao Zhongzhe « Speech emotion & music mood recognition » (LIRIS, Ecole Centrale de Lyon) soutenue le 25/01/2008
-Thomas
Pellegrini « Transcription automatique de langues peu dotées »
(LIMSI / Université Paris Sud) qui sera soutenue le 11/4/2008.
Comme
examinateur
-Teva
Merlin « AMIRAL, une plateforme générique pour la reconnaissance du
locuteur. De l’authentification à l’indexation» (LIA / Université
d’Avignon) soutenue le 18/11/2004
-Christophe
Levy « Modèles acoustiques compacts pour les systèmes embarqués »
(LIA / Université d’Avignon) soutenue le 30/11/2006
-Joseph
Razik « Mesures de confiance trame-synchrones et locales en
reconnaissance automatique de la parole » (LORIA / Université Nancy
1) soutenue le 9/10/2007
-Emmanuel
Didiot « Segmentation parole / musique pour la transcription
automatique de parole continue » (LORIA / Université Nancy 1)
soutenue le 13/11/2007
Comme
encadrant
-D.
Vaufreydaz (CLIPS) soutenue le 7 Janvier 2002
-C.
Nguyen (CLIPS) soutenue le 19 Juin 2002
-D.
Istrate (CLIPS) soutenue le 16 Décembre 2003
-D.
Moraru (CLIPS) soutenue le 20 Décembre 2004
-P.
Mayorga (CLIPS) soutenue le 19 Janvier 2005
-V-B
Le (CLIPS) soutenue le 1er Juin 2006
-V-M
Quang (LIG) soutenue le 20 Septembre 2006
-N. Aboutabit (GIPSA) soutenue le 11 Décembre 2007
-T-P
Tan (LIG) soutenue le 3 Juillet 2008
4.2
Membre de comités scientifiques et relecture d’articles
Relecture
d’articles pour des revues internationales
-Computer Speech and Language
-Speech
Communication
-IEEE
Transactions on Speech and Audio Processing
-IEEE
Signal Processing Letters
-IEEE Transactions on Signal Processing
-IEEE Transactions on Multimedia
-IEEE Transactions on Information Forensics
and Security
-Pattern
Recognition Letters
Relecture
d’articles pour des revues nationales
-Traitement du Signal
-Acta
Acustica
-Revue
I3
Comité
de relecture de conférences internationales[13]
-Interspeech
(depuis 2005)
-IEEE
ICASSP (depuis 2007)
-EUSIPCO
(depuis 2006)
-Speaker
Odyssee, Workshop on Speaker Identification and Verification, (depuis 2004)
-International Workshop on Spoken Language Translation 2008 (IWSLT 2008)
-Speech
Translation for Medical and Other Safety-Critical Applications, COLING
conference workshop, 2008
-SpeD (depuis 2004)
Comité
scientifique de conférences nationales
-JEP :
Journées d’Etude sur la Parole (depuis 2002)
-RECITAL :
Rencontre des Étudiants Chercheurs en Informatique pour le Traitement
Automatique des Langues (depuis 2005)
-relecteur
pour les journées ATALA sur la traduction automatique (1er Décembre
2007)
4.3
Organisation d’événements
-Chairman
du Workshop International SLTU (Spoken Language Technologies for
Under-resourced Languages), Hanoï, Vietnam, May 2008.
-Organisateur d’une session spéciale Biométrie à la conférence ISPA 2005.
-Organisateur
du séminaire AFCP Traitement Automatique du Langage Parlé pour les Langues
peu Dotées, Juin 2007.
4.4
Expertise
-Evaluateur d’un projet pour l’ACI Masse de données 2005
-Evaluateur d’un projet ANR « masse de données » 2006
-Evaluateur
pour les bourses de recherche Microsoft (Microsoft Research PhD Scholarship).
4.5
Fonctions collectives
-Membre élu du bureau de l’AFCP
(Association Francophone de la Communication Parlée) depuis 2001, trésorier de
l’association depuis 2006.
-Membre des commissions de
spécialistes 27ème section de l’Université J. Fourier (depuis 2003) et de
l’Université d’Avignon (2001-2004).
-Membre du conseil scientifique de l’université J. Fourier (Janvier 2005-Decembre 2006).
4.6 Collaborations
internationales (hors projets)
-IBM Watson Research Center
(NY, USA) : collaboration avec l’équipe Traduction de Parole de Y.
Gao (chercheur invité pendant 13 mois en 2005/06, co-signatures d’articles IEEE
ICASSP 2007, Interspeech 2007, IEEE/ACL SLT 2006, HLT 2006).
-Interactive Systems Lab. (ISL) à CMU (USA) : collaboration avec T. Schultz sur la reconnaissance automatique de la parole multilingue (co-signature notamment d’un article à la conférence IEEE ICASSP 2006).
-Laboratoire MICA, Hanoï (Vietnam) : co-encadrement d’étudiants en thèse et travaux communs autour du traitement automatique de la langue vietnamienne depuis la création de l’UMI MICA (INPG/CNRS/IPH).
-Laboratoire ITC (Cambodge) : co-encadrement et travaux communs autour du traitement automatique de la langue khmère.
-Institut Polytechnique de
Bucarest (Human-Computer Dialogue Group) : échanges
scientifiques avec le Pr Corneliu Burileanu, co-encadrement d’étudiants de
MASTER.
Je suis maître de conférence en section 27 à Polytech’ Grenoble (Université J. Fourier) depuis Septembre 1999. Plus de la moitié de mon enseignement est fait dans la filière ingénieur Réseaux Informatiques et Communication Multimédia de Polytech’ Grenoble. J’interviens également depuis 1999 régulièrement et significativement en License d’Informatique à l’UFR d’Informatique et de Mathématiques Appliquées de Grenoble (UFR IMAG). Les sections suivantes présentent les diverses responsabilités pédagogiques que j’ai assurées, ainsi que les principales matières enseignées depuis 1999.
5.1 Responsabilités
pédagogiques
Responsable de la première
année de la filière d’ingénieurs RICM de Polytech’ Grenoble
J’ai été, de 1999 à 2002, responsable pédagogique de la première année de la filière d’ingénieurs RICM (Réseaux Informatiques et Communication Multimédia) de Polytech’ Grenoble. La première promotion de cette filière ayant démarré en 1999, j’ai donc été responsable d’année pour les quatre premières promotions (75 étudiants en moyenne). Outre les tâches liées à la gestion au jour le jour d’une promotion d’ingénieurs (préparation des emplois du temps, réunions pédagogiques, organisation des examens et des jurys), j’ai aussi été amené à proposer et réaliser des aménagements du contenu pédagogique de cette filière, par rapport à l’offre de départ.
Responsable du parcours ILP
(Ingénierie des Langues et de la Parole) du nouveau M2R Informatique de
Grenoble
J’ai coordonné la création et je suis responsable (depuis début 2007) du parcours ILP (Ingénierie des Langues et de la Parole) du nouveau M2R Informatique de Grenoble (depuis 2007). Cette responsabilité implique également la participation aux jurys de projets de MASTER-R en Juin et Septembre.
Responsable des stages de
première année de la filière d’ingénieurs RICM de Polytech’ Grenoble
J’ai été, de 1999 à 2002, responsable des stages de première année de la filière d’ingénieurs RICM (Réseaux Informatiques et Communication Multimédia) de Polytech’ Grenoble. Ces stages de découverte de l’informatique devaient être réalisés pendant l’été suivant la première année du cursus ingénieur. Les soutenances étaient organisées sous forme de sessions posters.
Responsable du projet Multimédia
de deuxième année de la filière d’ingénieurs RICM de Polytech’ Grenoble
J’ai été responsable du projet Multimédia (en 2004 et 2005) de la deuxième année de la filière d’ingénieurs RICM (Réseaux Informatiques et Communication Multimédia) de Polytech’ Grenoble. Ce projet, réalisé sur une période bloquée d’un mois (généralement au mois de Mai), a pour but de faire travailler les étudiants en équipe (généralement 4 personnes) sur la réalisation d’un prototype complet, dans le domaine de la communication multimédia (site web, interface homme-machine, application intégrant des modalités audio, image ou vidéo, etc…).
5.2 Enseignement
Principales Matières
enseignées (niveau License ou 1ère année Ingénieur)
Cours avancés (niveau Master
ou 2ème et 3ème années Ingénieurs)
Supports de cours, TD ou TP
réalisés
Le tableau ci-dessous fournit une vue synthétique des types de publications par thèmes. Les abréviations utilisées pour les thèmes sont : TSAP pour Traitement des signaux audio et de parole, RAP pour Reconnaissance automatique de la parole, TAP pour Traduction Automatique de Parole et O pour Autres. La rubrique TSAP regroupe les travaux menés depuis ma thèse autour de la reconnaissance des sons, des locuteurs et l’extraction d’éléments non linguistiques à partir du signal de parole. La rubrique RAP concerne plus particulièrement mes activités (depuis 2000) en reconnaissance automatique de la parole (RAP multilingue, RAP pour les langues peu dotées et RAP multimodale notamment). La rubrique TAP est quand à elle liée à mes activités les plus récentes dans le domaine de la traduction automatique statistique. Enfin, la rubrique O regroupe les autres publications (par exemple en matière de constitution de corpus). Pour les types de publications, j'utilise les abréviations suivantes : CL pour chapitre dans des ouvrages internationaux avec comité de relecture, RI pour articles dans des revues internationales avec comité de relecture, RN pour articles dans des revues nationales avec comité de relecture, CI pour articles dans des conférences internationales avec comité de relecture, CN pour articles dans des conférences nationales avec comité de relecture, et WI pour articles dans des colloques internationaux avec comité de relecture.

Remarque :
les deux conférences annuelles de référence, dans le domaine du traitement
automatique du langage parlé, sont Interspeech et ICASSP, dans lesquelles j’ai
publié 24 articles depuis 1998 (12 à Interspeech et 12 à ICASSP). Je suis
également relecteur pour ces deux conférences.
Mémoires
"Transcription
enrichie de documents dans un monde multilingue et multimodal" HDR,
Université Grenoble I, Janvier 2007.
"Un modèle
parallèle pour la reconnaissance automatique du locuteur" Thèse de
doctorat, Université d’Avignon, Avril 1998.
Revues
internationales avec comité de lecture (RI)
"Time-frequency
analysis of circumferential wave energy distribution for spherical shells.
Application to sonar target recognition" P.Chevret, F.Magand, L.
Besacier. Applied Signal Processing,
Springer Verlag, (3). pp 136-142. 1996.
"Subband
approach for automatic-speaker recognition" L. Besacier, J.F.
Bonastre. European Journal Signal Processing,
n°80 (2000), Elsevier. Special Issue on Emerging Techniques for
Communication Terminals. pp 1245-1259.
"Localization
and selection of speaker-specific information with statistical modeling" L.
Besacier, J.F. Bonastre, C. Fredouille, Speech
Communication, n°31 (2000), pp 89-106.
"Overview
of compression and packet loss effects in speech biometrics" L.
Besacier, J.-F. Bonastre, P. Mayorga, C. Fredouille, S. Meignier, 2003 , IEE Proceedings Vision, Image & Signal Processing
- Special issue on Biometrics on the Internet . Vol. 150, n°6, December 2003.
"Voice
biometrics over the Internet in the framework of COST action 275", L.
Besacier, A. M. Ariyaeeinia, J. S. Mason, J.-F. Bonastre, P. Mayorga, C.
Fredouille, S. Meignier, J. Siau, N. W. D. Evans, R. Auckenthaler, R. Stapert, EURASIP Journal on Signal Processing, Special issue on
biometric signal processing. n°4, 1 April 2004. p 466-479.
« Information
Extraction From Sound for Medical Telemonitoring » D. Istrate, D.;
Castelli, E.; Vacher, M.; Besacier, L.; Serignat, J.-F.. IEEE Transactions on Information Technology in Biomedicine.
Volume: 10 Issue: 2 Date: April 2006. pp 264-274.
« Step-by-step
and Integrated approaches in broadcast news speaker diarization » Corinne
Fredouille, Daniel Moraru; Sylvain Meignier, Jean-Francois Bonastre, Laurent
Besacier. Computer Speech and Language Journal pp303-330, vol 20, Issues 2-3. April-July 2006.
(Elsevier).
Revues nationales
avec comité de lecture (RN)
"Système
de télésurveillance sonore pour la détection des situations de détresse"
Dan Istrate, M. Vacher, J. F. Serignat, L. Besacier, E. Castelli. ITBM-RBM (Elsevier)
Revue Européenne de Technologie Biomédicale. 2006.
Chapitre de livre avec comité de lecture (CL)
"Subband approach for automatic-speaker recognition : optimal division of the frequency domain" L. Besacier, J.F. Bonastre. Audio and Video Biometric Person Authentication. Bigun & al. eds. Lectures Notes in Computer Science 1206 (Springer Verlag), pp 195-202 / ISBN 3-540-62660-3.
« Speech Coding and Packet Loss Effects on Speech and Speaker Recognition » L. Besacier. In Automatic Speech Recognition on Mobile Devices and over Communication Networks. Z.-H. Tan and B. Lindberg (Eds.). Springer-Verlag, London, 2008, ISBN: 978-1-84800-142-8.
Conférences
et Workshops internationaux avec comité de lecture (CI,WI)
2008
-« Improving
Pronunciation Modeling for Non-Native Speech Recognition » Tien-Ping Tan, Laurent
Besacier, Interspeech 2008. Brisbane,
Australia, September 2008.
-« Feature
adaptation of hearing-impaired lip shapes: the vowel case in the Cued Speech
context. » . Aboutabit, D. Beautemps, O. Mathieu, L. Besacier. Interspeech 2008. Brisbane, Australia, September 2008.
-« Word/Sub-word lattices decomposition and combination for Speech Recognition » V-B. Le, S. Seng, L. Besacier, B. Bigi. IEEE ICASSP 2008. Las Vegas, USA, 2008
-« First Broadcast News Transcription System for Khmer Language », S. Seng, S. Sam, L. Besacier, B. Bigi, E. Castelli. Proc. LREC 2008, Marrakech, 2008
-« WHICH UNITS FOR ACOUSTIC AND LANGUAGE MODELING FOR KHMER AUTOMATIC SPEECH RECOGNITION? », Sopheap Seng, Sethserey Sam, Viet-Bac Le, Brigitte Bigi, Laurent Besacier. 1st International Conference on Spoken Language Processing for Under-resourced languages (SLTU’2008). Hanoi, Vietnam, May 2008.
-« RECENT ADVANCES IN AUTOMATIC SPEECH RECOGNITION FOR VIETNAMESE », Viet-Bac Le, Laurent Besacier, Sopheap Seng, Brigitte Bigi, Thi-Ngoc-Diep Do. 1st International Conference on Spoken Language Processing for Under-resourced languages (SLTU’2008). Hanoi, Vietnam, May 2008.
2007
« The LIG Arabic / English Speech Translation System à IWSLT07 » L. Besacier, A. Mahdhaoui, V-B Le, IWSLT07. Trento. Italy. October 2007
« Automatic question detection: prosodic-lexical features and crosslingual experiments » V-M Quang, L. Besacier, E. Castelli, INTERSPEECH 2007. Antwerp. Belgium. August 2007.
« Modeling Context and Language Variation for Non-Native Speech Recognition » T-P Tan, L. Besacier, INTERSPEECH 2007. Antwerp. Belgium. August 2007.
« A HMM recognition of consonant-vowel syllables from lip contours: the Cued Speech case » N. Aboutabit, D. Beautemps, J. Clarke, L. Besacier, INTERSPEECH 2007. Antwerp. Belgium. August 2007.
« Automatic identification of vowels in the Cued Speech context » , Noureddine Aboutabit, Denis Beautemps, Laurent Besacier, Proc. AVSP (International Conference on Auditory-Visual Speech Processing), Hilvarenbeek (The Netherlands). September 2007.
« ON EFFICIENT COUPLING OF ASR AND SMT FOR SPEECH TRANSLATION» Bowen Zhou, Laurent Besacier and Yuqing Gao. Proceedings IEEE ICASSP 2007. Hawai, USA. April 2007.
« ACOUSTIC MODEL INTERPOLATION FOR NON-NATIVE SPEECH RECOGNITION» Tien-Ping Tan, Laurent Besacier. IEEE ICASSP 2007. Hawai, USA. April 2007.
2006
« Towards speech translation of non
written languages» Laurent Besacier, Bowen Zhou, Yuqing Gao. IEEE / ACL SLT
2006. Aruba, December 2006.
« IBM MASTOR SYSTEM: Multilingual
Automatic Speech-to-Speech Translator » Yuqing Gao, Gu Liang, Bowen Zhou,
Ruhi Sarikaya, Mohamed Afify, Hong-Kwang Kuo, Wei-zhong Zhu, Yonggang Deng,
Charles Prosser, Wei Zhang and Laurent Besacier, First International Workshop on
Medical Speech Translation, in conjunction with NAACL/HLT 2006,
New-York, USA. June 2006.
« Comparison of Acoustic Modeling
Techniques for Vietnamese and Khmer ASR », Viet Bac Le, Laurent
Besacier, Proc ICSLP 2006, Pittsburgh, USA, September 2006.
« ON THE USE OF MORPHOLOGICAL
ANALYSIS FOR DIALECTAL ARABIC SPEECH RECOGNITION », Mohamed Afify, Ruhi
Sarikaya, Hong-Kwang Jeff Kuo, Laurent Besacier, and Yuqing Gao, Proc ICSLP 2006,
Pittsburgh, USA, September 2006.
« Characterisation of cued speech vowels fron
the inner lip contour », N. Aboutabit, D. Beautemps, L. Besacier, Proc ICSLP 2006,
Pittsburgh, USA, September 2006.
« ASR AND TRANSLATION FOR
UNDER-RESOURCED LANGUAGES » L. Besacier, V-B. Le, C. Boitet, V.
Berment. Proceedings IEEE ICASSP 2006. Toulouse,
France. May 2006.
« ACOUSTIC-PHONETIC UNIT
SIMILARITIES FOR CONTEXT DEPENDENT ACOUSTIC MODEL PORTABILITY » Viet Bac
Le, Laurent Besacier, Tanja Schultz. IEEE ICASSP
2006. Toulouse, France. May 2006.
« HAND AND LIP DESYNCHRONIZATION
ANALYSIS IN FRENCH CUED SPEECH: AUTOMATIC TEMPORAL SEGMENTATION OF HAND
FLOW » Noureddine Aboutabit, Denis Beautemps, Laurent Besacier. IEEE ICASSP 2006. Toulouse, France. May 2006.
« A French Non-Native Corpus for
Automatic Speech Recognition » Tien-Ping Tan, Laurent Besacier Proc LREC 2006.
Genoa, Italy. May 2006.
2005
"First steps in fast acoustic
modeling for a new target language. Application to Vietnamese" Viet-Bac
Le, Laurent Besacier. Proceedings IEEE ICASSP
2005. Philadelphia, USA. April 2005.
"Audio, Video and Audio-Visual
Signatures for Short Video Clip Detection: Experiments on Trecvid2003",
Benjamin Senechal, Denis Pellerin, Laurent Besacier, Isabelle Simand,
Stéphane Brès . Accepté à IEEE ICME (International
Conference on Multimedia and Expo). Amsterdam. Holand. July 2005.
« A Speaker independent “Liveness”
Test for Audio-Visual Biometrics », Nicolas Eveno, Laurent Besacier.
Accepté à Eurospeech 2005. Lisbonne, Portugal.
Septembre 2005.
« Speaker and Story Segmentation
Using Audio-Video Information » D. Moraru, L. Besacier, G. Quenot,
S. Ayache. Trends in Speech Technology. Proc. 3d
Conference on Speech Technology and Human Computer Dialog. ISBN
973-27-1178-7. Cluj-Napoca, Roumania, May 13-14, 2005.
« NIST RT05S Evaluation :
Pre-Processing Techniques and Speaker Diarization on Multiple Microphone
Meetings » Dan Istrate, Corinne Fredouille, Sylvain Meignier, Laurent
Besacier, and Jean Francois Bonastre. Proc. RT05S Workshop. July 2005.
2004
-«
Speaker Diarization in the ELISA Consortium over the last 4 years », D. Moraru,
L. Besacier, S. Meignier, C. Fredouille, JF Bonastre, RT2004 Fall Workshop. November 2004.
«
Video Story Segmentation with Multi-Modal Features: Experiments on TRECvid 2003
», L. Besacier, G. Quenot, S. Ayache, D. Moraru, 6th ACM SIGMM International Workshop on Multimedia Information Retrieval,
October 15-16, 2004, New York, NY USA.
«
The NIST 2004 spring rich transcription evaluation : two-axis merging strategy
in the context of multiple distance microphone based meeting speaker
segmentation », C. Fredouille, D. Moraru, S. Meignier, L. Besacier,
J.-F. Bonastre, RT2004 Spring Meeting Recognition
Workshop, May 17, 2004.
“Benefit
of prior acoustic segmentation for speaker segmentation systems” S. Meignier,
D. Moraru, C. Fredouille, L. Besacier, and J.-F. Bonastre, International Conference on Acoustics Speech & Signal
Processing (ICASSP), Montreal, Canada, May 2004.
“The
ELISA consortium approaches in Broadcast News speaker segmentation during the
NIST 2003 Rich Transcription evaluation”. D. Moraru, S. Meignier, C.
Fredouille, L. Besacier, and J.-F. Bonastre, International
Conference on Acoustics Speech & Signal Processing (ICASSP),
Montreal, Canada, May 2004.
“Using
a priori information for speaker diarization”, Daniel Moraru, Laurent
Besacier, Eric Castelli Proc. Odyssee 2004,
The Speaker and Language Recognition Workshop, Toledo, Spain, 31 May-4 June,
2004.
"ELISA
Nist RT03 Broadcast News Speaker Diarization Experiments" Daniel Moraru,
Sylvain Meignier, Corinne Fredouille, Laurent Besacier, Jean-François
Bonastre, Proc. Odyssee 2004, The Speaker and
Language Recognition Workshop, Toledo, Spain, 31 May-4 June, 2004.
"SPOKEN
AND WRITTEN LANGUAGE RESOURCES FOR VIETNAMESE" Viet-Bac Le , Do-Dat Tran,
Eric Castelli, Laurent Besacier, Jean-François Serignat, Proc. LREC2004, Lisbonne, Portugal. 2004
« Spoken
Dialogue Translation Systems Evaluation: Results, New Trends, Problems and
Proposals » Hervé Blanchon, Christian Boitet, Laurent Besacier. Proc. IWSLT 2004
(ICLSP 2004 Satellite Workshop). Kyoto, Japan. September 30 - October 1,
2004. vol. 1/1: pp. 95-102.
2003
"AUDIO
PACKET LOSS OVER IP AND SPEECH RECOGNITION ", Pedro Mayorga, Laurent
Besacier, Richard Lamy and Jean-Francois Serignat, ASRU
2003 (Automatic Speech recognition & Understanding), Virgin Islands,
USA, Dec 2003.
"Using
the Web for fast language model construction in minority languages" Viet
Bac LE, Brigitte BIGI, Laurent BESACIER, Eric CASTELLI, Eurospeech 2003, Geneva, 1-4 Sept. 2003.
"The NESPOLE! VoIP Multilingual Corpora in Tourism and Medical Domains" Nadia Mana, Susanne Burger, Roldano Cattoni, Laurent Besacier, Victoria MacLaren, John McDonough, Florian Metze, Eurospeech 2003, Geneva, 1-4 Sept. 2003.
"Smart
Audio Sensor for Telemedicine" Michel Vacher, Dan Istrate, Laurent
Besacier, Eric Castelli, Jean-Francois Serignat, Smarts
Objects Conference (SOC) 2003, 15-17 May, Grenoble, France.
-"The
ELISA consortium approaches in speaker segmentation during the NIST 2002
speaker recognition evaluation", D. Moraru, S. Meignier, L. Besacier,
J-F Bonastre, I. Magrin-Chagnolleau. Accepted to International Conference on
Acoustics Speech & Signal Processing (ICASSP),
Honk-Kong, China, May 2003.
-"Towards
Conversational Model for Speaker Segmentation", D. Moraru, L. Besacier,
"Speech Technology & Human-Computer
Dialogue", Bucharest, April 10-11, 2003, ISBN 973-27-0963-4.
"HABITAT
TELEMONITORING SYSTEM BASED ON THE SOUND SURVEILLANCE" Eric Castelli,
Michel Vacher, Dan Istrate, Laurent Besacier, Jean-Francois Serignat, ICICTH (International Conference on Information Communication
Technologies in Health), 11-13 July 2003, Samos Island, Greece.
"Non-linear
acoustical pre-processing for multiple sampling rates ASR and ASR in noisy
condition", Richard LAMY, Laurent BESACIER, worshop NOLISP 03, Le Croisic, France, 20-23 mai 2003.
“CLIPS
at TRECvid: Shot Boundary Detection and Feature Detection”, Georges M. Quénot,
Daniel Moraru, Laurent Besacier, 12th Text
Retrieval Conference, Gaithersburg, MD, USA, 2003.
2002
METHODOLOGY
FOR EVALUATING SPEAKER VERIFICATION ROBUSTNESS OVER IP NETWORKS L. Besacier,
P. Mayorga, J.F. Bonastre, C. Fredouille, Proceedings of the COST275 Workshop on The Advent of Biometrics on the Internet,
Rome, Nov 2002, ISBN 92-894-4848-2
"CLIPS-IMAG
at TREC-11 : Experiments in Video Retrieval", Georges M. Quénot, Daniel
Moraru, Laurent Besacier, and Philippe Mulhem , 11th Text Retrieval Conference, Gaithersburg, MD, USA,
19-22 November, 2002.
S.
Rossato, H. Blanchon, L. Besacier “Speech-to-speech translation system
evaluation : results for French for the Nespole! Project first showcase”, Proc ICSLP2002, Denver, USA, Sept 2002.
P.
Mayorga-Ortiz, R. Lamy, L. Besacier “Recovering of packet loss for
distributed speech recognition”, Proc. Eusipco 2002,
Toulouse, France, Sept. 2002.
The
Nespole Project Consortium : A. Lavie, F. Metze, R. Cattoni, E. Costantini, S.
Burger, D. Gates, C. Langley, K.Laskowski, L. Levin, K. Peterson, T. Schultz,
A. Waibel, D. Wallace, J. MacDonough, H. Soltau, G. Lazzari, N. Mana, F.
Pianesi, E. Pianta, L. Besacier, H. Blanchon, D. Vaufreydaz “A
Multi-Perspective Evaluation of the Nespole! Speech-to-Speech Translation
System”, Proc. ACL2002 Workshop on Speech-to-Speech
Translation : Algorithms and Systems, Philadelphia, PA, July 7-12 2002
The
Nespole Project Consortium “The NESPOLE! Speech-to-Speech Translation
System”, Proc HLT (Human Language Technologies)
2002, San-Diego, CA
The
Nespole Project Consortium “Enhancing the Usability and Performance of NESPOLE!
- a Real-World Speech-to-Speech Translation System”, Proc
HLT (Human Language Technologies) 2002, San-Diego, CA
2001
D.
Vaufreydaz, L. Besacier , C. Bergamini, R. Lamy, “From generic to
task-oriented speech recognition: French experience in the NESPOLE! European
project", presented at ITRW Workshop on Adaptation
Methods for Speech Recognition, Sophia-Antipolis, France 29-30 August,
2001,
L.
Besacier, H. Blanchon, Y. Fouquet, J.P. Guilbaud, S. Helme, S. Mazenot, D.
Moraru, D. Vaufreydaz "Speech Translation for French in the NESPOLE!
European Project", Eurospeech 2001, Aalborg,
Danemark, September 2001.
S.
Burger, L. Besacier, P. Coletti, F. Metze, C. Morel "The NESPOLE!
VoIP Dialogue Database", Eurospeech 2001, Aalborg,
Danemark, September 2001.
L.
Besacier , C. Bergamini, D. Vaufreydaz, E. Castelli "THE EFFECT OF SPEECH
AND AUDIO COMPRESSION ON SPEECH RECOGNITION PERFORMANCE " IEEE Multimedia Signal Processing Workshop, Cannes,
France, October 2001.
2000
D.
Vaufreydaz, C. Bergamini, J. F. Serignat, L. Besacier and M. Akbar, “A
New Methodology for Speech Corpora Definition from Internet Documents,”
presented at LREC'2000, 2nd International Conference on
Language Ressources and Evaluation, Athens, Greece, 31 May-2 June, 2000,
I, pp.423-426.
"GSM
Speech Coding and Speaker Recognition,” L. Besacier, S. Grassi, A.
Dufaux, M. Ansorge and F. Pellandini, presented at ICASSP
2000, Istambul, Turkey, 5-9 june, 2000 .
"INFLUENCE
OF GSM SPEECH CODING ON THE PERFORMANCE OF TEXT-INDEPENDENT SPEAKER
RECOGNITION" S. Grassi, L. Besacier, A. Dufaux, M. Ansorge, and F.
Pellandini.EUSIPCO 2000, Tampere, Finland, Sept.
4-8, 2000
"AUTOMATIC
SOUND DETECTION AND RECOGNITION FOR NOISY ENVIRONMENT", Alain Dufaux, Laurent
Besacier, Michael Ansorge, and Fausto Pellandini, EUSIPCO
2000, Tampere, Finland, Sept. 4-8, 2000
"SPEAKER
RECOGNITION ON COMPRESSED SPEECH" S. Grassi , A. Dufaux , L. Besacier
, M. Ansorge , F. Pellandini, Workshop on friendly
exchanging through the net, Bordeaux (France), March 22-24, 2000.
1999
"Experimental
Evaluation of Text-independent Speaker Verification on Laboratory and Field
Test Databases in the M2VTS project" L. Besacier, J. Luettin, G.
Maître, E. Meurville. Eurospeech 99. Budapest,
Hungary. 5-9 September 99.
"Automatic
Sound Recognition relying on statistical methods, with application to
telesurveillance". L. Besacier, A. Dufaux, M. Ansorge, and F.
Pellandini. International Workshop on Intelligent
Communication Technologies and Applications, with emphasis on mobile
communications. Neuchâtel, Switzerland. May, 5-7, 1999.
"Influence
of GSM speech coding algorithms on text-independent speaker identification
performance". S. Grassi, L. Besacier, A. Dufaux, M. Ansorge, F.
Pellandini. International Workshop on Intelligent
Communication Technologies and Applications, with emphasis on mobile
communications. Neuchâtel, Switzerland. May, 5-7, 1999.
"Multi
Modal Verification for Teleservices and Security Applications (M2VTS)" G.
Richard, Y. Menguy, I. Guis, N. Suaudeau, J. Boudy, P. Lockwood, C. Fernandez,
F. Fernández, C. Kotropoulos, I. Pitas, R. Heimgartner, P. Ryser, C. Beumier,
S. Pigeon, G. Matas, J. Kittler, J. Bigün, Y. Abdeljaoued, E. Meurville, L.
Besacier , G.Maitre, J. Luettin, S. Ben-Yacoub B. Ruiz. In Proc. IEEE Conference on Multimedia Computing and Systems’99.
Florence, Italy, 7-11 June 1999.
"Automatic
Detection and Classification of Wideband Acoustic Signals" A. Dufaux, L.
Besacier, M. Ansorge, F. Pellandini. Joint 137th
meeting of the Acoustical Society of America and Forum Acusticum 99.
Berlin, Germany. 14-19 March, 1999.
1998
"Frame
Pruning for Speaker Recognition". L. Besacier, J.F. Bonastre. Proc.
IEEE International Conference on Acoustics Speech and Signal Processing (ICASSP), 12-15 May 1998. Seattle (USA).
"Time
and frequency pruning for speaker identification". L. Besacier.
Proc 14th International Conference on Pattern Recognition (ICPR), 16-20 August 1998. Brisbane (Australia).
"Frame
Pruning for Speaker Recognition". L. Besacier, J.F. Bonastre. Proc.
Eusipco, 8-11 September 1998. Rhodes (Greece).
"Time
and frequency pruning for speaker identification" L. Besacier, J.F.
Bonastre. Proc. on Speaker Recognition and its Commercial and Forensic
Applications (RLA2C), 20-23 April, 1998. Avignon
(France).
1997
"Independent
processing and recombination of partial frequency bands for automatic speaker
recognition" L. Besacier, J.F. Bonastre. Fourteenth Internationnal Conference on Speech Processing. IEEE
Korea Council, IEEE Korea Signal Processing Society, Seoul, Korea, August
26-28, 1997.
"Subband
architecture for automatic speaker recognition on partially corrupted
speech" L. Besacier, J.F. Bonastre. COST
254 Workshop on emerging techniques for communication terminals. Toulouse,
France. 7-9 July 1997.
1995
"Time
frequency analysis of Stoneley wave energy distribution for spherical and
cylindrical shells. Application to sonar target recognition." P.Chevret,
F.Magand, L. Besacier, . UK Symposium on
applications of time-frequency and time-scale methods. pp 233-240.
Coventry, UK, 30-31 Aout 1995.
Congres nationaux avec comité de lecture (CN)
« Reconnaissance
automatique de la parole en langue khmère : quelles unités pour la modélisation
du langage et la modélisation acoustique? » Sopheap Seng , Sethserey Sam,
Viet-Bac Le, Brigitte Bigi , Laurent Besacier. JEP/TALN 2008. Avignon, France. Juin 2008.
« Modélisation acoustique multilingue pour la reconnaissance automatique de la parole non native » T-P Tan, L. Besacier. JEP/TALN 2008. Avignon, France. Juin 2008.
« Adaptation
de la production labiale d'un participant sourd et classification : le cas des
voyelles en contexte du code LPC », Aboutabit,
D. Beautemps, O. Mathieu, L. Besacier. JEP/TALN
2008. Avignon, France. Juin 2008.
« Reconnaissance
Automatique de la Parole pour des Langues peu Dotées : Application au
Vietnamien et au Khmer » L. Besacier , V.-B. Le , E. Castelli, S.
Sethserey , L. Protin , TALN 2005 – Atelier TALN et
langues mal dotées. Dourdan, France. Juin 2005.
"Premiers pas du CLIPS sur les données
d’évaluation ESTER", R. Lamy, D. Moraru, B. Bigi, L. Besacier, JEP 2004, Fès, Maroc, Avril 2004
"Segmentation selon le locuteur: les activités du Consortium ELISA dans le
cadre de Nist RT03", D. Moraru, S. Meignier, C. Fredouille, L. Besacier,
J-F Bonastre, JEP 2004, Fès, Maroc, Avril
2004
Vu
Minh, Q., Besacier, L., Castelli, E., Bigi, B., and Blanchon, H..
(2004). Interchange format-based language model for automatic speech
recognintion in speech-to-speech translation. Proc. RIVF'04
(Recherche Informatique Vietnam-Francophonie). To be published in a special
issue of Studia Informatica Universalis [Suger Editor]. February 2-5, 2004.
vol. 1/1: pp. 47-50.
Hervé
Blanchon, Laurent Besacier « Traduction de dialogue: résultats du projet
NESPOLE! et pistes pour le domaine » TALN 2004,
Session Poster, Fès, 19-21 avril 2004.
Quang
Vu-minh, Laurent Besacier, Hervé Blanchon, Brigitte Bigi « Modèle
de langage sémantique pour la reconnaissance automatique de parole dans un
contexte de traduction » TALN 2004, Session
Poster, Fès, 19-21 avril 2004.
D.
Moraru, L. Besacier « Segmentation en locuteurs de conversations sur IP
», XXIVèmes Journées d’Etude sur la Parole,
Nancy, Juin 2002.
R.
Lamy, L. Besacier “Adaptation spectrale par quantification vectorielle :
exemple de la RAP à fréquences d’échantillonnage multiples”, XXIVèmes Journées d’Etude sur la Parole, Nancy, Juin
2002.
S.
Rossato, H. Blanchon, L. Besacier “Évaluation du premier démonstrateur
de traduction de parole dans le cadre du projet NESPOLE!”, Congrès TALN (Traitement Automatique du Langage Naturel),
Nancy, Juin 2002.
"Système
d'élagage temps-fréquence pour l'identification du locuteur" L. Besacier,
J.F. Bonastre. 22èmes Journées d'Etude sur la Parole.
Martigny, Suisse. 15-19 Juin 1998.
"Architecture
en sous-bandes pour la reconnaissance automatique du locuteur en milieu
bruite" L. Besacier, J.F. Bonastre, C. Fredouille. Proc. RFIA 98. Clermont-Ferrand, France. 20-22 Janvier
1998.
"
Traitement indépendant de sous-bandes fréquentielles par des méthodes
statistiques du second ordre pour la reconnaissance automatique du locuteur.
" L. Besacier, J.F. Bonastre. 4th French
Congress on Acoustics. Marseille, France, 14-18 April 1997.
"Caractéristiques
individuelles de la durée vocalique intrinsèque en français lu; une étude
pilote. " D. Duez, L. Besacier. 4th French
Congress on Acoustics. Marseille, France, 14-18 April 1997.
Séminaires
-EPFL Lausanne, journées « Images et Sons », Lausanne, Juin 2008.
-INRIA
Rhône-Alpes, séminaires IN'Tech : Mining Multimedia Data. Grenoble,
19 Juin 2008.
-Institut des Sciences de l’Homme, Laboratoire Dynamique du Langage, Lyon, Mars 2008.
-Journée AFCP « TALP et langues peu dotées », Grenoble, 2007.
-IBM Watson Research Center, NY, USA, 2006.
-Institut de la Communication Parlée (ICP), 2003.
-Journees de l'ATALA sur la traduction automatique, 2001.
-Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA), 1998.
-Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur (LIMSI), 1998.
-Center
for Language and Communication Studies - Trinity College – Dublin, 1997.
[1]
Ecole Doctorale Electronique, Electrotechnique, Automatique & Traitement du
Signal
[2] Ecole Doctorale Mathématique et Informatique
[3] DEA (ou MASTER-R) Signal, Image, Parole, Telecom de l’INPG
[4] DEA (ou MASTER-R) Informatique, Université J. Fourier
[5]
MASTER-R Ingénierie de la Communication Personne-Système de l’Université Pierre
Mendès-France
[6] MASTER-R Industrie des Langues, Université Stendhal, Grenoble 3
[7] C. Nguyen est enseignant-chercheur à l’Institut Polytechnique de Hanoï (Viet-Nam)
[8] D. Vaufreydaz est enseignant-chercheur à l’Université Pierre Mendes-France (Grenoble II)
[9] D. Istrate est enseignant-chercheur à l’ESIGETEL (Fontainebleau)
[10] D. Moraru est ingenieur de recherche chez FreeScale (ex : Motorola)
[11] P. Mayorga est enseignant-chercheur à l’Université de Mexicali (Mexique)
[12] co-encadrement avec le laboratoire LIS.
[13] Les deux conférences annuelles de référence, dans mon domaine, sont Interspeech et ICASSP.
[14]
Voir un exemple sur : http://www-clips.imag.fr/geod/User/laurent.besacier/coursAM.html