Activités de Recherche

Encadrements d'étudiants

Laboratoire IRISA 2010-

Equipe DRUID

Travail de Recherche au laboratoire E³I²-EA3876 2003-2010

Lieu :    ENSTA-Bretagne, Brest
Laboratoire :    E³I²-EA3876
Equipe :    Fusion et aide à la décision, animateur de l'équipe depuis 2006
Mots Clefs :    Théorie des fonctions de croyance, Fusion de données, Fusion de décisions, Aide à la décision, Traitement du signal, Imagerie Radar, Imagerie Sonar.
Responsable du laboratoire :    Pr. A. Khenchaf

Le Laboratoire E³I² comprend trois thématiques : Modélisation et caractérisation de l’environnement, Représentation et extraction de l’information et Fusion et aide à la décision.
De 2006 à 2010, j'ai été animateur de l'équipe de la thématique : fusion et aide à la décision. Les activités associées à cette thématique se sont orientées vers la conception de systèmes d'information pour l'aide à la décision pour les applications radar et sonar. L'objectif est de faire intervenir l'homme dans la boucle à différents niveaux de la prise de décision. Le domaine de validité de la thématique concerne des systèmes de données hétérogènes et imparfaites (incertaines, imprécises) pour aider l'opérateur. Ces données sont celles rencontrées dans les applications du laboratoire dans le cadre de l'extraction et l'exploitation de l'information en environnements incertains caractérisés par des systèmes radar et/ou sonar. La recherche menée sur cette thématique est donc transverse et s'appuie globalement sur les recherches développées dans les deux autres thématiques : Modélisation et caractérisation de l'environnement, et Représentation et extraction de l'information.
Ainsi, l'équipe se positionne de manière originale sur le plan nationale et internationale, d'une part par cette transversalité et d'autre part par le domaine de validité et des applications.
Mes travaux concernent essentiellement

Travaux au sein du Valoria 2002-2003

Sujet :    Modèle pour la prédiction linguistique favorisant la saisie de textes de personnes handicapées.
Lieu :    Université de Bretagne Sud, Vannes
Equipe :    Laboratoire Valoria, équipe Equipage
Mots Clefs :    Traitement automatique des langues, Modèle de Langage, Prédiction Linguistique, Aide à la Saisie, Dialogue Homme-machine.
Responsable : Pr. F. Poirier

Ce travail intervient en collaboration avec l’équipe équipage du laboratoire Valoria dans une thématique d’aide à l’interaction homme-machine, plus particulièrement j’interviens dans le cadre de la thèse d’I. Schadle encadrée par J.-Y. Antoine et B. Le Pévédic. Afin d’aider à l’intégration de personnes atteintes d’un handicap sévère, il est essentiel de mettre en œuvre des outils logiciels pour faciliter la saisie de textes (traitement de textes, courrier électronique). Le principe est d’utiliser des modèles stochastiques de langage afin de prédire la lettre ou le mot que l’utilisateur veut saisir en fonction des mots et des lettres du mot éventuellement déjà saisis. J’interviens au niveau de l’amélioration du modèle de langage déjà réalisé par I. Schadle ainsi qu’au niveau de l’évaluation intrinsèque du modèle. L’originalité de l’approche de prédiction proposée est de considérer, non pas les deux mots précédents comme dans le cas d’un modèle trigramme ou d’un modèle à base de classes, mais, lorsque c’est pertinent, le mot tête (i.e. porteur de sens) du «groupe grammatical» courant, ou d’un des deux précédents «groupes grammaticaux», ainsi que celui de l’éventuelle préposition du «groupe grammatical» courant. En effet ces mots ont une influence lexicale sur le mot à prédire. Nous proposons également la prise en compte des mots du vocabulaire de l’utilisateur à l’aide d’une classe supplémentaire.

Travaux de Thèse de 1998 à 2001

Titre :            Méthodes Robustes de Détection de Parole dans le Bruit, pour la Reconnaissance Vocale
Lieu :          France Télécom R&D, Lannion
Equipe :                DIH/IPS/RVA
Lieu d'inscription : Université de Rennes 1
Mots Clefs :          Détection de Parole, Reconnaissance Vocale, Méthodes d'évaluation de la détection, Statistiques d'Ordre Supérieur, Fréquence Fondamentale, Fusion de données et de décision
Directeur :             R. André-Obrecht
   IRIT - 118, route de Narbonne, 31062 Toulouse Cedex 4
Responsables :      A. Gilloire et L. Mauuary
France Télécom R&D, DIH/IPS, 22307 Lannion Cedex

Présentation de la Thèse :

Pour réduire le coût des systèmes de reconnaissance vocale, il est important de détecter les périodes d'activités de la parole pour traiter le signal de parole différemment de celui de non-parole. Avec le développement de la téléphonie mobile, la qualité sonore est diminuée, d'une part par la transmission de la parole, d'autre part par l'environnement souvent bruité des appels. En outre la reconnaissance vocale est de plus en plus utilisée dans des applications spontanées de dialogue Homme-Machine ; la reconnaissance de parole continue nécessite une détection plus précise des débuts et fins de détection.
Nous avons élaboré un algorithme de détection de parole/non-parole plus robuste en milieu bruité et dans le cadre de la détection de parole continue afin d’améliorer les performances de la reconnaissance. Une partie importante de cette étude consiste à réaliser des algorithmes d'évaluation du module de détection pour évaluer les précédentes versions d’algorithmes de détection utilisés à France Télécom R&D. L’évaluation est constituée d’un programme permettant d'une part une évaluation intrinsèque de la détection, d'autre part une évaluation dans le système de reconnaissance global.
Pour l'amélioration des performances, un système de détection de parole/non-parole a été réalisé à partir d’un automate, dont les transitions sont régies selon plusieurs conditions associées à l’énergie :

une première approche utilise les statistiques d'ordre supérieur de l'énergie,
une seconde approche utilise un degré de voisement en complément de l'énergie,
une troisième approche utilise une analyse factorielle discriminante calculée sur les coefficients cepstraux.

La principale difficulté est d’intégrer une nouvelle condition à l’automate afin de modéliser au mieux le passage d’un état à l’autre. L’approche des moments d'ordre supérieur calculés sur le logarithme de l'énergie vise à employer l'information énergétique au mieux. Cette approche ne permet pas de diminuer les détections de bruits. L’apport de la condition à l’aide d'un degré de voisement a permis une amélioration de la détection dans des milieux bruités ainsi que de la détection de parole continue. Pour utiliser au mieux les données du signal de parole employées par le système de reconnaissance, une étude approfondie des méthodes de fusion de données et de fusion de décisions a conduit à implémenter une analyse factorielle discriminante effectuée sur les coefficients cepstraux. Cette approche a également permis l’amélioration des performances de la détection dans des milieux bruités et de la détection de parole continue pour des applications de dialogue Homme-Machine, et ainsi le coût CPU global du système de reconnaissance a été diminué.

Stage de D.E.A. en 1998

Sujet : Homogénéisation par une Analyse Multirésolution
Lieu : INRIA (Institut National de Recherche en Informatique et en Automatique),
Marseille (rattaché à Sophia Antipolis)
Projet : SYSDYS
Mots Clefs : Géostatistiques, Homogénéisation, Analyse Multirésolution, Ondelettes, Opérateur de Darcy
Responsables : F. Campillo et F. Cerou
Travail : La complexité du sous-sol, très hétérogène et irrégulier, nécessite des méthodes de changement d'échelle, comme l'homogénéisation. Pour approcher les coefficients homogénéisés, l'analyse multirésolution peut être utilisée. Mon travail a consisté à l’implémentation de cette méthode en tenant compte des particularités du problème posé afin de réduire le coût algorithmique.