Activités de Recherche
Laboratoire IRISA 2010-
Equipe DRUID
Travail de Recherche au laboratoire E³I²-EA3876 2003-2010
Lieu :
ENSTA-Bretagne, Brest
Laboratoire : E³I²-EA3876
Equipe : Fusion et aide à la décision, animateur de l'équipe depuis 2006
Mots Clefs : Théorie des fonctions de croyance, Fusion de données, Fusion de
décisions, Aide à la décision, Traitement du signal,
Imagerie Radar, Imagerie Sonar.
Responsable du laboratoire : Pr. A. Khenchaf
Le Laboratoire E³I² comprend trois thématiques : Modélisation
et caractérisation de l’environnement, Représentation et extraction
de l’information et Fusion et aide à la décision.
De 2006 à 2010, j'ai été animateur de l'équipe de la thématique : fusion et aide à la décision. Les activités associées à cette thématique se sont orientées vers la conception de systèmes
d'information pour l'aide à la décision pour les applications radar et sonar. L'objectif est de faire intervenir l'homme dans la boucle à différents niveaux de la prise de décision.
Le domaine de validité de la thématique concerne des systèmes de données hétérogènes et imparfaites (incertaines, imprécises) pour aider l'opérateur. Ces données sont celles rencontrées
dans les applications du laboratoire dans le cadre de l'extraction et l'exploitation de l'information en environnements incertains caractérisés par des systèmes radar et/ou sonar. La recherche
menée sur cette thématique est donc transverse et s'appuie globalement sur les recherches développées dans les deux autres thématiques : Modélisation et caractérisation de l'environnement,
et Représentation et extraction de l'information.
Ainsi, l'équipe se positionne de manière originale sur le plan nationale et internationale, d'une part par cette transversalité et d'autre part par le domaine de validité et des applications.
Mes travaux concernent essentiellement
Travaux au sein du Valoria 2002-2003
Sujet : Modèle
pour la prédiction linguistique favorisant la saisie de textes de
personnes handicapées.
Lieu : Université
de Bretagne Sud, Vannes
Equipe :
Laboratoire Valoria, équipe Equipage
Mots Clefs :
Traitement automatique des langues, Modèle de Langage, Prédiction
Linguistique, Aide à la Saisie, Dialogue Homme-machine.
Responsable : Pr. F. Poirier
Ce travail intervient en collaboration avec l’équipe
équipage du laboratoire Valoria dans une thématique d’aide
à l’interaction homme-machine, plus particulièrement j’interviens
dans le cadre de la thèse d’I. Schadle encadrée par J.-Y.
Antoine et B. Le Pévédic. Afin d’aider à l’intégration
de personnes atteintes d’un handicap sévère, il est essentiel
de mettre en œuvre des outils logiciels pour faciliter la saisie de textes
(traitement de textes, courrier électronique). Le principe est d’utiliser
des modèles stochastiques de langage afin de prédire la lettre
ou le mot que l’utilisateur veut saisir en fonction des mots et des lettres
du mot éventuellement déjà saisis. J’interviens au niveau
de l’amélioration du modèle de langage déjà réalisé
par I. Schadle ainsi qu’au niveau de l’évaluation intrinsèque
du modèle. L’originalité de l’approche de prédiction
proposée est de considérer, non pas les deux mots précédents
comme dans le cas d’un modèle trigramme ou d’un modèle à
base de classes, mais, lorsque c’est pertinent, le mot tête (i.e.
porteur de sens) du «groupe grammatical» courant, ou d’un des
deux précédents «groupes grammaticaux», ainsi
que celui de l’éventuelle préposition du «groupe grammatical»
courant. En effet ces mots ont une influence lexicale sur le mot à
prédire. Nous proposons également la prise en compte des mots
du vocabulaire de l’utilisateur à l’aide d’une classe supplémentaire.
Travaux de Thèse de 1998 à
2001
Titre :
Méthodes Robustes de Détection
de Parole dans le Bruit, pour la Reconnaissance Vocale
Lieu :
France Télécom R&D, Lannion
Equipe :
DIH/IPS/RVA
Lieu d'inscription : Université
de Rennes 1
Mots Clefs :
Détection de Parole, Reconnaissance Vocale, Méthodes d'évaluation
de la détection, Statistiques d'Ordre Supérieur, Fréquence
Fondamentale, Fusion de données et de décision
Directeur :
R. André-Obrecht
IRIT
- 118, route de Narbonne, 31062 Toulouse Cedex 4
Responsables : A. Gilloire et L. Mauuary
France Télécom R&D, DIH/IPS, 22307 Lannion Cedex
Présentation de la Thèse :
Pour réduire le coût des systèmes de reconnaissance
vocale, il est important de détecter les périodes d'activités
de la parole pour traiter le signal de parole différemment de celui
de non-parole. Avec le développement de la téléphonie
mobile, la qualité sonore est diminuée, d'une part par la
transmission de la parole, d'autre part par l'environnement souvent bruité
des appels. En outre la reconnaissance vocale est de plus en plus utilisée
dans des applications spontanées de dialogue Homme-Machine ; la
reconnaissance de parole continue nécessite une détection
plus précise des débuts et fins de détection.
Nous avons élaboré un algorithme de détection
de parole/non-parole plus robuste en milieu bruité et dans le cadre
de la détection de parole continue afin d’améliorer les performances
de la reconnaissance. Une partie importante de cette étude consiste
à réaliser des algorithmes d'évaluation du module
de détection pour évaluer les précédentes versions
d’algorithmes de détection utilisés à France Télécom
R&D. L’évaluation est constituée d’un programme permettant
d'une part une évaluation intrinsèque de la détection,
d'autre part une évaluation dans le système de reconnaissance
global.
Pour l'amélioration des performances, un système de
détection de parole/non-parole a été réalisé
à partir d’un automate, dont les transitions sont régies selon plusieurs conditions
associées à l’énergie :
- une première approche utilise les statistiques
d'ordre supérieur de l'énergie,
- une seconde approche utilise un degré de voisement
en complément de l'énergie,
- une troisième approche utilise une analyse factorielle
discriminante calculée sur les coefficients cepstraux.
La principale difficulté est d’intégrer une nouvelle
condition à l’automate afin de modéliser au mieux le passage
d’un état à l’autre. L’approche des moments d'ordre supérieur
calculés sur le logarithme de l'énergie vise à employer
l'information énergétique au mieux. Cette approche ne permet
pas de diminuer les détections de bruits. L’apport de la condition
à l’aide d'un degré de voisement a permis une amélioration
de la détection dans des milieux bruités ainsi que de la
détection de parole continue. Pour utiliser au mieux les données
du signal de parole employées par le système de reconnaissance,
une étude approfondie des méthodes de fusion de données
et de fusion de décisions a conduit à implémenter une
analyse factorielle discriminante effectuée sur les coefficients
cepstraux. Cette approche a également permis l’amélioration
des performances de la détection dans des milieux bruités et
de la détection de parole continue pour des applications de dialogue
Homme-Machine, et ainsi le coût CPU global du système de reconnaissance
a été diminué.
Stage de D.E.A. en 1998
Sujet :
Homogénéisation par une Analyse Multirésolution
Lieu :
INRIA
(Institut National de Recherche en Informatique et en Automatique),
Marseille (rattaché à Sophia Antipolis)
Projet :
SYSDYS
Mots Clefs :
Géostatistiques, Homogénéisation, Analyse Multirésolution,
Ondelettes, Opérateur de Darcy
Responsables : F. Campillo et F. Cerou
Travail :
La complexité du sous-sol, très hétérogène
et irrégulier, nécessite des méthodes de changement
d'échelle, comme l'homogénéisation. Pour approcher
les coefficients homogénéisés, l'analyse multirésolution
peut être utilisée. Mon travail a consisté à
l’implémentation de cette méthode en tenant compte des particularités
du problème posé afin de réduire le coût algorithmique.