télécharger 63.32 Kb.
|
Journées nationales de l’UdPPC Paris de Sciences DE LA SYNTHÈSE DE VOYELLES À LA SÉPARATION DE VOIX,QUAND LE TRAITEMENT DU SIGNAL DEVIENT PARLANTCécile DurieuDépartement eea (Électronique, Électrotechnique et Automatique) ens de Cachan 61, avenue du Président Wilson 94235 Cachan courriel : cecile.durieu@ens-cachan.fr Résumé : La transformée de Fourier et la corrélation sont deux notions importantes en traitement du signal et qui sont utilisées dans de nombreux domaines. Différentes illustrations relativement simples de ces notions sont présentées dans cet article, certaines faisant intervenir des signaux sonores permettant d’apprécier à l’écoute le résultat des traitements. Citons, entre autres applications, la synthèse de voyelles, la détection de bruit impulsionnel et la séparation de sources.Mots clés : traitement du signal, transformée de Fourier, signaux aléatoires, corrélation, modèle ar, mesure de la vitesse du son, synthèse de voyelles, séparation de sources. 1. Introduction Le traitement du signal est une discipline qui fait appel à un ensemble de concepts mathématiques et qui s’appuie sur l’électronique et l’informatique pour sa mise en œuvre. Il fait également appel à la physique, entre autres, pour capter les signaux et aider à leur interprétation, pour modéliser les signaux et les systèmes. Le traitement du signal peut également aider à la compréhension de phénomènes physiques. Le champ d’applications est très vaste ; citons, par exemple, les télécommunications, la vidéo, le traitement de la parole, la robotique, le médical et l’astrophysique. De manière générale, un signal est une fonction d’une ou plusieurs variables telles que, par exemple, le temps, une température, une distance, une pression et est engendré par un phénomène physique : signal sonore, signal lumineux, image… Par exemple, un signal sonore correspond à de faibles variations de la pression, qui se propagent dans l’espace et que le système auditif d’un être humain est capable de capter, d’analyser et de percevoir l’information dont il peut être porteur. Un signal est, en général, le support à la transmission d’une information. La plupart des signaux manipulés correspondent à l’évolution temporelle d’une tension ou d’un courant délivré par un capteur. Le plus souvent, les signaux doivent être traités pour extraire l’information qui nous intéresse, traitement qui dépend du but poursuivi. La théorie du signal concerne les outils de description et de représentation des signaux et des systèmes dans le domaine d’origine – temporel le plus souvent – ou dans un domaine image, par exemple, fréquentiel, la mise en évidence des caractéristiques des signaux et des systèmes, leur analyse, leur modélisation et leur interprétation. Le traitement du signal s’appuie sur la théorie du signal et de l’information et concerne la manipulation des signaux pour transporter une information, la coder ou la protéger, ou pour la récupérer. La détection de la présence ou de l’absence d’un signal donné, l’amélioration d’un rapport signal sur bruit, la classification, la reconnaissance de formes et l’estimation de grandeurs, ou pour la compréhension des phénomènes physiques sont des exemples de problèmes traités. Le but de cet article est de présenter différentes notions importantes en traitement du signal et de les illustrer par des exemples relativement simples. Les exemples choisis mettent en jeu des signaux sonores car, en plus, de la visualisation des signaux et des résultats des traitements, on peut apprécier à l’écoute le résultat de ces traitements. Ces exemples sont pris dans les cours de traitement du signal de la première année du master ist (Information, Systèmes et Technologie) qui est en habilitation partagée entre l’ens de Cachan et l’université Paris-Sud 11. Avant d’aborder les exemples, la notion d’aléatoire est présentée ainsi que quelques grandeurs caractéristiques des signaux aléatoires. 2. L’aléatoire en traitement du signal Il existe des phénomènes physiques pour lesquels les grandeurs que l’on observe peuvent être formulées par des lois simples pourvu que l’on connaisse les phénomènes physiques mis en jeu et un nombre fini de paramètres. Les signaux qui en résultent sont dits déterministes ou encore certains. Par exemple, si on connaît l’amplitude, la fréquence et la phase à l’origine d’un signal sinusoïdal, on peut déterminer, sans erreur, son amplitude à tout instant. Cependant, il existe des phénomènes pour lesquels les grandeurs ne peuvent pas être décrites par des lois, même avec un nombre très grand de paramètres, ou qui sont trop sensibles aux conditions expérimentales (par exemple, jet de dé), ou que l’on ne peut pas prévoir. Faute de pouvoir donner la valeur des signaux associés à un instant donné, il est souvent possible de préciser une distribution des valeurs possibles, d’où l’idée de décrire ces signaux à des instants donnés par des variables aléatoires. Ainsi, un signal aléatoire ![]() ![]() ![]() ![]() ![]() t ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Figure 1 – Trajectoires d’un processus aléatoire Les différentes trajectoires d’un signal aléatoire décrivant un phénomène donné semblent posséder des caractéristiques communes comme, par exemple, une moyenne temporelle nulle, une puissance localisée autour d’une fréquence donnée. Un signal aléatoire est caractérisé, tout comme les signaux déterministes, par un certain nombre de grandeurs, par exemple, la moyenne temporelle des différentes réalisations et leur fonction d’autocorrélation temporelle [1]. Il est en plus caractérisé par des grandeurs statistiques, par exemple, sa moyenne statistique à un instant donné et sa fonction d’autocorrélation statistique [2]. Si toutes les moyennes statistiques sont invariantes par changement d’origine des temps, ce qui suppose que le processus soit « éternel », le signal est dit stationnaire. Si le signal est en plus ergodique, les moyennes temporelles sont alors indépendantes des réalisations et elles sont égales aux moyennes statistiques. On peut alors décrire le signal uniquement à partir d’une seule trajectoire, et les propriétés statistiques peuvent être déterminées à partir de l’analyse temporelle d’un seul signal. Dans la suite, quelques définitions de moyennes, sous réserve d’existence, sont rappelées. Les traitements présentés dans cet article étant numériques, les signaux considérés résultent de l’échantillonnage de signaux analogiques. Soient ![]() ![]() ![]() ![]() La moyenne temporelle d’un signal ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Un certain nombre de signaux considérés sont des cas limites de signaux de puissance finie. Pour de tels signaux ![]() ![]() ![]() ![]() ![]() ![]() Soit ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Pour des signaux aléatoires stationnaires et ergodiques, on a ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Dans la pratique, les signaux étant enregistrés sur ![]() ![]() ![]() ![]() et ![]() ![]() ![]() Un bruit blanc, défini par analogie avec la lumière blanche, est un signal aléatoire stationnaire et ergodique tel que sa densité spectrale de puissance est constante. Sa fonction d’autocorrélation est alors ![]() ![]() ![]() ![]() ![]() 3. Mesure de la vitesse du son [4] La première application concerne la détermination de la vitesse du son qui est effectuée en mesurant le retard ![]() ![]() Le retard pourrait être mesuré très facilement avec un signal émis très bref, par exemple, un claquement. Cependant, afin de justifier l'utilisation de la fonction de corrélation, le signal émis est un « che ». Un exemple de signal reçu par les microphones est représenté sur la figure 3, avec ![]() ![]() ![]() ![]() ![]() ![]() Figure 2 Illustration de la manipulation ![]() Figure 3 Signaux enregistrés, ![]() ![]() ![]() Figure 4 Spectre normalisé des signaux Pour l'étude théorique, le signal à analyser est supposé être une réalisation d'un processus aléatoire stationnaire. La fonction d'intercorrélation théorique ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Figure 5 Intercorrélation entre les signaux ![]() ![]() 4. Synthèse de voyelles [4] Le traitement de la parole est un domaine d’application important du traitement du signal. On distingue deux types de sons : les sons voisés, par exemple, un « a » ![]() ![]() En première approximation, on peut considérer qu'une voyelle est un motif élémentaire qui est répété ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() La production des sons est un phénomène complexe et difficile à modéliser. Elle est conditionnée par l’anatomie de l’appareil vocal. De façon simplifiée, le conduit vocal peut-être modélisé par une suite de cavités dont la forme évolue au cours du temps et qui sont traversées par un flux d’air provenant des poumons. Le conduit vocal peut être modélisé par un filtre générateur qui correspond à une mise en cascade de filtres résonnants. Lorsque l’on manipule des signaux échantillonnés, la relation entre le signal d’entrée ![]() ![]() ![]() où ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Figure 6 Voyelle « a » enregistrée et zoom ![]() ![]() Figure 7 Spectre de la voyelle « a » Dans le cas purement théorique où l'on connaîtrait la fonction de corrélation, il suffirait de résoudre ce système d'équations linéaires pour en déduire les coefficients du filtre. Mais, tout comme précédemment, la fonction de corrélation n'est pas connue et l'approche consiste toujours à estimer la fonction de corrélation à partir des échantillons disponibles du signal que l’on suppose stationnaire et ergodique, à reporter ces valeurs estimées dans les équations de Yule-Walker, puis à résoudre ces dernières. Il faut évidemment choisir un estimateur de la fonction de corrélation. Si l’estimateur non biaisé est retenu, le filtre identifié peut être instable. On retient alors l’estimateur biaisé de la fonction de corrélation garantissant la stabilité du filtre. Reste à déterminer l'ordre du filtre. Pratiquement un ordre ![]() ![]() Le filtre auto-régressif identifié peut ensuite être étudié : lien entre sa réponse impulsionnelle, sa réponse en fréquence et la position de ses pôles (Figures 8 et 9). ![]() Figure 8 Réponse impulsionnelle (en haut) et réponse en fréquence du filtre (en bas) ![]() Figure 9 Pôles du filtre et pôles dominants () Le signal d’excitation estimé, encore appelé signal résiduel, obtenu par filtrage de fonction de transfert ![]() ![]() ![]() Figure 10 Signal résiduel pour un son voisé et zoom ![]() Figure 11 Signal résiduel pour un son non voisé Pour la synthèse, qui consiste à reconstruire le signal de parole à partir d’un signal d’excitation, le type d’entrée est pris en compte. Pour un son voisé, le signal d’excitation du filtre précédemment identifié est un train d’impulsions alors que pour un son non voisé, le signal d’excitation est de type bruit blanc gaussien. La démarche expérimentale est résumée sur la figure 12. Il existe des méthodes qui permettent de détecter la valeur du pitch. ![]() Figure 12 Synthèse des sons voisés et non voisés par filtrage tout-pôle Le signal synthétisé ![]() ![]() ![]() ![]() Figure 13 – Voyelle synthétisée et son spectre Le modèle tout-pôle est à la base de méthodes plus sophistiquées de traitement, d’analyse et de synthèse de la parole. Il est également utilisé dans de nombreux autres domaines comme nous allons le voir. Signalons que la synthèse de parole par modèle ar correspond encore à une compression des données ou un codage. En effet, pour un signal échantillonné à ![]() ![]() 5. Détection de bruit impulsionnel [5] Le modèle ar que nous avons vu précédemment peut être utilisé pour détecter un bruit impulsionnel d’amplitude assez grande, présent dans un signal, par exemple, le craquement présent dans un signal enregistré sur un disque vinyle, dans le but d’éliminer ce bruit. Des implusions, même très faibles sont perceptibles à l’écoute (cf. signal sans bruit impulsionnel ![]() ![]() ![]() Les valeurs du signal en sortie du filtre blanchisseur sont ensuite comparées à un seuil qui peut être calculé sous l’hypothèse de bruit gaussien (typiquement ![]() ![]() (a) en haut : signal non bruité (c) en haut : bruit (b) en bas : zoom du signal bruité (d) en bas : sortie du filtre blanchisseur Figure 14 – Différents signaux 6. Analyse en composantes indépendantes pour la séparation de sources [6] Le cocktail party problem est le problème type que tente de résoudre l’analyse en composantes indépendantes (ica). Lors d’une réception animée, il s’agit d’isoler ce que dit chaque participant à partir d’enregistrements du brouhaha ambiant. Ce problème, dit de séparation de sources, se rencontre aujourd’hui dans de nombreuses applications. Ainsi, il s'agit, par exemple : − en électroencéphalographie de séparer les signaux utiles d’artéfacts dus au clignement des yeux, − en astrophysique de classer des objets célestes à partir d’images obtenues dans différents domaines spectraux, − en télécommunications, dans un contexte d’accès multiple par code (cdma), de séparer différents utilisateurs partageant les mêmes ressources fréquentielles et temporelles. Dans le cas général, l'objectif est d'estimer ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() À titre illustratif, les signaux sources correspondant au mot « bonjour » ![]() ![]() ![]() ![]() La séparation aveugle de sources consiste à rechercher, à partir de ![]() ![]() ![]() Pour mesurer l'indépendance de variables aléatoires, on pourrait mesurer l'écart entre la densité de probabilité conjointe (densité de probabilité du vecteur ![]() ![]() Un critère couramment utilisé pour tester le caractère gaussien d'une variable aléatoire ![]() ![]() ![]() ![]() La première étape consiste à centrer les données en remplaçant ![]() ![]() ![]() ![]() On constate que le blanchiment des données (Figure 15-c) ne suffit pas à rendre les signaux indépendants ![]() ![]() ![]() ![]() 7. Conclusion Les exemples donnés dans cet article ont permis de présenter et d’illustrer quelques notions de traitement du signal très souvent utilisées et à la base de méthodes plus performantes que celles présentées dans l’article. ![]() ![]() ![]() ![]() (a) en haut : signaux émis (b) en haut : signaux observés (c) en bas : signaux blanchis (d) en bas : signaux estimés Figure 15 Signaux à l’issue des différentes étapes Bibliographie[1] Jean-Pierre Delmas. Éléments de Théorie du Signal : les Signaux Déterministes, Ellipses. [2] Maurice Charbit. Éléments de Théorie du Signal : les Signaux Aléatoires, collection pédagogique de télécommunication, Ellipses. [3] Jean-Pierre Delmas. Introduction aux Probabilités, collection pédagogique de télécommunication, Ellipses. [4] Cécile Durieu. Illustration pédagogique du concept de corrélation : mesure de la vitesse du son et synthèse de voyelles. Journal sur l'Enseignement des Technologies et Sciences de l'Information et des Systèmes (j3ea), http://www.edpsciences.org/journal/index.cfm?edpsname=j3ea, Vol.1-4, edp Sciences, 2002. [5] Gérard Blanchet, Maurice Charbit. Signaux et Images sous Matlab. Hermès. [6] Cécile Durieu, Michel Kieffer. Analyse en composantes indépendantes pour la séparation de sources. Numéro spécial de j3ea, edp Sciences, suite au Colloque sur l'Enseignement des Technologies et des Sciences de l'Information et des Systèmes (cetsiseea 2003), Toulouse. |
![]() | «pousser» et Na, «saisir». Ce sont les deux types de méthodes les plus couramment utilisées dans le massage chinois | ![]() | |
![]() | ![]() | ||
![]() | «mérite» ont dans notre langue une connotation morale qui peut gauchir la notion grecque d’arété. Le monde des cités grecques peut... | ![]() | «personnages» avec deux oreilles (ce ne sont pas de vrais personnages, on est déjà dans le domaine de l’imaginaire), ils ouvrent... |
![]() | Postliminaire '. La phase liminal est quand les choses ne sont pas comme ils sont dans le monde ordinaire: les rôles peuvent être... | ![]() | «menus» sont proposés à nos élèves de Terminale. Les 5 professeurs se partagent l’ensemble des élèves qui se sont déterminés en début... |
![]() | «poumon du fumeur». En général, 10 paquets-années, ce qui correspond au fait de fumer un paquet par jour pendant 10 ans, sont nécessaires... | ![]() |