POSITION DU PROBLEME

On considère un processus décrit par une représentation détat discrète, il sagit soit dun processus discret, soit dun processus continu discrétisé.

Exemple : Le SCAO ( système de contrôle et dattitude et dorbite dun satellite ). Le contrôle dattitude est important pour que les caméras du satellite restent pointées sur la terre. Or le satellite a tendance à se dépointer sous laction de perturbations aléatoires ; celles-ci affectent les états ( attitude et vitesses autour du centre de gravité ) du satellite.

Les capteurs ( gyromètres, senseurs STD et SSD ) pour la mesure des vitesses ( roulis, tangage, lacet ) et d'attitude ainsi que leur chaîne de traitement sont sujets aux bruits (thermique, grenaille, 1 / f, quantifiquation, dérives etc.). N'hésiter pas à consulter l'excellent site du CNES dédié à SPOT4

Problème résolu par le filtre de Kalman

Lestimation optimale des états X(i) dun système dynamique soumis à des entrées déterministes et aléatoires à partir de mesures bruitées Y(l), Y(l-1) , Y(- ) passées et présentes. Lestimation est optimale au sens dun critère quadratique. Les estimations sont linéaires vis à vis des mesures.

Trois types de problème sont envisageables :

i > l : Prédiction : Présente un intérêt lorsque le système devient non mesurable.

i = l : Filtrage : Elimination des bruits de mesure.

i < l : Lissage : Peut être utile pour analyser " après-coup " le comportement dun processus.

Dans ce cours on envisage le problème du filtrage.

Exemple dapplication du filtre de Kalman au SCAO

 

Il sagit destimer au mieux les états ( vitesse et attitude ) du satellite, ce rôle est dévolu au filtre de Kalman. Le but étant ensuite délaborer une commande optimale qui minimise les écarts de position par rapport à laxe de pointage terre.

Remarque : Daprès le théorème de séparation des états, on sépare le problème de lobservation de celui de la commande.

Observation stochastique des états ( filtre de Kalman ).

Elaboration dune loi de commande ( modale, LQ ).

Autres exemples dapplication du filtre de Kalman

Guidage du lanceur Ariane ( début des années 80 ).

Application industrielle : La commande des moteurs asynchrones ( 90 % des moteurs utilisés dans lindustrie ) requiert la mesure des flux, de la vitesse et de la position de la machine, ces états sont reconstruits à partir de la mesure des courants statoriques. Au niveau expérimental, limplantation de filtres de Kalman dédiés à cette application date du milieu des années 90.

QU'EST-CE QU'UN BON FILTRE ?

Le système évolue dans un environnement bruité et les mesures auxquelles on procède le sont également. Au travers dun exemple, on envisage plusieurs cas de figure pour lesquels le filtre doit fournir la meilleure estimée des états.

 

Exemple : Suivi de la trajectoire dun lanceur.

 

1 cas

Le modèle du lanceur est parfaitement connu, il ny a pas de perturbation, les conditions initiales sont connues.

Le modèle a pour équation : , daprès les c.i, on résout ð .

La trajectoire est également obtenue daprès le modèle

Dans ce cas, le filtre établit lestimation des états uniquement daprès le modèle de la représentation détat. Il vaut mieux ne pas prendre en compte les mesures. Celles-ci, bruitées, entacheraient derreurs la trajectoire observée.

2 cas

Le modèle est mal identifié, il y a des perturbations, conditions initiales connues.

Le filtre doit générer une estimation optimale des états et des mesures en exploitant au mieux les informations dont il dispose i.e.

- le modèle, les conditions initiales et les commandes ð approche déterministe

- les mesures. Par comparaison des mesures effectuées sur le système à celles que lui fournit lapproche déterministe.

ð Le filtre fournit estimation optimale des états et de la trajectoire. Cette estimation est du type :

Dans le cas général, lestimation résulte dune pondération entre la connaissance apportée par le modèle et les mesures.

Avant dentrer dans les détails du filtre de Kalman, on rappelle quelques notions de probabilités utiles.

RAPPELS

Remarque : Dans les expressions qui suivent les sommations sont continues, cela signifie que les convertisseurs numérique-analogique et analogique-numérique ont un pas de quantifiquation infiniment petit.

La densité de probabilité

p(x1,x2...xn) qui vérifie : Prob(x'< x < x +dx) = p(x).dx1.dx2...dxn

et lévénement certain.

Illustration dans le cas d'un vecteur à 2 composantes dont les densités de probabilités sont gaussiennes.

La valeur moyenne ou espérance mathématique

Le vecteur est dit centré lorsque E[ X ] = 0

La matrice de variance

Sxx = Var[X] =

Sxx =

Sxx=

La matrice de variance est symétrique définie positive.

Les termes diagonaux sont les variances des variables aléatoires : sii2 = et mesurent la dispersion des valeurs prises par xi autour de la valeur moyenne .

La trace de la matrice de variance représente la somme des variances

Trace S =

Lorsque les composantes non diagonales , les états xi, xj avec i j sont non corrélés, i.e. la connaissance de xi napporte aucune information sur celle de xj . Dun point de vue géométrique, cela revient à établir que les composantes sont orthogonales, est en fait un produit scalaire.

Lorsque la matrice est diagonale, tous les états sont non corrélés.

La matrice de covariance

Sxy = Var[X, Y] =

La covariance peut porter sur deux vecteurs différents X et Y ou sur un même vecteur considéré à des instants différents [ X(i), X(i + k )].

SIGNAUX ET SYSTEMES

Bruit blanc

Définition et propriétés

Dans ce cours, on suppose les états et les mesures bruités par des bruits blancs. Le bruit blanc discret b est défini comme un processus stochastique dont la densité spectrale de puissance reste constante sur une bande de fréquence [+fe/2, -fe/2]. fe est la fréquence d'échantillonnage.

Figure 6

Sbb(f) représente la distribution fréquentielle de la puissance totale du signal. La densité spectrale de puissance est par définition la transformée de Fourier de la covariance notée Cov[b(i,j)]. Ceci sous réserve que le bruit soit centré et en faisant lhypothèse dergodicité.

On a :

Cov[ b(i,j) ] = F-1{Sbb(f)}

 

Figure 7

Quelle signification donner à la covariance de b ?

La covariance de b, Cov[b(i,j)] montre comment la valeur prise par b(i.Te) influence la valeur prise par b(i.Te + j.Te ).

Pour j = 0, la ressemblance de b(i.Te) et b(i.Te+ j.Te ) est totale et la covariance Cov[b(i,i)] est égale à Var[b] qui est aussi la puissance du bruit.

Lorsque Cov[b(i,j)] = 0, la valeur prise par b(i.Te) ninfluence pas b( i.Te+ j.Te ). Les bruits sont décorrélés.

La covariance d'un bruit blanc discret s'écrit :

Avec dij = 0 si i j et dij = 1 si i = j

 

Cas vectoriel

On considère le cas dun vecteur de bruits blancs ( cas des n bruits blancs associés à chaque état)

Sbb = Cov[b(i), b(j)] = B(i).dij dij = 0 si i j et dij = 1 si i = j

Sbb= = B(i).dij

Le système

Modèle discret ou obtenu par discrétisation , il possède m entrées, s sorties et n états.

 

 

Equations du processus stochastique :

la moyenne de X

la covariance de létat

W(i) le bruit détat, blanc et centré

la covariance du bruit détat

V(i) le bruit de mesure, blanc et centré

la covariance du bruit détat

les bruits détat et de mesure sont non-corrélés

les états et les bruits de mesure sont non-corrélés

létat initial et les bruits détat sont non-corrélés

On montrerait comme dans le cas continu que le processus stochastique discret est lassociation dun processus stochastique de mesure et dun processus markovien.

Filtre de Kalman discret

On rappelle le problème résolu par le filtre de Kalman ; lestimation optimale des états X(i) dun système dynamique soumis à des entrées déterministes et aléatoires à partir de mesures bruitées Y(l), Y(l-1) , Y(- ) passées et présentes. Lestimation est optimale au sens dun critère quadratique. Le critère est la minimisation de lerreur destimation :

Les estimations sont linéaires vis à vis des mesures.

Notations :

 : estimation de létat xi sachant les mesures yl , yl-1 , , y- effectuées.

 : erreur destimation de létat xi sachant les mesures yl , yl-1 , , y- effectuées.

 : la variance de lerreur destimation de létat xi sachant les mesures yl , yl-1 , , y- effectuées.

Principe du filtre de Kalman

Le système est décrit par : est observable

Le modèle quon en a établi :

Le filtre de Kalman procède en deux étapes pour estimer au mieux létat xi+1.

Première étape : Après la ième mesure, on suppose que lon dispose dune estimation optimale de létat du système. Cette estimation est traitée par le modèle du système qui fournit une prédiction de létat et de la mesure . Ces prédictions sont entachées derreurs. Cette étape est appelée prédiction elle est déterministe.

Seconde étape : A linstant i+1 on procède à la mesure de yi+1 ( également bruitée ), on compare cette mesure avec la prédiction . Lécart ( mesure prédiction de la mesure ) est traité puis réinjecté dans le modèle pour corriger au mieux lerreur de prédiction. On dispose dune nouvelle estimation optimale qui servira a estimer létat suivant xi+2. Le filtre de Kalman est récursif.

Quest-ce que la prédiction

On cherche la meilleure estimation de xi+1 sachant les mesures y(i), , y(- ). On envisage les cas suivants où la commande est choisie égale à zéro pour simplifier l'étude.

1 cas :

Lestimation de létat xi est parfaite Þ

Il ny a pas de bruit détat Þ Wi = 0

Þ erreur destimation :

Il est inutile de procéder à la mesure de yi+1 sinon à ajouter des erreurs.

On choisit pour lestimation

 

2 cas :

Lestimation de létat xi est parfaite Þ

état bruité wi 0

 

Þ erreur destimation :

 

3 cas :

Lestimation de létat xi est imparfaite Þ

état bruité wi 0

Þ erreur destimation a priori :

Interprétation géométrique de la prédiction

La meilleure prédiction de létat xi+1 est celle qui minimise le carré de lerreur de prédiction : . Ce qui revient à minimiser la distance , xi+1. Cest donc la projection orthogonale de xi+1 sur le sous espace vectoriel des estimations obtenues par filtrage linéaire ( i.e. combinaison linéaire ) des mesures y(i) , y(i-1), , y(- ).

Remarque 1: lindice ns indique que les n états estimés sont une combinaison linéaire des s mesures.

Remarque 2 : Lespace vectoriel Hn est lespace vectoriel des signaux de puissance finie encore appelé L, il est muni du produit scalaire ( hilbertien ).

 

Remarques sur la prédiction

Si pour une raison quelconque on ne dispose plus des mesures, on peut à partir de la dernière mesure prédire les états futurs. Le problème de la prédiction est complètement déterministe.

Ce type de problème est rencontré par le mini-satellite HETE qui se positionne grâce au système GPS. Or ce récepteur ne peut être vu des satellites NAVSTAR que pendant 20 minutes alors que sa période de révolution est de 95 minutes. Le satellite doit prédire sa position pendant les 75 minutes restantes.

Quest-ce que lestimation

La prédiction a fourni telle que soit minimum. Lestimation consiste à exploiter la i+1 ème mesure pour affiner la prédiction.

 

On cherche la meilleure estimation de xi+1 sachant les mesures y(i+1) , y(i), , y(- ). Ce qui équivaut à soit minimum.

Comment la mesure peut-elle enrichir la connaissance de létat xi+1 ?

et

De la i+1 ème mesure on tire :

La mesure nous renseigne sur lerreur de prédiction , au bruits de mesure près. Si la mesure est très bruitée, cette information présente peu dintérêt, il vaut mieux sen tenir à la prédiction.

Interprétation géométrique

La mesure yi+1 et par suite lerreur de mesure enrichit le sous espace vectoriel des estimations obtenues par filtrage des mesures yl , yl-1 , , y- du sous espace vectoriel . Soit le nouveau sous espace vectoriel des estimations obtenues après filtrage des mesures passées et présentes. Lestimation qui minimise lerreur destimation est la projection orthogonale de xi+1 sur le sous espace vectoriel .

ð Cest la projection orthogonale de xi+1 sur soit

ð Cest la projection orthogonale de xi+1 sur . Cette projection orthogonale est une combinaison linéaire de lerreur de mesure qui peut sécrire : Ki+1 est le gain de Kalman.

Equations de Kalman

prédiction de létat

variance de lerreur de prédiction

gain de Kalman

estimation de létat

variance de lerreur destimation

Ces équations sont à itèrer avec les conditions initiales :

 : état initial estimé,

 : variance initiale de lerreur de prédiction.

Ces grandeurs traduisent la connaissance que lon a a priori du système.

Interprétation des équations de Kalman

estimation = prédiction + innovation

  

Algorithme du filtre de Kalman

 

Le test de divergence

Il est nécessaire de valider les estimations ; en effet, le filtre de Kalman étant récursif, un biais peut par exemple être à lorigine dune divergence du filtre. On se souvient quon seulement accés aux mesures :

matrice (s * s) dont les termes diagonaux skk(i+1|i) ( où k Î [1,s] ) sont les variances des erreurs de mesure.

Dans le gas Gaussien, pour quune variable aléatoire ait une probabilité de 99 % dappartenir à un domaine, il faut que cette variable aléatoire soit comprise dans un domaine de +/-3s autour de sa moyenne. Comme lestimateur est non biaisé , le test de divergence vérifie pour la kième mesure k Î [ 1 , s ] à linstant i+1 que .

Implantation du filtre de Kalman

La difficulté dimplantation du filtre de Kalman sur un calculateur réside dans le volume de calculs à traiter à chaque étape ( il sagit de calculs matriciels ! ). La commercialisation de processeurs de signaux bons marché est très récente ; ainsi jusquà présent lemploi du filtre de Kalman était dédié aux applications très spécialisées (aéronautique, technologies spatiales ). On peut néanmoins proposer quelques améliorations visant à limiter le volume de calculs.

A propos du gain de Kalman

Ce gain ne dépend pas des mesures, il est donc possible de le calculer avant de démarrer le système ( off-line).

 

Exemple d'application : Estimation de l'attitude d'un satellite de la famille SPOT

La restitution d'attitude a pour données les informations fournies par les capteurs :

Senseur d'acquisition terrestre ( STD ) fournit les angles de tangage q et de roulis f.

Senseur d'acquisition solaire ( SSD ) fournit l'angle de lacet y.

Des gyromètres fournissent le vecteur rotation instantanée absolue ( par rapport au repère inertiel ).

La mesure gyrométrique fournit une estimation de l'erreur d'attitude mais qui nécessite d'être recalée à long terme à cause de la dérive des gyromètres. Les mesures gyromètriques sont prélevées à la cadence de 8 hertz.

Le recalage est réalisé à partir des mesures fournies par les senseurs. à partir des mesures brutes de l'attitude ( senseurs SSD et STD. On procède au recalage à basse fréquence (moins de 1 hz ).

Pour de plus amples informations on se reportera à Technologies et techniques des véhicules spaciaux, tome 2 aux éditions Cèpaduès.