OBJECTIFS

Lors du chapitre précédent on a établi la méthode permettant délaborer une loi de commande optimale u* qui minimise le critère :

Pour un système décrit par sa représentation détat :

La commande optimale u* a été élaborée pour un système en boucle ouverte

Inconvénients de la boucle ouverte 

Les systèmes ainsi commandés sont très sensibles aux perturbations et aux variations du modèle. La contre-réaction (i.e. bouclage des états sur les entrées ) améliore considérablement les performances du système vis à vis des perturbations. On cherche à réaliser la commande optimale u* à partie des entrées et des états du systèmes.

Figure 1

Hypothèses

- Le système est commandable.

On cherche à élaborer une loi de commande qui soit linéaire par rapport aux états , par conséquent,

- Le système est linéaire,

- Le critère est quadratique :

Doù lappellation L(inéaire)Q(uadratique).

En effet, lorsquon écrit les équation de Hamilton pour élaborer la commande optimale, on résoud Hu=0. Le gradient est alors une forme linéaire en u.

Dans ce cours, deux types de problèmes sont envisagés :

 Problème de régulation : On cherche à maintenir les états autour de 0. Le système peut être soumis à des perturbations qui affectent les états. Lobjectif est délaborer la commande optimale u* qui minimise le critère J en présence de perturbations.

Figure 2

 Problème de poursuite : Les états doivent suivre une trajectoire de consigne Xc, il faut établir la loi de commande optimale qui minimise le critère.

Figure 3

PROBLEME DE REGULATION

- Le critère quadratique :

Cest un problème classique de minimisation que lon traite avec les équations de Hamilton. Lobjectif est détablir une relation de la forme :

 

Hamiltonien

Pour applique le principe du minimum, on utilise les propriétés suivantes de la dérivation partielle vectorielle.

Equations de Hamilton

On réinjecte la commande optimale dans léquation détat

On a alors un système déquation différentielle sans second membre en X et en m

Figure 4

On intègre ce système déquations en tenant compte du coût terminal auquel il faut appliquer la condition de transversalité ( cf. chapitre V, ) :

$ On rappelle que lintégration de léquation détat fait intervenir la matrice de transition ( qui possède la propriété de transitivité ).

Compte tenu de la propriété de transitivité, on peut exprimer Z(t) depuis un nouvel état initial Z(t1). On a :

On exploite cette propriété pour intégrer X et m à partir des informations disponibles qui portent sur linstant final. Ces équations sintègrent à rebours.

 

 

La matrice de transition est de dimension ( 2n x 2n ).

Ce dernier résultat porté dans les équations détats et de Hamilton :

P P est fonction du temps

Il reste à déterminer P(t), comme

avec la condition terminale :

Remarque : P(t) est symétrique, définie semi-positive et son inverse et solution de léquation de Riccati.

On en déduit lexpression de la matrice de contre réaction K(t), comme :

La structure de la commande linéaire quadratique :

et

Figure 5

Lors de la réalisation de la commande, il est nécessaire dintégrer P à rebours avant dimplanter K(t). De plus, il convient de remarquer que la matrice de contre-réaction nest pas stationnaire ( dépendance vis à vis du temps ). Cest une difficulté majeure dans la réalisation de la commande.

Remarque :

P(t) est symétrique, définie semi-positive et son inverse est solution de léquation de Riccati.

On montre que la seconde variation de J est positive ( condition suffisante de minimum) car les matrices M, Q semi-positives et R positive.

Exemple

On se propose dans cet exemple de mettre en uvre une commande linéaire quadratique et de comparer les résultats obtenus ceux fournis par une commande optimale en boucle ouverte.

Le système étudié est un véhicule de masse m unitaire dont on veut maintenir la vitesse v(t) autour dune vitesse de consigne vc constante. Ce système est décrit par léquation détat : avec la condition initiale v(0) = 0

- le critère à minimiser : réalise un compromis entre la minimisation de lerreur le long de la trajectoire et lénergie dépensée.

- le vecteur détat choisi est lerreur de vitesse, x = v - vc quil faut maintenir autour de 0. Cest un problème de régulation.

où :

- La commande optimale a pour solution :

- La matrice de Riccati est solution de :

Résolution de léquation de Riccati à rebours : tr = t1 t :

- la condition terminale :

Les chronogrammes suivants représentent successivement la commande optimale, létat erreur de vitesse et la solution de léquation de Riccati pour q = 5 puis q = 1. Dans le premier cas, on privilégie le rattrapage de lerreur, objectif atteint au prix dune forte sollicitation de la commande. Dans le second cas, on atteint le même résultat moins rapidement ; en revanche, lénergie mise en jeu est moindre. On notera également que la solution de léquation de Riccati pour tr suffisament grand tend vers une valeur stationnaire qui est la solution positive du second membre de léquation de Riccati. En annexe, on trouvera les résultats relatifs au même système dont la loi de commande en boucle ouverte a été établie avec les équations de Hamilton.

Figure 6

 SYSTEME ET CRITERE STATIONNAIRE A HORIZON INFINI

Pratiquement, la difficulté de la réalisation réside dans lintégration à rebours de léquation de Riccati et dans limplantation de la commande K(t)= R-1.BT.P(t) qui doit être menée avant que le processus démarre. De plus, la commande dépend du temps. Lexemple montre que la loi dévolution de K(t) est stationnaire sur une plage importante et quelle tend vers la solution positive du second membre de léquation de Riccati. On saffranchit des conditions terminales en élaborant une commande sur horizon infini. Ce résultat est significatif si lhorizon détude est grand devant les constantes de temps du système.

La commande optimale qui minimise le critère

Q, R = Cte

fait appel à une matrice de contre réaction indépendante du temps.

U*(t) = -X(t) =R-1.B. la matrice définie semi-positive est solution de l'équation :

 

La commande est beaucoup plus facile à réaliser que dans le cas à horizon fini, en effet, elle ne dépend plus du temps.

Exemple

Les chronogrammes suivants mettent en évidence leffet dune commande LQ sur horizon infini pour le système étudié lors de l'exemple précédent. Les réponses obtenues sont quasi-identiques pour une commande beaucoup plus simple à réaliser.

Figure 7

PROBLEME DE LA POURSUITE

Les états sont astreints à suivre une trajectoire de consigne. Le critère a pour expression :

où Xc désigne la trajectoire de consigne.

On raisonne comme dans le cas de la régulation,

Hamiltonien

Equations de Hamilton

On réinjecte la commande optimale dans léquation détat

On a alors un système déquations différentielles non homogènes en X et en m traduites sous forme de schéma figure 6.

On exploite la condition de transversalité portant sur le coût final,

 

 

Les équations sont à intégrer à rebours comme dans le cas de la régulation. On cherche une solution de la forme :

On aboutit à ce résultat en utilisant la matrice de transition, attention, léquation comporte un second membre.

Figure 8

On porte lexpression de m(t) dans les équations détat et les équations des multiplicateurs de Lagrange :

Cette dernière équation est vérifiée quelque soit létat X. On retrouve léquation de Riccati dont la matrice P fournit la commande par retour détat dans le cas dun problème de régulation . Il faut de plus intégrer léquation qui correspond au régime forcé lié au problème de poursuite.

Ces équations sont à intégrer avec les conditions terminales :

.

Ces deux équations sintègrent à rebours puis sont implantées sur le correcteur ; ce qui pose des difficultés lors de la réalisation.

Figure 9

 Exemple

On reprend lexemple précédent. On désire maintenir létat vitesse autour dune consigne vitesse vc constante tout en minimisant la consommation dénergie. Cest un problème analogue au précédent excepté dans le choix du vecteur détat qui doit être maintenu autour de vc ( problème de poursuite ) et non plus autour de 0 ( problème de régulation ). Pour rendre évidente la notion de préfiltre, on traite ce problème sur horizon infini.

Equation du régulateur : K = -q

Equation du préfiltre :

On suppose le régime permanent atteint ( Rappelons quil faut intégrer à rebours et que lorigine des temps est linstant final quon fait tendre ici vers + )

Þ

comme

Le gain du préfiltre vaut -q.

Ce résultat était prévisible. On a établi dans le cours dasservissements linéaires que le gain statique dun système en boucle fermée était égal à soit dans lexemple étudié. Pour un problème de poursuite, on cherche à obtenir un gain en boucle fermée unitaire ; il convient donc de multiplier la consigne par q.