Observadores de Alta Ganancia sobre Sistemas No Lineales MIMO y SISO

June 8, 2017 | Autor: Harvey Sierra Coley | Categoría: Gpr
Share Embed


Descripción

1

Observadores de Alta Ganancia sobre Sistemas No Lineales MIMO y SISO Teniente de Navío Harvey Sierra Coley

Abstract—In this paper, we utilize dynamic inversion, Feedback Linearization and High Gain Observers to Stabilize two systems. Dynamic Inversion and Feedback Linearization are used to design a State Feedback Controller and High Gain Observers are used to design an Output Feedback Controller by estimate the states in a MIMO and SISO systems, respectively. The goal is demonstrate that is possible recover the performance of SFB through a SIMULINK simulation. Index Terms—HGO, MIMO, SISO, Péndulo Invertido, Simulink, Sistemas No Lineales, Feedback Linearization.

I. I NTRODUCCIÓN ste documento muestra fundamentalmente el diseño y la simulación de Observadores de Alta Ganancia para sistemas No Lineales de Múltiples Entradas y Múltiples Salidas -MIMO- y para Sistemas de una entrada y una salida -SISO. En la primera parte se desarrollarán las dinámicas de un Sistema de Múltiples Entradas y Múltiples Salidas, específicamente un Péndulo Invertido sobre un carro [1]. Posteriormente, se desarrollará la técnica de Inversión dinámica y se efectuará el diseño de un controlador por realimentación de estados -SFB- realizando el seguimiento de trayectorias [1],[2],[3] y se diseñará un control por realimentación de las salidas -OFB y se efectuará la simulación en SIMULINK de ambos controles.

E

En la segunda parte se replicará un ejemplo de un sistema SISO [4], efectuando la técnica de Feedback Linearization a fin de diseñar el control SFB y se desarrollará un control OFB mediante un Observador de Alta Ganancia -HGO. Finalmente se harán las respectivas simulaciones y se variará el valor de ε del controlador OFB para lograr recuperar los valores de desempeño de las variables de estado del sistema controlado por SFB, explicando el fenómeno de Pico, el cual es intrínseco al diseño de Observadores de Alta Ganancia [4]. II. DINÁMICAS DE UN PÉNDULO INVERTIDO Las dinámicas descompuestas del sistema se muestran en la Figura 1. Las dinámicas que actuan sobre el carro son: F +Tsin α = mc x ¨

(1)

ˆi ⇒ −T senα = mp apx

(2)

ˆj ⇒ −T cosα − mp g = mp apy

(3)

y sobre el péndulo:

De la misma manera, la aceleración del péndulo depende de la aceleración del carro y de la aceleración del péndulo

relativa al carro ap = ac + ap/c = x ¨ˆi + [lα ¨ eˆα − lα˙ 2 eˆr ] = 2 ˆ ˆ ˆ ˆ x ¨i + l α ¨ [cos αi − sin αj] − lα˙ [sin αi + cos αˆj]. Reemplazando las componentes horizontales y verticales de la aceleración del péndulo, (2) y (3) se reescriben así: −T sin α = mp x ¨ + lmp α ¨ cos α − lmp α˙ 2 sin α 2

−T cos α − mp g = −lmp α ¨ sin α − lmp α˙ cos α

(4) (5)

Finalmente se obtienen las ecuaciones que representan las dinámicas del sistema. Con el objetivo de eliminar la Tensión de (1), (4) y (5), se efectúa una combinacion lineal de la forma (4) cos α + (5) sin α obteniendo (6). Por otra parte, reemplazando (4) en (1) y despejando F se obtiene (7). cos α¨ x + lα ¨ = g sin α

(6) 2

F =(mp + mc )¨ x + lmp cos αα ¨ − lmp α˙ sin α

(7)

Fig. 1. Dinámicas descompuestas del Péndulo Invertido

A. Inversión Dinámica Si se utiliza como entrada F =(mp + mc )u + lmp cos αα ¨− lmp α˙ 2 sin α, entonces de (7) se tiene que x ¨ = u, reemplazandolo en (6) y despejando α ¨ , se obtiene el modelo dinámico no lineal descrito en (8). cos α g sin α − u (8) l l El proceso de inversión dinámica es descrito ampliamente en [2]. Teniendo en cuenta que el sistema dinámico de (8) es de la forma α ¨ = f (α, u), entonces se puede incorporar un pseudo control ve = f (α, u), de tal manera que la dinámica resultante quede en forma de integradores puros α ¨ = ve , reemplazándolo en (8) y despejando se obtiene la estrategia de control u en función del pseudo control ve . i l hg u= sin α − ve (9) cos α l α ¨=

2

Definiendo x1 = x, x2 = x˙ 1 = x, ˙ x˙ 2 = x ¨1 = x ¨ = u, α1 = α, α2 = α˙ 1 = α˙ y α˙ 2 = α ¨1 = α ¨ = ve como variables de estado se tiene el siguiente sistema:

De la misma manera, como se muestra en [3] se asume que: αr0 w α˙ r , α”r w α ¨r Finalmente, utilizando las ecuaciones (10), (11), (12), (13) y (14), se obtiene el modelo estable del sistema, así:

x˙ 1 = x2   sin α1 l x˙ 2 = g − ve cos α1 cos α1

(10)

x˙ 1 = x2

α˙ 1 = α2 x˙ 2 = g

α˙ 2 = ve

sin(eα1 + αr ) l − ve cos(eα1 + αr ) cos(eα1 + αr )

B. Seguimiento de Trayectorias

e˙ α1 = eα2

En este punto se cuenta con dos subsistemas: subsistema x y subsistema α, donde el controlador para este último es de tipo PD y busca solucionar el problema de seguimiento de trayectorias de referencia αr , donde

e˙ α2 = ve

eα1 = e = α − αe = α1 − αr

(11)

eα2 = e˙ = α˙ − αr0 = α2 − αr0

(12)

(18)

ε2 α˙ e = −(g sin αe − vext cos αe ) III. D ISEÑO DE LOS O BSERVADORES DE A LTA G ANANCIA Para diseñar el Observador de Alta Ganancia considere un sistema No Lineal de segundo orden de la forma

e¨ = α ¨ − α”r = ve − α”r Entonces el controlador PD se muestra en (13): 

ve = α”r − (β2 e˙ + β1 e) = α”r − β2 α2 −

α0r



x˙ 1 = x2 

+ β1 (α1 − αe ) (13)

x˙ 2 = φ(x, u)

(19)

ve = −β2 eα2 −β1 eα1 +(α”r − α ¨ r )+β2 (αr0 − α˙r )+β1 (αe −αr ) y = x1 Reemplazando (13) en e¨ = ve − α”r , se tiene que e¨ + (β2 e˙ + β1 e) = 0 ⇒ s2 + β2 s + β1 = 0 y la solución de esta ecuación determina las constantes β1 y β2 del controlador PD, de tal forma que sea Hurwitz. Las trayectorias de referencia deseada están dadas por (15 ) y (16) y los valores de αr y αe son la solución de: ε2 α˙ e = −(g sin α˙ e − vext cos αe )

(14)

α ¨r =

−(v˙ ext cos αr )

Para implementar dicho control tomando solo la medida de la salida y se debe usar el observador expresado en (20). Una explicación detallada se puede encontrar en el Capítulo 14 de [4]. H1 x ˆ˙ 1 = x ˆ2 + (y − x ˆ1 ) ε

0 = −(g sin αr − vext cos αr ) v˙ ext cos αr α˙ r = (g cos αr + vext sin αr )

donde x = [x1 , x2 ]T y la ley de control por realimentación es locally Lipschitz u = γ(x) y estabiliza el sistema de lazo cerrado x = 0.

(15)

(−v˙ ext α˙ r sin αr + v¨ext cos αr ) (g cos αr + vext sin αr )

(−g α˙ r sin αr + vext α˙ r cos αr + v˙ ext sin αr ) (g cos αr + vext sin αr )2 (16)

H2 x ˆ˙ 2 = φ0 (ˆ x, u) + 2 (y − x ˆ1 ) (20) ε Para el caso del péndulo invertido y tal como se explicó anteriormente, el modelo se efectua por medio de dos subsistemas, para lo cual se diseñará un Observador de Alta Ganacia Extendido (OAGE) para el susbsistema x y un Observador de Alta Ganancia (OAG) para el susbsistema α. El sistema quedará de la forma: x˙ 1 = x2

donde vext = −γ2 x2 − γx1 v˙ ext = −γ2 x˙ 2 − γ1 x˙ 1 v¨ext = −γ2 x ¨ 2 − γ1 x ¨1

x˙ 2 = u − σ ˆ 1 + σ1 (17)

α˙ 1 = α2 α˙ 2 =

 cos α  g 1 sin α1 − u l l

(21)

3

 1 donde σ1 = (mp +m lmp α22 sin α1 − lmp (cos α1 )α˙ 2 . Y c) aplicando los Observadores, se tiene: H11 x ˆ˙ 1 = x ˆ2 + (x1 − x ˆ1 ) ε H12 ˆ1 ) x ˆ˙ 2 = u + 2 (x1 − x ε H13 σ ˆ˙ 1 = 3 (x1 − x ˆ1 ) ε

(22)

H21 (α1 − α ˆ1) α ˆ˙ 1 = α ˆ2 + ε donde u = β1 (ˆ α1 − αe ).

g l

tan α ˆ1 −

ve cos α1

y ve = αr ” − β2 (ˆ α2 − αr0 ) −

IV. S IMULACIÓN SISTEMA MIMO P ÉNDULO I NVERTIDO La intención es demostrar que el sistema controlado por realimentación de las salidas (Output Feedback Controller), puede replicar el desempeño del controlador por realimentación de estados (State Feedback Controller). La estrategia principal consiste en hacer ε lo más pequeño posible, de tal manera que tienda a cero, a fin de lograr que se pueda replicar el desempeño obtenido por el controlador por realimentación de estados (SFB). Sin embargo, conforme se varía ε y tiende a cero, en algunos instantes de tiempo se obtiene un fenómeno de escape a infinito en tiempo finito (finite scape time o peaking phenomenom), para poderlo explicar de mejor forma se introducirá y simulará un ejemplo de una entrada y una salida (SISO), en lugar del ejemplo del péndulo invertido que es de múltiples entradas y múltiples salidas (MIMO), el ejemplo fue tomado de [4].

Fig. 2. Circuito General del SFB para el péndulo invertido • • •

Subsistema Péndulo: Define el modelo de las dinámicas del sistema. Subsistema ealph2’: Genera e˙ α2 mediante la suma de ve y de α ¨r . Subsistema ve : Genera ve .

En la Figura 3 se muestra el desempeño de las variables de estado obtenidas por el controlador de SFB. En la Figura 4 se muestra el circuito para el controlador OFB. En este caso, se diseñaron tres subsistemas: • • •

Subsistema Controlador: Genera ve y finalmente exporta el valor del controlador u. Subsistema HGO: Genera los valores estimados de las variables de estado x ˆ1 , x ˆ2 , α ˆ1, α ˆ2. σ ˆ1 . Subsistema Péndulo Invertido: Se encarga de definir el modelo de las dinámicas del sistema.

A. Simulación Numérica Para la simulación se utilizó Simulink de Matlab y se tomaron los siguientes valores: mc = 0.203kg mp = 0.218kg g = 9.8m/s2 l = 0.24m Las ganacias del controlador son: γ1 = 2.1885 γ2 = 1.35943 β1 = 33.2326 β2 = 13.7789 µ = 0.01 ε = 0.001 H11 = 3 H12 = 3 H13 = 1 H21 = 3, H22 = 3 Las condiciones iniciales se asumen:

Fig. 3. Desempeño de las variables de estado con controlador SFB.

x1 (0) = 0, x2 (0) = 0, α1 (0) = 85◦ , α2 (0) = 0 αe (t) = 0

En la Figura 5 se muestra el peaking phenomenom que se presenta debido a la aproximación de ε a cero, ya que ε = 0.001. En este ejemplo el fenómeno se presenta en tiempo de ejecución aproximado de t=8.38 seg. Este fenómeno se puede solucionar efectuando la saturacion de las variables

El circuito general montado para el controlador SFB del péndulo invertido se muestra en la figura 2 . Se divide en tres subsistemas:

4

estimadas x ˆ1 , x ˆ2 , α ˆ1, α ˆ2. σ ˆ1 en el control u, en ve y en F. Para explicar aún mejor este fenómeno, se introducirá un sistema más sencillo.



Para ρ = 2, Lg Lf h(x) =      x2 1 0 Lg = 1 6= 0 x32

Lg

h

∂h(x) ∂x f (x)

i

=

. se forma el difeomorfismo, donde n = 2 y ρ = 2 yφ1 (x) = . h(x) y φ2 (x) = Lf h(x), obteniendo (24).       φ1 h(x) x)1 Φ(x) = = = (24) φ2 Lf h(x) x2     x1 a(x) = Lρf h(x) = Lf [x2 ] = 0 1 = x32 x32 b(z) = Lg Lρ−1 h(x) = Lg Lf h(x) = 1 f De esta manera se reescribe (23), de la siguiente manera: x˙ 1 = x2 Fig. 4. Circuito General del SFB para el péndulo invertido

x˙ 2 = v y = x1 Ahora se debe escoger v de tal manera que la matriz A sea Hurwitz. Por lo cual se tiene que v debe ser lineal y por lo tanto v = −x1 − x2 .   0 1 ∂ (x) ˙ = ∂ x˙ 2 ∂ x˙ 2 A= ∂x ∂x1 ∂x2 Así las cosas, se logra estabilizar el sistema escogiendo u = −x32 − x1 − x2 . De la misma manera, se diseña el controlador de Alta Ganancia, como se observa en (25), escogiendo H1 y H2 , tal que s2 + H1 s + H2 = 0 sea Hurwitz. H1 (x1 − x ˆ1 ) x ˆ˙ 1 = x ˆ2 + ε H1 x ˆ˙ 2 = 2 (x1 − x ˆ1 ) ε

(25)

Fig. 5. Desempeño de las variables de estado con controlador OFB.

u = −ˆ x32 − x ˆ1 − x ˆ2 V. S IMULACIÓN HGO PARA SISTEMA SISO El sistema con el que se trabajará es el mostrado en (23) y se encuentra en [4]. x˙ 1 = x2 x˙ 2 = x32 + u

(23)

donde H1 = 1 y H2 = 2. En cuanto a ε tomará valores de 0.1, 0.01 y 0.05. A. Simulación Sistema SISO Para la simulación se efectuará el montaje del controlador SFB como se observa en la Figura 6. De igual forma se dividirá en dos subsistemas:

y = x1 Para estabilizar el sistema se realiza una linealización exacta (Feedback Linearization). Al reescribir el sistema de la forma x  ˙ = f (x) + g(x)u y y = h(x). Entonces   x2 f (x) = y h(x) = x1 0 . 3 x2



Lg Lρ−1 h(x0 ) = 0∀i = 1, ..., r − 2 f     0 Para ρ = 1, Lg h(x) = 1 0 = 0. 1

Fig. 6.

Diagrama de bloques del sistema SISO con controlador SFB.

5



Subsistema Sistema: En la Figura 7, se muestra el subsistema, donde se plantean las dinámicas del sistema SISO.

Fig. 10. Diagrama de bloques del subsistema del Observador HGO para el sistema SISO. Fig. 7. Subsistema del sistema SISO



Subsistema u: En la Figura 8, se muestra el controlador SFB diseñado anteriormente.

OFB se asemejan a la del controlador SFB, como se observa en la Figura 11.

Fig. 8. Subsistema u del sistema SISO

Por otra parte, en la Figura 9, se muestra el diagrama general para el controlador OFB del sistema SISO, adicionando el subsistema Observador y efectuando las conexiones al controlador de los valores esperados de las variables del sistema x ˆ1 y x ˆ2 . Adicionalmente se incluye ε para ser variada entre los valores descritos anteriormente. Los valores iniciales del sistema se establecen en x1 (0) = 0.1 y x2 (0) = x ˆ1 (0) = x ˆ2 (0) = 0. Fig. 11. Gráficas de desempeño del sistema SISO para controladores SFB y OFB con ε = 0.1,0.01 y 0.005.

B. Fenómeno de Pico

Fig. 9. Diagrama de bloques general del controlador OFB para ε = 0.005



Subsistema Observador: Se muestra en la Figura 10.

Adicionalmente, se efectúa una variación de ε, de tal manera que mientras ε → 0 las gráficas de desempeño del controlador

El fenómeno de pico se puede evidenciar al seguir disminuyendo el valor de ε, por ejemplo si ε = 0.004 , se puede observar en la Figura 12 que el fenómeno ocurre en un tiempo t ≈ 0.365, donde el control u → ∞. Este problema es intrínseco al diseño de cualquier Observador de Alta Ganancia y se puede  solucionar al saturar el control u = sat −x32 − x1 − x2 .

6

vertical. También es posible recuperar las prestaciones de un controlador de realimentación de estados SFB, mediante la implementación de un Controlador de realimentación de la salida OFB, tal como un Observador de Alta Ganancia. Los Observadores de Alta Ganancia mejoran su desempeño al disminuir el valor de ε y se genera un fenómeno de pico que puede ser solucionado por medio de la adecuada saturación de la entrada de control u(t). R EFERENCES

Fig. 12. Peaking Phenomenom en el controlador OFB del sistema SISO para ε = 0.004

En la figura 13 se muestra el controlador OFB para ε = 0.004, con la saturación de u. Las gráficas de desempeño se muestran en la Figura 14.

[1] J. Lee, R. Mukherjee y H. Khalil, Application of Dynamic Inversion with Extended High-Gain Observers to Inverted Pendulum on a Cart, In Proc. IEEE int. American Control Conference, Washington, DC, USA, June 17-19, 2013. [2] J. C. Raimúndez y J. L. Camaño, Control por Inversión Dinámica y Adaptación mediante Redes Neuronales, Aplicación a un sistema de Levitación Magnética, pp. 1-2. [3] N. H. Getz, Dynamic Inversion of Nonlinear maps with Applications to Nonlinear Control and Robotics. PHD thesis, university of California at Berkeley, 1995. [4] H.H Khalil, Nonlinear Systems (3rd edition), Prentice Hall,2002.

Fig. 13. Saturación de u que soluciona el peaking phenomenom para ε = 0.004 Teniente de Navío Harvey Sierra Coley, MSc(c) Ing.: es un oficial activo de la Armada República de Colombia desde 2007, donde se ha desempeñado principalmente en las áreas de sistemas y Radiocomunicaciones. Es Ingeniero de Telecomunicaciones y candidato a Magister en Ingeniería Electrónica y de Computadores. Su área de interés en investigación se encuentra enmarcada en Antenas de Ultra Banda Ancha y Simuladores de Entrenamiento virtual en plataformas físicas.

Fig. 14. Gráficas de desempeño para OFB ε = 0.004 con saturación de u.

VI. C ONCLUSIONES Es posible estabilizar un péndulo invertido sobre un carro si el ángulo de inclinación del péndulo se encuentra de forma

Lihat lebih banyak...

Comentarios

Copyright © 2017 DATOSPDF Inc.