Estabilización de trayectorias

IE3041 - Sistemas de Control 2

¿Dónde estamos por el momento?

condición inicial \(\mathbf{x}_0\)
"meta" \(\mathbf{x}_{ss}\)

condición inicial \(\mathbf{x}_0\)
"meta" \(\mathbf{x}_{ss}\)
fuimos capaces de emplear colocación directa para encontrar la trayectoria óptima

esta, sin embargo, presenta un problema crítico

esta, sin embargo, presenta un problema crítico

un ligero cambio en la trayectoria causa un comportamiento completamente distinto
esta, sin embargo, presenta un problema crítico

un ligero cambio en la trayectoria causa un comportamiento completamente distinto
¿Por qué?




lazo cerrado


lazo cerrado
lazo abierto

lazo abierto

lazo cerrado
Robusto

lazo cerrado
Robusto

lazo abierto
Frágil

lazo cerrado

lazo abierto
¿Solución? cerrar el lazo

lazo cerrado

lazo abierto
¿Solución? cerrar el lazo
dos opciones:
- estabilizar la trayectoria (TV-LQR)
- recalcular la optimización (MPC)

Estabilización de trayectorias

Estabilización de trayectorias
la trayectoria se hace atractiva mediante un controlador
referencia

Estabilización de trayectorias
la trayectoria se hace atractiva mediante un controlador
referencia

el controlador absorbe las desviaciones con respecto a la trayectoria calculada
la trayectoria se hace atractiva mediante un controlador
referencia
Estabilización de trayectorias

el controlador absorbe las desviaciones con respecto a la trayectoria calculada
la trayectoria se hace atractiva mediante un controlador
referencia
Time-Varying LQR
Estabilización de trayectorias
horizonte infinito
dinámica LTI
(linealización alrededor de un punto)
Dos tipos de LQR
horizonte infinito
dinámica LTI
(linealización alrededor de un punto)
estabiliza puntos de equilibrio | operación
Dos tipos de LQR
horizonte finito
dinámica LTV
(linealización alrededor de una trayectoria)
Dos tipos de LQR
horizonte finito
dinámica LTV
(linealización alrededor de una trayectoria)
estabiliza trayectorias
Dos tipos de LQR
- Se identifica el sistema, los requerimientos de control y las resticciones.
Estabilización de trayectorias con LQR
- Se identifica el sistema, los requerimientos de control y las resticciones.
- Se resuelve la optimización de trayectorias para obtener \(\mathbf{x}^\star(t)\) y \(\mathbf{u}^\star(t)\).
Estabilización de trayectorias con LQR
- Se identifica el sistema, los requerimientos de control y las resticciones.
- Se resuelve la optimización de trayectorias para obtener \(\mathbf{x}^\star(t)\) y \(\mathbf{u}^\star(t)\).
linealización
Estabilización de trayectorias con LQR
- Se identifica el sistema, los requerimientos de control y las resticciones.
- Se resuelve la optimización de trayectorias para obtener \(\mathbf{x}^\star(t)\) y \(\mathbf{u}^\star(t)\).
linealización
Estabilización de trayectorias con LQR
- Se identifica el sistema, los requerimientos de control y las resticciones.
- Se resuelve la optimización de trayectorias para obtener \(\mathbf{x}^\star(t)\) y \(\mathbf{u}^\star(t)\).
linealización
Estabilización de trayectorias con LQR
4. Se estabiliza la trayectoria mediante el LQR de horizonte finito.
Estabilización de trayectorias con LQR
4. Se estabiliza la trayectoria mediante el LQR de horizonte finito.
Estabilización de trayectorias con LQR
feedback
4. Se estabiliza la trayectoria mediante el LQR de horizonte finito.
Estabilización de trayectorias con LQR
\(\mathbf{x}_{ss}\) y \(\mathbf{u}_{ss}\) variantes en el tiempo (resultado de la optimización de trayectorias)
4. Se estabiliza la trayectoria mediante el LQR de horizonte finito.
Estabilización de trayectorias con LQR
4. Se estabiliza la trayectoria mediante el LQR de horizonte finito.
Estabilización de trayectorias con LQR
\(\mathbf{P}(t)\) es la solución de la ecuación diferencial de Riccati
4. Se estabiliza la trayectoria mediante el LQR de horizonte finito.
Estabilización de trayectorias con LQR
\(\mathbf{P}(t)\) es la solución de la ecuación diferencial de Riccati
problema de valor final (PVF)*
el PVF se resuelve "al revés" o hacia atrás en el tiempo, por ejemplo, con forward Euler
Estabilización de trayectorias con LQR
el PVF se resuelve "al revés" o hacia atrás en el tiempo, por ejemplo, con forward Euler
empezando en \(\mathbf{P}(t_f)=\mathbf{S}\)
Estabilización de trayectorias con LQR
Se recomienda que \(\mathbf{x}(t_f)=\mathbf{x}_f\) sea un punto de equilibrio u operación para poder terminar la trayectoria con un LQR de horizonte infinito
de horizonte infinito
Estabilización de trayectorias con LQR
Esto puede hacerse ya sea con
o bien
Estabilización de trayectorias con LQR
[Klqr_ss, S, P] = lqr(A, B, Q, R);
Ejemplo: cart-pole swing up (cont.)
Se estabilizará la trayectoria óptima mediante linealización alrededor de trayectorias y un LQR variante en el tiempo. Se finalizará con un LQR LTI para estabilizar el estado de vertical hacia arriba.
>> cartpole_stab.m

Recalcular la optimización

luego de la perturbación
Recalcular la optimización

luego de la perturbación
se recalcula el problema de control óptimo (online) para obtener una nueva trayectoria
Recalcular la optimización

Control de Modelo Predictivo (MPC)
luego de la perturbación
se recalcula el problema de control óptimo (online) para obtener una nueva trayectoria
Recalcular la optimización
IE3041 - Lecture 14 (2025)
By Miguel Enrique Zea Arenales
IE3041 - Lecture 14 (2025)
- 1