(3.3)
После подстановки (3.3) в (3.1) и (3.2) получим задачу АКОР в следующей форме: найти последовательность управляющих воздействий u[s],
s = 0, 1, …, N – 1, доставляющих минимум критерию I.
(3.4)
на модели объекта
(3.5)
где j[s] – детерминированное воздействие, учитывающее детерминированное возмущение F[s] (3.2) и результат преобразования заданных значений z*[s], v*[s] моделью объекта:
.
После решения задачи (3.4),(3.5) вычисляются реальные управляющие воздействия для задачи (3.1), (3.2).
,
где uopt[s] – управляющие воздействия, минимизирующие (3.4).
Приведем, опуская выкладки, результат решения задачи (3.4), (3.5). Управляющие воздействия uopt[s] находятся в контуре обратной связи по состоянию объекта:
,
где C[s], G[s] – матричные коэффициенты размерности r ´ n и r ´ 1 соответственно. Параметры регулятора C[s] и G[s] находятся в результате решения следующих матричных уравнений:
,
.
Уравнение Риккати:
– матрицы n ´ n,
– строки 1´ n,
E – единичная матрица размерности n ´ n,
– скаляры,
– векторы r ´ 1,
,
– матрицы r ´ n. (3.6)
Согласно методу динамического программирования рекурсивные соотношения (3.6) рассчитываются в обратном времени, s = N, N – 1, …, 0, K[N] задано в (3.4), L[N] – строка с нулевыми элементами, M[N] = 0, после чего может быть рассчитано значение критерия, соответствующее оптимальным управляющим воздействиям:
, (3.7)
и числовые значения оптимальных управляющих воздействий и переменных состояния:

Отметим, что эти числовые значения могут быть использованы для тестирования правильных расчетов: при их подстановке непосредственно в критерий (3.4) должно получиться то же значение, что и рассчитанное по (3.7).
§ 2. Синтез субоптимальных управляющих воздействий для объектов с разнотемповыми составляющими на основе метода ДШВ
Предположим наличие медленного x1[s] (вектор размерности n1 ´ 1) и быстрого x2[s] (вектор размерности n2 ´ 1) субпроцессов в векторе состояния x[s] (вектор размерности n ´ 1, n = n1 + n2), входящих в модель (3.5). Разбивая матрицы A[s], B[s] и вектор j[s] в (3.5) на субблоки Aij[s] i,j = 1, 2, Bi[s], ji[s], i = 1, 2, представим (3.5) в форме взаимодействующих субпроцессов:
где A11, A12, A21, A22, B1, B2 – матрицы размерностей n1 ´ n1, n1 ´ n2, n2 ´ n1, n2 ´ n2, n1 ´ r, n2 ´ r соответственно; u[s] – управляющее воздействие общее для обоих субпроцессов; j1[s], j2[s] – векторы размерности n1 ´ 1 и
n2 ´ 1, являющиеся блоками вектора j[s] из (3.8).
, (3.9)
где
, Fi[s] – блоки векторов z[s], F[s].
В (3.8а), (3.8б) подразумевается зависимость матриц от времени (опущенная для большей компактности формул).
2.1. Исходные положения, принимаемые для синтеза субоптимальных управляющих воздействий
Используется возможность понижения порядка модели объекта за счет раздельного управления медленным и быстрым субпроцессами с разными интервалами дискретизации.
1. Медленный субпроцесс xМ[s] в медленном времени, отсчитываемом с дискретой Dt, отождествляется с составляющей x1[s]:
.
2. Быстрый субпроцесс, отождествляемый с составляющей x2[s], представляется как составной:
.
Здесь:
– медленная составляющая быстрого субпроцесса, отождествляемая с его вынужденной компонентой (вынужденная динамика, согласно (3.8б), объясняется действием медленной составляющей x1[s], u[s] и внешнего воздействия j2[s]).
– свободная составляющая быстрого субпроцесса, трактуется как отработка начальных условий для x2[s], имеющих место на s-м такте, в течение промежутка времени, охватывающего пограничный слой.
3. Управляющие воздействия u[s] ищем в виде составных:
. (3.10)
Назначение медленной компоненты
– управление медленным субпроцессом x1[s] и медленной составляющей быстрого субпроцесса
в медленном времени. Назначение быстрой компоненты
– подавление свободной составляющей
быстрого субпроцесса x2[s] в быстром времени с дискретой
(m – малый параметр, рассчитываемый по изложенной в гл. 1 методике).
4. Приближенно считаем, что свободная динамика
завершается внутри части интервала Dt (т. е. число тактов быстрого времени t*, охватывающих пограничный слой таково, что
). Поэтому можно считать, что
изменяется только в моменты времени
, s = 0, 1, …, N – 1, и постоянно внутри интервала отсчета медленного времени:
.
Быстрая компонента
изменяется в моменты отсчета быстрого времени
, t = 0, 1, …, t*. Отсчет тактов быстрого времени возобновляется в моменты отсчета медленного времени. Внутри интервалов отсчета быстрого времени быстрая составляющая постоянна:
.
Характер зависимости управляющих воздействий поясняется на рис. 32.
5. В предположении 4 быстрая компонента
сквозь призму медленного времени может не учитываться, и для расчета
можно аппроксимировать модель объекта (3.8а), (3.8б) пониженного (до размерности медленного субпроцеса n1) порядка, в которой вместо (3.8а) используется модель безынерционного слежения
за x1[s],
и j2[s]:
. (3.11)
Из (3.11) выразим
через x1[s],
и j2[s], что позволит исключить динамику быстрой фазы из модели объекта:
, (3.12)
где
– n2 ´ n1 матрица;
– n2 ´ r матрица;
– n2 ´ 1 вектор. Предполагается, что матрица
существует, где E – единичная матрица размером n2 ´ n2.
После подстановки (3.12) в (3.8а) получим приближенную модель объекта порядка n1, которая будет использована для нахождения медленной составляющей субоптимального управления ![]()
(3.13)
где
– n1 ´ n1 матрица;
– r ´ 1 матрица;
– n1 ´ 1 вектор.

Рис. 32. Формирование составного управления
6. Модель (3.12) используется для исключения составляющей
из формулы (3.4), определяющей критерий задачи АКОР. После довольно громоздких, но простых преобразований получим формулу, представляющую приближение критерия (3.4), достигаемое при управлении только медленными компонентами вектора состояния. Как видно из (3.14), в критерии учтены отклонения от заданий только медленного субпроцесса x1[s]. Но благодаря изменению параметров матриц штрафов в (3.14) косвенно учтены и отклонения медленной составляющей быстрого субпроцесса
, причем матрицы штрафов в (3.14) согласуются с соответствующими матрицами исходного критерия (3.4).
(3.14)
где
– n1 ´ n1 матрица; K11[N], K12[N], K22[N] – n1 ´ n1, n1 ´ n2, n2 ´ n2 блоки матрицы K[N] в (3.4)
; (3.15)
– n1 ´ n2 матрица;
– n1 ´ n1 матрица; Q11[s], Q12[s], Q22[s] – n1 ´ n1, n1 ´ n2, n2 ´ n2 блоки матрицы Q[s] в (3.4):
; (3.16)
– n1 ´ r матрица;
– n1 ´ n2 матрица;
– r ´ n2 матрица;
– r ´ r матрица.
7. Поскольку вывод формул, определяющих оптимальные управления, в методе АКОР использует симметрию матриц штрафов в квадратичных формах, входящих в критерий, данный метод может быть использован для нахождения
только в том случае, когда
– симметричные. В противном случае расчет также возможен, но рекуррентные соотношения для параметров, входящих в алгоритм управления, получить не удается. Поскольку на практике перекрестные произведения компонентов
и
чаще всего не входят в критерий, то в дальнейшем ограничимся случаем, когда Q11[s], Q21[s], K12[N], K21[N] – нулевые матрицы. При этом квадратичные формы для x1[s], x1[N], u[s] будут содержать симметричные ядра.
8. Таким образом, получена формальная постановка задачи АКОР для расчета медленной составляющей
составного управления u[s] из (3.11): найти последовательность управляющих воздействий
, s = 0, 1, …, N – 1, доставляющих минимум критерию
(3.17)
где
– n1 ´ 1 вектор;
– скаляр;
– n1 ´ 1 вектор;
– r ´ 1 вектор;
– r ´ r матрица;
– скаляр.
Модель (3.14) медленного субпроцесса x1[s] – линейная:
. (3.18)
Сводка обозначений для модели (3.17)–(3.18) и соответствующие формулы со ссылками на позиции, в которых эти формулы были введены выше, приведена в табл. 2. Порядок перечисления в таблице выбран таким образом, чтобы источники данных для каждой формулы вводились в строках с меньшими номерами.
9. Модель (3.18) по форме не отличается от принятой в классической задаче АКОР. Однако критерий (3.17) отличается от «классического» критерия вида (3.4). Отличия состоят во введении штрафов за перекрестные произведения компонентов векторов x1[s] и
(слагаемое
) и линейных слагаемых, в которые входят x1[N],
, x1[s] (
,
,
, s = 0, 1, …, N – 1).
10. Из-за этих отличий формулы (3.7) должны быть пересмотрены. Выкладки, следующие процедуре динамического программирования, приведены в приложении 3. Здесь приведем лишь конечный результат.
Оптимальные управляющие воздействия рассчитываются в контуре обратной связи по вектору состояния объекта:
. (3.19)
Здесь:
;

Из (3.19) видно, что первое слагаемое в алгоритме управления по форме такое же, как получается при минимизации «классического» критерия АКОР. Второе слагаемое и свободный вектор G[s] имеют специфику, связанную с особенностями критерия (3.14).
Параметры K[s], y[s] рассчитываются при обратном отсчете тактов s, начиная с N – 1 (
– расчет приведен в табл. 2).
(3.20)
(3.21)
Расчет параметров, используемых в (3.20)–(3.21), приведен в табл. 2.
Значение критерия (3.17) при использовании оптимальных управляющих воздействий равно
,
где x1[0] – заданное начальное состояние; K[0], y[0] – получаются в результате рекуррентных расчетов по (3.20), (3.21); M[0] – скаляр, получается рекурсивно при обратном отсчете тактов s, начиная с N – 1 (
– расчет приведен в табл. 2)
(3.22)
Расчет параметров, используемых в (3.22), приведен в табл. 2.
Задача управления быстрой составляющей
строится на следующих положениях:
1. В пограничном слое (t = 0, ...,t*) значения медленной составляющей вектора состояния x1[s], вынужденной компоненты быстрой составляющей
, а также медленной составляющей управления uM[s] не изменяются и сохраняют значения s-го такта на всем интервале пограничного слоя.
2. В предположении о неизменности компонент x1[s],
и uM[s] исходный критерий задачи АКОР (3.4) примет вид:

где
" s = 0, … ,N–1;
– n2 ´ 1 векторы;
–скаляры " s = 0, 1, … , N – 1;
– скаляр;
– r ´ 1 вектор;
Управляющее воздействие
рассчитывается в форме обратной связи (как частный случай из общей формулы, приведенной в приложении 3):
,
где матричные коэффициенты C[s, t], G[s, t] рассчитываются по пиложению 3 с очевидными переобозначениями.
2.2. Сравнение точного и приближенного решения задачи АКОР (на примере управления объектом 4-го порядка)
Приведенные выше теоретические положения иллюстрируются примером решения задачи управления объектом 4-го порядка, в котором можно выделить субпроцессы с существенно различными инерционными характеристиками. Модель и параметры объекта приведены в приложении 1, данный объект рассматривается в качестве примера также в гл. 1.
Модель объекта описывается линейной дискретной системой уравнений [63]:
,
где x[s] – n-мерный вектор состояния объекта, в котором выделяются две группы субпроцессов (медленные – x1[s], x2[s] и быстрые – x3[s], x4[s]); u[s] – r-мерный вектор управляющих воздействий; F[s] – n-мерный вектор детерминированных возмущающих воздействий; AD, BD – матрицы параметров дискретной модели размерности n ´ n и n ´ r соответственно (значения параметров приведены в пиложении 1).
Согласно изложенным выше теоретическим положениям, задача управления n-мерным вектором состояния может быть приближенно заменена более простой задачей управления только медленным субпроцессом (3.13) и медленной составляющей быстрого субпроцесса (3.12) с понижением порядка до размерности медленного субпроцесса x1[s]. При этом оптимальное управляющее воздействие рассчитывается по формуле (3.20). Результаты управления рассматриваемым объектом по модели пониженного порядка приведены на рис. 33.
Как видно из рис. 33, управление медленным субпроцессом xopt_M[s] по формуле (3.13) дает очень хороший результат. Полученные траектории почти полностью совпадают с траекториями, рассчитанными по «классической» задаче АКОР.
На рис. 34 приведены результаты управления медленной составляющей быстрого субпроцесса
по формуле (3.12).
Из анализа графиков на рис. 34 следует, что безынерционная оценка медленной составляющей быстрого процесса хорошо совпадает с оптимальной траекторией xopt[s]. Можно добиться и более качественного отслеживания задания, если увеличить штрафы за отклонения этих переменных от задающих воздействий в критерии (3.17) и (3.4).
Таблица 2
Обозначения к задаче (3.18)-(3.19) и расчетные формулы
Обозначения | Размерность матриц | Формула, в которой описана | Расчетная формула | Ссылки на позиции таблицы |
| |||||
A, B | N ´ n, n ´ r соответственно | (3.2) |
| |||||||
A11, A12, A21, A22, B1, B2 | n1 ´ n1, n1 ´ n1, n2 ´ n1, n2 ´ n2, n1 ´ r, n2 ´ r, соответственно | (3.8а), (3.8б) |
| п.1 |
| |||||
| n2 ´ n1 | (3.12) |
| п. 2 |
| |||||
| n1 ´ n1 | (3.13) |
| п. 3, 4 |
| |||||
| n2 ´ r | (3.12) |
| п. 2, 3 |
| |||||
| n1 ´ r | (3.13) |
| п. 2, 3, 5 |
| |||||
F[s] | N ´ 1 | (3.2) |
| |||||||
F1[s], F2[s] | n1 ´ 1, n2 ´ 1 | (3.9) |
| п.7 |
| |||||
z*[s] | n ´ 1 | (3.1) |
| |||||||
| n1 ´ 1, n2 ´ 1 | (3.9) |
| п. 9 |
| |||||
v*[s] | r ´ 1 | (3.1) |
| |||||||
j[s] | n ´ 1 |
|
| п.1, 7, 9, 11 |
| |||||
Продолжение табл. 2 | ||||||||||
| Размерность матриц | Формула, в которой описана | Расчетная формула | Ссылки на позиции таблицы |
| |||||
j1[s], j2[s] | n1 ´ 1, n2 ´ 1 | (3.8а), (3.9б) |
| п. 12 |
| |||||
| n2 ´ 1 | (3.12) |
| п. 2, 13 |
| |||||
| n1 ´ 1 | (3.13) |
| п. 2, 13, 14 |
| |||||
K[N] | N ´ n | (3.1) |
| |||||||
K11[N], K12[N], K21[N], K22[N] | n1 ´ n1, n1 ´ n1, n2 ´ n1, n2 ´ n2 соответственно | (3.15) |
| п. 16 |
| |||||
Q[s] | n´n | (3.1) |
| |||||||
Q11[s], Q12[s], Q21[s], Q22[s] | n1 ´ n1, n1 ´ n1, n2 ´ n1, n2 ´ n2 соответственно | (3.16) |
| п. 18 |
| |||||
R[s] | r ´ r | (3.1) |
| |||||||
y1[N] | n1 ´ 1 | (3.17) |
| п. 3, 14, 17 |
| |||||
M1[N] | скаляр |
|
| п. 14, 17 |
| |||||
Окончание табл. 2 | ||||||||||
Обозначения | Размерность матриц | Формула, в которой описана | Расчетная формула | Ссылки на позиции таблицы |
| |||||
| n1 ´ n1 | (3.14) |
| п. 3, 19 |
| |||||
| n1 ´ r | (3.14) |
| п. 3, 7, 19 |
| |||||
y1[s] | n1 ´ 1 | (3.17) |
| п. 5, 5, 21 |
| |||||
Q1[s] | R ´ 1 | (3.17) |
| п. 5, 14, 19 |
| |||||
| R ´ r | (3.17) |
| п. 5, 19, 20 |
| |||||
M1[s] | скаляр | (3.17) |
| п. 14, 19 |
| |||||
![]()
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 |





