Элементы теории оптимального управления.
Изменяя условия протекания процессов, человек может влиять на их характер, изменять их, приспосабливать к своим целям. Это вмешательство в естественный ход процесса, изменение естественного хода процесса и представляет собой сущность управления.
Управление представляет собой такую организацию процесса, которая обеспечивает достижение определенных целей.
Три этапа процесса управления :
1) сбор и обработка информации с целью оценки сложившейся ситуации;
2) принятие решения о наиболее целесообразных действиях;
3) исполнение принятого решения.
Одноэтапные или одношаговые задачи управления - все рассмотрение процесса управления сводится к выполнению второго этапа.
Иногда процесс управления разбивается на несколько последующих шагов, причем решение, принимаемое на каком-либо шаге, зависит от результатов выполнения предыдущего шага. Такие процессы называют многошаговыми процессами принятия решения.
Оптимизация процесса управления.
Задачу управления мы будем рассматривать как математическую задачу. Однако, в отличие от многих других математических задач, она имеет ту особенность, что допускает не одно решение, а множество различных решений.
Если имеется множество решений какой-либо задачи, то следует вести речь о выборе такого решения, которое с какой-либо точки зрения является наилучшим.
В тех случаях, когда цель управления может быть достигнута несколькими различными способами, на способ управления можно наложить добавочные требования, степень выполнения которых может служить основанием для предпочтения одного способа управления всем другим.
Математическое выражение, дающее количественную оценку степени выполнения наложенных на способ управления требований, называется критерием качества управления.
Оптимальным способом управления будет такой, при котором критерий качества управления достигает минимального (максимального) значения.
В общем случае существует два вида ограничений на выбор способа управления.
Ограничениями первого вида являются сами законы природы, в соответствии с которыми происходит движение управляемой системы (уравнения связи).
Второй вид ограничений вызван ограниченностью ресурсов, используемых при управлении.
Постановка задачи оптимального управления.
Задачу управления можно считать сформулированной математически, если:
1) сформулирована цель управления, выражаемая через критерий качества управления;
2) определены ограничения первого вида;
3) определены ограничения второго вида.
Способ управления, который удовлетворяет всем поставленным ограничениям и обращает в минимум (максимум) критерий качества управления, называется оптимальным управлением.
Математическое описание объекта управления.
Обозначим через x переменную, определяющую состояние объекта управления.
В большинстве случаев состояние объекта управления описывается многомерной переменной x = (x1,...,xn) ю Rn (точка в Rn).
Переменную x будем называть переменной или вектором состояния объекта управления.
Множество допустимых значений x обозначим через X и называют допустимым множеством или пространством решений.
Ограничения, накладываемые на значения x обычно имеют вид алгебраических уравнений или неравенств :
(
2 , bi ___
fi(x1,...,xn) * = bi, i = 1,m.
2 . bi
9
Полную совокупность неконтролируемых внешних факторов, оказывающих влияние на процесс управления, будем называть состоянием природы и обозначим через x.
Путем некоторой идеализации реальных явлений удается свести все бесчисленное многообразие внешних условий к конечному числу возможных состояний природы x1,xL, т. е. ввести в рассмотрение конечное множество X =x1,...,xL называется пространством состояний природы.
Для описания целенаправленного воздействия на объект управления введем переменную u, которую будем называть управляющим воздействием или просто управлением.
Таким образом, слово управление будем в дальнейшем использовать в двух смыслах:
1) управление как организационная деятельность, направленная на достижение определенных целей;
2) управление в смысле управляющего воздействия, т. е. некоторой физической величины, измерение которой производится по нашему желанию и которая воздействует на характер процессов в объекте управления, изменяя их в нужном направлении.
При управлении сложными объектами обычно приходится использовать несколько управляющих воздействий u1,...,ur, так, что управление u представляет собой многомерную величину u = u1,...,ur.
Управляющие воздействия u не могут быть взяты какими угодно, а подвержены различного рода ограничениям.
U - это множество всех значений управления u, которое удовлетворяет поставленным ограничениям.
Для всех u, принадлежащих U - это допустимое управление.
(Например, U = u1,...,uR).
Судить о том, насколько примененное управление u обеспечивает достижение поставленных целей, можно по значениям переменных состояния x. Не всегда это удобно, поэтому вводят в рассмотрение выходные переменные q, выражающие цели управления в явном виде.
Выходная переменная q зависит в первую очередь от состояния объекта управления x. Однако, на нее могут оказывать влияние используемое управление u и внешние неконтролируемые факторы x. Следовательно, управление для выходной переменной в общем случае имеет вид:
q = q(x, u,x).
^x
-----------
u 6| x | 6 q
-----------
рис. структуры объекта управления
Под действием сигналов управления u, объект управления изменяет свое состояние. Характер происходящих при этом процессов определяется скоростью изменения переменной состояния объекта
. dx . . .
x = -- ; x = x1,...,xn.
dt
Для динамических систем, в которых физические процессы проте - .
кают непрерывно во времени, скорости xi в любой момент времени
зависят от состояния объекта управления в тот же момент времени,
которое в свою очередь определяется значениями переменной состояния х, состоянием природы x и используемым управлением u.
. ___
xi = gi(x, u,x), xi(0) = ci, i = 1,n,
где величины ci, i = 1,n характеризуют начальное состояние объекта управления.
.
x = g (x, u,x), x (0) = c,
где с = (c1,...cn), g = (g1,...,gn).
Одношаговые задачи принятия решения.
В одношаговых задачах обычно не рассматриваются методы реализации принятого решения, т. е. определяются не величина и характер управляющего воздействия u, а непосредственно значение переменной состояния системы x, которое обеспечивает наилучшее достижение цели управления.
Одношаговая задача принятия решения считается заданной, если заданы пространство состояния природы X, пространство решений x и критерий качества принятого решения, который для этого случая будем называть целевой функцией.
Как видим, одношаговая задача принятия решений представляет собой тройку G = (X, X,q), где q - скалярная функция, определенная на прямом произведении множеств X&X.
Решение этой задачи состоит в нахождении такого x* ю X, которое обращает в минимум функцию q, т. е. удовлетворяющее условию :
x* = x X / q(x, x) = min.
При x = x* функция - q(x, x) будет достигать максимума.
За последние годы отмечается рост интереса к методам решения одношаговой задачи, получившим название математического программирования ("планирования").
Отметим, что математическое программирование представляет собой не аналитическую, а алгоритмическую форму решения задач, т. е. дает не формулу, выражающую окончательный результат, а указывает лишь вычислительную процедуру, приводящую к решению задачи.
Поэтому методы математического программирования становятся эффективными, главным образом, при использовании ЦВМ.
Основные понятия теории оптимизации. Общая постановка задачи оптимизации.
В общей задаче оптимизации требуется найти вектор x = (x1,...,xn)T из допустимой области X, который обращает в минимум целевую функцию q(x), т. е. такой вектор x* X, для которого q(x*) , q(x) для всех x принадлежащих X.
Если такой вектор x* существует, то он определяет слабый глобальный (абсолютный) минимум q(x*) в допустимой области X.
Этот минимум называется слабым, так как удовлетворяет нестрогому (слабому) неравенству. Он называется глобальным или абсолютным потому, что неравенство справедливо для всех x* ю X.
Минимум при x = x* называется сильным, если q(x*) < q(x) для x - x* (он всегда единственный).
(Аналогично - максимум).
Минимум в точке x = x* называется локальным (относительным), если существует такая окрестность Ox(x*) точки x*, что для всех x ю Ox(x*) выполняется неравенство q(x*) , q(x).
Если функция q(x) дифференцируема, то задача отыскания локальных минимумов сводится к нахождению стационарных точек, в которых обращаются в нуль частные производные функции q(x):
dq(x) ___
----- = 0, i = 1,n.
dxi
Классическая задача оптимизации.
Классическая задача оптимизации состоит в нахождении экстремума целевой функции q(x), где x = (x1,...,xn) принадлежащих Rn при наличии ограничений типа равенств.
___
fi(x) = 0, i = 1,m, m < n (*)
Если эти ограничения имеют место, то минимум функции q(x) называется условным минимумом. Если ограничения отсутствуют, то говорят о безусловном минимуме, нахождение которого сводится к определению и исследованию стационарных точек функции q(x).
Классический способ решения данной задачи состоит в том, что условия (*) используются для исключения из рассмотрения m переменных. При этом целевая функция приводится к виду:
q(x1,...,xn) = q1(y1,...,yn-m),
где через y1,..,yn-m обозначены неисключаемые переменные. Задача состоит в нахождении y1,..,yn-m, которые обращают в минимум функцию q1 и на которые не наложено никаких ограничений.
Пример: Дадим геометрическую интерпретацию данной задачи для двумерной переменной x = (u, v) с одним ограничением
f(x) = u2 - v+1 = 0
и с целевой функцией q(x) = (u-1)2 + v2.
%v
|
|
|
|
|
----------------------6
| u
Огр: f(x) = 0 и линия уровня: q(x) = const.
Оптимальное решение x* получается в точке касания кривых f(x)=0 и q(x)=const.
Из f(x) = 0 следует v = u2 + 1.
Подставляя в q(x), получаем q(x) = (u - 1)2 + (u + 1)2.
Следовательно q'=2u3+3u-1=0, которое имеет единственный вещественный корень u*=0.313. При этом v*=1.098; q(x*)=1.678.
Заметим, что при отсутствии ограничения f(x)=0 минимум q(x)=0 при x=(1,0).
Если уравнения (*) имеют сложный вид, то исключенные с их помощью m переменных из функции q(x) представляет значительные трудности. В связи с этим большое практическое значение получил метод сведения задачи на условный экстремум к задаче на безусловный экстремум, основанный на использовании функции Лагранжа.
Функция Лагранжа.
Введем в рассмотрение вектор l = (l1,...,lm) и исследуем свойства функции
m
L(x, l) = q(x) + S lifi(x) (1)
i=1
Функция L(x, l) называется функцией Лагранжа, а величины li - множителями Лагранжа.
Рассмотрим стационарные точки функции L(x, l), которые полу -
чим, приравняв к нулю частные производные по lj, j = 1,m и по
xk, k = 1,n :
dL(x, l) ___
------- = fj(x) = 0, j = 1,m; (2)
dlj
dL(x, l)
------- = 0. (3)
dxk
Заметим, что уравнения (2) совпадают с ограничениями u, как следует из (1), при их выполнении имеет место L(x, l) = q(x).
Потому, если в стационарной точке (x*, l*) функция L(x, l) достигает экстремума, то x* обеспечивает и экстремум q(x) при выполнении ограничений, т. е. дает решение задачи.
Задача на условный экстремум целевой функции q(x) при наличии ограничений типа равенств сводится к задаче на определение стационарных точек L(x, l).
Для предыдущего примера функция Лагранжа L(x, l) = (u - 1)2 + v2 + l * (u2 - v + 1).
Диффиренцируем:
(
2 u * (1 + l) - 1 = 0,
* 2*v - l = 0,
2 u2 - v + 1 = 0.
9
Отсюда следует, что находим u, v, l.


