Элементы теории оптимального управления.

Изменяя условия протекания процессов, человек может влиять на их характер, изменять их, приспосабливать к своим целям. Это вмешательство в естественный ход процесса, изменение естествен­ного хода процесса и представляет собой сущность управления.

Управление представляет собой такую организацию процесса, ко­торая обеспечивает достижение определенных целей.

Три этапа процесса управления :

1) сбор и обработка информации с целью оценки сложившейся си­туации;

2) принятие решения о наиболее целесообразных действиях;

3) исполнение принятого решения.

Одноэтапные или одношаговые задачи управления - все рассмотре­ние процесса управления сводится к выполнению второго этапа.

Иногда процесс управления разбивается на несколько последующих шагов, причем решение, принимаемое на каком-либо шаге, зависит от результатов выполнения предыдущего шага. Такие процессы назы­вают многошаговыми процессами принятия решения.

Оптимизация процесса управления.

Задачу управления мы будем рассматривать как математическую задачу. Однако, в отличие от многих других математических задач, она имеет ту особенность, что допускает не одно решение, а мно­жество различных решений.

Если имеется множество решений какой-либо задачи, то следует вести речь о выборе такого решения, которое с какой-либо точки зрения является наилучшим.

В тех случаях, когда цель управления может быть достигнута несколькими различными способами, на способ управления можно на­ложить добавочные требования, степень выполнения которых может служить основанием для предпочтения одного способа управления всем другим.

НЕ нашли? Не то? Что вы ищете?

Математическое выражение, дающее количественную оценку степени выполнения наложенных на способ управления требований, называет­ся критерием качества управления.

Оптимальным способом управления будет такой, при котором кри­терий качества управления достигает минимального (максимального) значения.

В общем случае существует два вида ограничений на выбор спосо­ба управления.

Ограничениями первого вида являются сами законы природы, в со­ответствии с которыми происходит движение управляемой системы (уравнения связи).

Второй вид ограничений вызван ограниченностью ресурсов, ис­пользуемых при управлении.

Постановка задачи оптимального управления.

Задачу управления можно считать сформулированной математичес­ки, если:

1) сформулирована цель управления, выражаемая через критерий качества управления;

2) определены ограничения первого вида;

3) определены ограничения второго вида.

Способ управления, который удовлетворяет всем поставленным ог­раничениям и обращает в минимум (максимум) критерий качества уп­равления, называется оптимальным управлением.

Математическое описание объекта управления.

Обозначим через x переменную, определяющую состояние объекта управления.

В большинстве случаев состояние объекта управления описывается многомерной переменной x = (x1,...,xn) ю Rn (точка в Rn).

Переменную x будем называть переменной или вектором состояния объекта управления.

Множество допустимых значений x обозначим через X и называют допустимым множеством или пространством решений.

Ограничения, накладываемые на значения x обычно имеют вид ал­гебраических уравнений или неравенств :

(

2 ,        bi  ___

fi(x1,...,xn) * = bi, i = 1,m.

2 .        bi

9

Полную совокупность неконтролируемых внешних факторов, оказы­вающих влияние на процесс управления, будем называть состоянием природы и обозначим через x.

Путем некоторой идеализации реальных явлений удается свести все бесчисленное многообразие внешних условий к конечному числу возможных состояний природы x1,xL, т. е. ввести в рассмотрение конечное множество X =x1,...,xL называется пространством сос­тояний природы.

Для описания целенаправленного воздействия на объект управле­ния введем переменную u, которую будем называть управляющим воз­действием или просто управлением.

Таким образом, слово управление будем в дальнейшем использо­вать в двух смыслах:

1) управление как организационная деятельность, направленная на достижение определенных целей;

2) управление в смысле управляющего воздействия, т. е. некото­рой физической величины, измерение которой производится по наше­му желанию и которая воздействует на характер процессов в объек­те управления, изменяя их в нужном направлении.

При управлении сложными объектами обычно приходится использо­вать несколько управляющих воздействий u1,...,ur, так, что уп­равление u представляет собой многомерную величину u = u1,...,ur.

Управляющие воздействия u не могут быть взяты какими угодно, а подвержены различного рода ограничениям.

U - это множество всех значений управления u, которое удовлет­воряет поставленным ограничениям.

Для всех u, принадлежащих U - это допустимое управление.

(Например, U = u1,...,uR).

Судить о том, насколько примененное управление u обеспечивает достижение поставленных целей, можно по значениям переменных состояния x. Не всегда это удобно, поэтому вводят в рассмотрение выходные переменные q, выражающие цели управления в явном виде.

Выходная переменная q зависит в первую очередь от состояния объекта управления x. Однако, на нее могут оказывать влияние ис­пользуемое управление u и внешние неконтролируемые факторы x. Следовательно, управление для выходной переменной в общем случае имеет вид:

q = q(x, u,x).

^x

-----------

u 6|  x         |        6 q

-----------

рис. структуры объекта управления

Под действием сигналов управления u, объект управления изменя­ет свое состояние.  Характер происходящих при этом процессов оп­ределяется скоростью изменения переменной состояния объекта

.        dx  .         .         .

x =  -- ;        x = x1,...,xn.

dt

Для динамических систем, в которых физические процессы проте - .

кают непрерывно  во  времени,  скорости xi в любой момент времени

зависят от состояния объекта управления в тот же момент времени,

которое в свою очередь определяется значениями переменной состоя­ния х, состоянием природы x и используемым управлением u.

.  ___

xi = gi(x, u,x),  xi(0) = ci,  i = 1,n,

где величины ci, i = 1,n характеризуют начальное состояние объ­екта управления.

.

x = g (x, u,x),  x (0) = c,

где с = (c1,...cn), g = (g1,...,gn).

Одношаговые задачи принятия решения.

В одношаговых задачах обычно не рассматриваются методы реали­зации принятого решения, т. е. определяются не величина и харак­тер управляющего воздействия u, а непосредственно значение пере­менной состояния системы x, которое обеспечивает наилучшее дос­тижение цели управления.

Одношаговая задача принятия решения считается заданной, если заданы пространство состояния природы X, пространство решений x и критерий качества принятого решения, который для этого случая будем называть целевой функцией.

Как видим, одношаговая задача принятия решений представляет собой тройку G = (X, X,q), где q - скалярная функция, определен­ная на прямом произведении множеств X&X.

Решение этой задачи состоит в нахождении такого x* ю X, кото­рое обращает в минимум функцию q, т. е. удовлетворяющее условию :

x* = x X / q(x, x) = min.

При x = x* функция - q(x, x) будет достигать максимума.

За последние годы отмечается рост интереса к методам решения одношаговой задачи, получившим название математического програм­мирования ("планирования").

Отметим, что математическое программирование представляет со­бой не аналитическую, а алгоритмическую форму решения задач, т. е. дает не формулу, выражающую окончательный результат, а ука­зывает лишь вычислительную процедуру, приводящую к решению зада­чи.

Поэтому методы математического программирования становятся эф­фективными, главным образом, при использовании ЦВМ.

Основные понятия теории оптимизации. Общая постановка задачи оптимизации.

В общей задаче оптимизации требуется найти вектор x = (x1,...,xn)T из допустимой области X, который обращает в минимум целевую функцию q(x), т. е. такой вектор x* X, для которого q(x*) , q(x) для всех x принадлежащих X.

Если такой вектор x* существует, то он определяет слабый гло­бальный (абсолютный) минимум q(x*) в допустимой области X.

Этот минимум называется слабым, так как удовлетворяет нестро­гому (слабому) неравенству. Он называется глобальным или абсо­лютным потому, что неравенство справедливо для всех x* ю X.

Минимум при x = x* называется сильным, если q(x*) < q(x) для x - x* (он всегда единственный).

(Аналогично - максимум).

Минимум в точке x = x* называется локальным (относительным), если существует такая окрестность Ox(x*) точки x*, что для всех x ю Ox(x*) выполняется неравенство q(x*) , q(x).

Если функция q(x) дифференцируема, то задача отыскания локаль­ных минимумов сводится к нахождению стационарных точек, в кото­рых обращаются в нуль частные производные функции q(x):

dq(x)        ___

----- = 0, i = 1,n.

dxi

Классическая задача оптимизации.

Классическая задача оптимизации состоит в нахождении экстрему­ма целевой функции q(x), где x = (x1,...,xn) принадлежащих Rn при наличии ограничений типа равенств.

___

fi(x) = 0, i = 1,m,  m < n        (*)

Если эти ограничения имеют место, то минимум функции q(x) на­зывается условным минимумом. Если ограничения отсутствуют, то говорят о безусловном минимуме, нахождение которого сводится к определению и исследованию стационарных точек функции q(x).

Классический способ решения данной задачи состоит в том, что условия (*) используются для исключения из рассмотрения m пере­менных. При этом целевая функция приводится к виду:

q(x1,...,xn) = q1(y1,...,yn-m),

где через y1,..,yn-m обозначены неисключаемые переменные.  За­дача состоит в нахождении y1,..,yn-m,  которые обращают в мини­мум функцию q1 и на которые не наложено никаких ограничений.

Пример: Дадим геометрическую интерпретацию данной задачи для двумерной переменной x = (u, v) с одним ограничением

f(x) = u2 - v+1 = 0

и с целевой функцией q(x) = (u-1)2 + v2.

%v

|

|

|

|

|

----------------------6

|        u

Огр: f(x) = 0 и линия уровня: q(x) = const.

Оптимальное решение x* получается в точке касания кривых f(x)=0 и q(x)=const.

Из f(x) = 0 следует v = u2 + 1.

Подставляя в q(x), получаем q(x) = (u - 1)2 +  (u + 1)2.

Следовательно q'=2u3+3u-1=0, которое имеет единственный ве­щественный корень u*=0.313. При этом v*=1.098; q(x*)=1.678.

Заметим, что при отсутствии ограничения f(x)=0 минимум q(x)=0 при x=(1,0).

Если уравнения (*) имеют сложный вид, то исключенные с их по­мощью m переменных из функции q(x) представляет значительные трудности. В связи с этим большое практическое значение получил метод сведения задачи на условный экстремум к задаче на безус­ловный экстремум, основанный на использовании функции Лагранжа.

Функция Лагранжа.

Введем в рассмотрение вектор l = (l1,...,lm) и исследуем свойства функции

m

L(x, l) = q(x) + S lifi(x)        (1)

i=1

Функция L(x, l) называется функцией Лагранжа, а величины li - множителями Лагранжа.

Рассмотрим стационарные точки функции  L(x, l),  которые  полу -

чим, приравняв  к нулю  частные  производные по lj, j = 1,m и по

xk,  k =        1,n :

dL(x, l)        ___

------- = fj(x) = 0,  j =        1,m;  (2)

dlj

dL(x, l)

------- = 0.        (3)

dxk

Заметим, что уравнения (2) совпадают с ограничениями u, как следует из (1), при их выполнении имеет место L(x, l) = q(x).

Потому, если в стационарной точке (x*, l*) функция L(x, l) дос­тигает экстремума, то x* обеспечивает и экстремум q(x) при вы­полнении ограничений, т. е. дает решение задачи.

Задача на условный экстремум целевой функции q(x) при наличии ограничений типа равенств сводится к задаче на определение ста­ционарных точек L(x, l).

Для предыдущего примера функция Лагранжа L(x, l) = (u - 1)2 + v2 + l * (u2 - v + 1).

Диффиренцируем:

(

2 u * (1 + l) - 1 = 0,

*        2*v - l = 0,

2        u2 - v + 1 = 0.

9

Отсюда следует, что находим u, v, l.