Здесь - вектор управляющих воздействий , которые для широкого круга прикладных задач описываются в классе кусочно-непрерывных функций и связываются с , в (1), (3) выбираемой схемой приведения к модели (4). В реальных условиях изменение во времени управляющих воздействий ограничивается некоторой заранее заданной замкнутой областью их допустимых значений:

. (5)

В общем случае требования к конечному состоянию объекта при формулируются в виде условий его принадлежности некоторому множеству бесконечномерного фазового пространства переменных :

. (6)

Качество процесса управления оценивается интегральным функционалом I с заданной подынтегральной функцией , которая предполагается непрерывной по совокупности аргументов и непрерывно дифференцируемой по фазовым координатам:

. (7)

В работе формулируется следующая базовая задача оптимального программного управления объектом (4).

Задача 1. Среди допустимых управляющих воздействий (5), переводящих объект управления (4) из заданного начального в желаемое конечное состояние, согласно (6), требуется найти такое оптимальное управление и отвечающую ему фазовую траекторию , для которых критерий оптимальности (7) принимает экстремальное значение.

Применение стандартной процедуры принципа максимума Понтрягина, распространяющегося на задачу 1, приводит к весьма сложной бесконечномерной краевой задаче оптимального управления. Для данной краевой ЗОУ формально существует решение относительно искомых управляющих воздействий, представляемых в форме существенно нелинейных параметрических зависимостей от начальных значений бесконечного числа сопряженных переменных Трудности фактического вычисления таких решений приобретают принципиальный характер в классической двухточечной постановке с вырождением множества в (6) заданную точку поскольку из-за отсутствия информации о значениях исходная ЗОУ сводится к практически неразрешимой относительно бесконечной системе равенств заданным величинам конечных значений фазовых координат :

НЕ нашли? Не то? Что вы ищете?

.

Зависимости от неизвестного вектора представляются в явной форме после интегрирования уравнений объекта (4) с параметризованными на множестве управляющими воздействиями.

Кроме того, в целом ряде типичных требований к заданному конечному пространственному распределению функции состояния , объект либо оказывается неуправляемым относительно требуемого конечного состояния, либо заданное конечное состояние достигается в классе технически нереализуемых оптимальных управлений. В диссертации показано, что широко распространенные на практике способы приближенного решения этих задач, реализуемые по схеме исходной дискретизации, обладают рядом существенных недостатков, либо вообще оказываются неприменимыми в случае неуправляемости исходной модели ТОРП относительно заданного конечного состояния .

В качестве эффективного пути преодоления указанных затруднений предлагается отказаться от традиционной схемы с фиксированным концом фазовой траектории уже на стадии постановки задачи, рассматриваемой для точной бесконечномерной модели ТОРП в рамках исходного описания управляемого процесса. Классическая формальная двухточечная схема, как правило, не соответствует практически предъявляемым требованиям к конечному состоянию , для которого во всех реальных ситуациях существуют некоторые ненулевые допуски на отклонение от желаемого распределения .Это означает, что на самом деле можно ограничиться постановкой задачи с эквивалентным требованию (6) заданным целевым множеством G конечных состояний

, (8)

каждое из которых отвечает допустимой величине такой погрешности, оцениваемой заранее выбираемым способом. Реально предъявляемым требованиям в большинстве наиболее характерных прикладных задач соответствуют оценки этой погрешности в равномерной метрике по максимальной величине абсолютного отклонения от в пределах пространственной области, занимаемой объектом. Применительно к рассматриваемому классу задач управления ТОРП, при заданном допустимом значении соответствующее целевое множество автоматически исключает недопустимые локальные отклонения конечного пространственного распределения управляемой величины от заданного состояния и описывается следующим соотношением:

. (9)

В связи со сказанным в диссертации предлагается постановка задачи оптимизации ТОРП с заданным в бесконечномерном фазовом пространстве достижимым целевым множеством (9), что создает потенциальные возможности её точного решения в классе технически реализуемых алгоритмов оптимального управления.

Применение к уравнениям объекта (1)-(3) конечных интегральных преобразований по пространственному аргументу с ядром, равным его собственным функциям , где - собственные числа, приводит к представлению модели ТОРП (4) бесконечной системой линейных уравнений относительно коэффициентов (временных мод) разложения в бесконечный ряд по :

(10)

с последующим восстановлением управляемой функции состояния СРП по известным модам в виде суммы ряда:

. (11)

Здесь , – моды разложения внутреннего распределенного воздействия и заданного начального распределения в бесконечные ряды вида (11); и – постоянные коэффициенты. Ограничения на поведение сосредоточенных управлений и , фигурирующих в граничных условиях (3), чаще всего представляются в простейшей форме с заданными границами диапазона их возможного изменения:

. (12)

Аналогичным образом формулируются ограничения на внутреннее распределенное управляющее воздействие, включаемое непосредственно в уравнение объекта (1):

. (13)

Тем самым на модальные управления накладывается связанное ограничение:

. (14)

При моделировании ТОРП системой уравнений (10), (11) целевому множеству (9) в бесконечномерном фазовом пространстве переменных отвечает допустимая область конечных состояний объекта в (6) следующего вида:

(15)

для заданной величины равномерного приближения к на отрезке изменения пространственной переменной. Интегральный функционал качества (7) при управлении объектом (10) с заданной подынтегральной функцией векторов управляющих воздействий и фазовых переменных может быть записан в следующей форме:

. (16)

Теперь задача 1 конкретизируется следующим образом.

Задача 2. Среди стесненных заданными ограничениями (12), (14) управляющих воздействий , переводящих бесконечномерный объект управления (10) из заданного начального состояния в требуемое конечное состояние (15), необходимо найти оптимальное управление и соответствующую ему оптимальную траекторию , для которых критерий оптимальности (16) принимает наименьшее значение.

Точное решение сформулированной бесконечномерной ЗОУ ТОРП с помощью известных аналитических условий оптимальности связано с серьезными затруднениями и оказывается практически невыполнимым. Ситуация с негладким целевым множеством (15), кроме того, принципиально усложняется отсутствием классических условий трансверсальности для определения конечной точки оптимального процесса на его границе.

В диссертации разработан новый конструктивный метод решения задачи 2, существенно использующий ряд свойств целевых множеств (15). Для этого предлагается реализуемый в процессе применения стандартных процедур принципа максимума специальный способ конечномерной параметризации управлений на множестве значений бесконечного числа сопряженных переменных в конце оптимального процесса с числом параметров, однозначно определяемым величиной в (15). На этом множестве формируется такая упорядоченная определенным образом последовательность конечного числа S параметров, однозначно характеризующих зависящую от выбора S структуру оптимального управления, которая обеспечивает с возрастанием S попадание под действием этого управления в сужающиеся с уменьшением к заданной номинальной точке целевые множества (15). Тем самым гарантируется возможность достижения уменьшающихся с увеличением S отклонений от требуемого в идеале конечного состояния ТОРП. В качестве указанной последовательности выбирается S-мерный вектор финишных значений первых S сопряженных функций, соответствующих первым S модам , , управляемой величины, при равных нулю всех остальных значениях , :

(17)

Равенства (17) представляют собой условия трансверсальности на правом конце траектории в бесконечномерном фазовом пространстве СРП. При этом, согласно известным соотношениям, связывающим эти условия с положением конца фазовой траектории оптимального процесса, первые S составляющих соответствуют некоторым (априори неизвестным для каждого вектора фиксированным конечным значениям первых S мод , а остальные, равные нулю, составляющие означают свободу выбора величин , , на числовой оси для остальных модальных переменных. Тогда для вектора модальных переменных в конечный момент оптимального процесса выполняются следующие условия:

. (18)

С этой точки зрения параметры (17) представляют собой опосредованное отображение в пространстве сопряженных переменных возможных вариантов конечного состояния части фазовых координат объекта , для каждого из которых конечные значения остальных компонент вектора автоматически определяются при решении краевой задачи принципа максимума (П-системы) из условий минимизации критерия оптимальности (16).

Стандартная процедура принципа максимума приводит путем решения П-системы в условиях (17) к параметрическому представлению искомого программного оптимального управления на конечномерном множестве S параметров . При этом для каждого достижимого значения в (15) оптимальное управление следует искать именно в этом классе управляющих воздействий, поскольку они учитывают все возможные комбинации S первых величин в (18), и конечные значения остальных мод находятся из условий минимизации функционала (16). Интегрирование уравнений объекта с управлениями приводит к параметрическому представлению конечного состояния системы . В классе управлений достигается в равномерной метрике некоторое отличное от нуля минимально возможное отклонение (минимакс) конечного состояния объекта от требуемого:

. (19)

Соотношение между величинами минимаксов в (19) для различных значений S устанавливает следующее утверждение, доказательство которого приводится в диссертации.

Минимально достижимые в классе управлений значения ошибки равномерного приближения к в (19) образуют невозрастающую (как правило, убывающую) последовательность неравенств:

. (20)

Здесь при некотором минимакс совпадает с минимально возможной ошибкой равномерного приближения к , достижимой на множестве управлений с любым числом S параметров в (17).

В силу неравенств (20) значениям , отвечают целевые множества вида (15):

, (21)

сужающиеся к номинальной точке при , согласно (20), вплоть до значения , где точная нижняя грань больше или равна нулю, соответственно, для неуправляемых или управляемых относительно объектов, и, следовательно, (рисунок 1). Для целевых множеств с непустой внутренностью при , неравенства (20) определяют потенциальную возможность выполнения условий (15) при конечном числе S, что принципиально упрощает соответствующую краевую задачу.

Сложность структуры оптимальных управлений при их описании параметрическими зависимостями определяется соответствующей размерностью вектора в (17). Если оптимальное управление характеризуется вектором параметров , то его размерность , как это непосредственно следует из (20) по самому определению (19) величины минимакса, должна отвечать неравенству:

для всех , , (22)

определяющему, тем самым, нижнюю границу требуемого числа параметров , при котором обеспечивает заданную точность приближения к номинальной точке, но оставляющему открытый вопрос о конкретном выборе по заданной величине в (15).

Решение этой задачи исчерпывается установленным в работе принципом минимальной сложности параметризованной структуры оптимальных программных управлений, который формулируется следующим образом. Размерность вектора параметров оптимального управляющего воздействия совпадает со своей нижней границей в (22) и находится по правилу

для всех , (23)

согласно которому принадлежит к классу управляющих воздействий, характеризуемых минимальным числом параметров из всех чисел , при котором еще оказывается возможным осуществить перевод объекта в заданное целевое множество (15), и, следовательно, оптимальное управление отличается структурой минимальной сложности по сравнению со всеми другими, обеспечивающими выполнение требований (15) к конечному состоянию объекта (рисунок 2).

Рисунок 1 – Семейство целевых множеств (1,2 - фазовые траектории, при управлениях, определяемых векторами параметров и )

Рисунок 2 – Принцип минимальной сложности -параметризованной структуры оптимальных управлений

Согласно (23), определяется по месту заданного допуска в последовательности неравенств (20) для значений минимаксов , которые должны рассматриваться в качестве дополнительных неизвестных в процессе решения ЗОУ. Проблема их вычисления представляет собой самостоятельный интерес.

Если в рассматриваемой задаче 2 оптимального управления из условий (17) следует, что все сопряженные переменные, начиная с -ой, тождественно равны нулю:

, (24)

а в качестве аргументов в (16) фигурируют не более S первых составляющих , , вектора :

, (25)

то в таком случае функция Понтрягина в задаче 2 будет иметь вид:

(26)

Вместе с условием максимума Н на оптимальном управлении, ограничениями (12), (14) и первыми S уравнениями объекта (10) уравнения сопряженной системы для

(27)

образуют краевую задачу принципа максимума для управления конечномерной подсистемой S уравнений объекта (10) при для каждой совокупности фиксируемых величин , в (18). Таким образом, при выполнении допущений (24), (25) оптимальное управление S первыми модами функции состояния ТОРП в задаче с любыми закрепленными значениями их величин в конце оптимального процесса одновременно является решением исходной ЗОУ точной бесконечномерной моделью объекта с теми же краевыми условиями для учитываемых модальных переменных в (18). Следовательно, в рассматриваемом частном, но достаточно характерном для приложений случае структура оптимального управления ТОРП устанавливается в задаче оптимизации конечномерного объекта, что кардинальным образом упрощает решение исходной ЗОУ.

Для преодоления трудностей решения П-системы, связанных со сложным характером зависимости искомых управляющих воздействий от граничных значений сопряженных переменных, в диссертации предлагается осуществить переход от вектора к соответствующему вектору параметров , , другой природы, непосредственно характеризующему управления оптимальной структуры в пространственно-временной области их определения. Сопоставление и параметризованных структур с учетом общих свойств функции Понтрягина и особенностей конкретной задачи во многих случаях создают возможности построения однозначных отображений в форме соответствующей замкнутой системы соотношений, связывающих компоненты векторов и . В более простых ситуациях соответствующие условия оптимальности позволяют сразу получить -параметризованные представления оптимальных управлений, минуя этап -параметризации.

Предлагаемая в работе процедура параметризации в ЗОУ ТОРП отличается от известных, связанных, в основном, с исходной дискретизацией моделей СРП, отсутствием соответствующей погрешности моделирования; меньшей размерностью задачи по числу переменных; иным физическим смыслом компонент вектора параметров . В роли обычно небольшого числа параметров чаще всего фигурируют длительности во времени или протяженности по пространственным координатам отдельных интервалов изменения искомых управляющих воздействий по заранее фиксируемым с помощью рассматриваемых условий экстремума оптимальным зависимостям от соответствующих аргументов. При выборе в виде упорядоченной определенным образом последовательности S параметров подобно , в (17), конкретный характер которой диктуется знаниями предметной области применительно к каждой конкретной задаче оптимизации, минимально достижимые значения в классе управлений, однозначно характеризуемых величиной S, определяемые, подобно (19), на множестве значений и численно равные , монотонно убывают с возрастанием , подобно (20).

В широком классе задач -параметрической оптимизации сохраняется принцип (23) минимальной сложности структуры оптимальных управлений. Переход к параметрическому представлению оптимальных управлений вместо позволяет исключить сложную процедуру решения П-системы относительно , обращаясь к другим эффективным способам фактического решения оптимальной задачи. Интегрирование уравнений объекта с параметризованными управляющими воздействиями позволяет получить конечное состояние объекта и значение критерия оптимальности (16) в виде явных функций, соответственно и вектора . В результате, без каких-либо погрешностей в рамках используемых моделей, осуществляется точная редукция исходной ЗОУ СРП к специальной задаче полубесконечной оптимизации (ЗПО)

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5