Об одном классе однотипных дифференциальных игр

ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ

ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

«ЧЕЛЯБИНСКИЙ ГОСУДАРСТВЕННЫЙ»

ГОУВПО «ЧЕЛГУ»

ОБ ОДНОМ КЛАССЕ ОДНОТИПНЫХ ДИФФЕРЕНЦИАЛЬНЫХ ИГР

Исполнитель ,

математический факультет,

аспирант кафедры ТУиО, бюджет

Научный руководитель,

д. ф-м. н., проф.

Декан,

д. ф-м. н., проф.

2010
Содержание.

Введение. 3

Задача минимизации интегральной платы. 5

Постановка задачи. 5

Построение оптимального управления первого игрока. 6

Нелинейная дифференциальная игра со смешанными ограничениями. 12

Общая постановка задачи. 12

Вычисление цены игры. 13

Заключение. 18

Список литературы. 19

Введение.

Теория управляемых процессов представляет собой интенсивно развивающийся раздел современной математики. В данной теории исследуются задачи управления в условиях конфликта, когда в процессе участвуют две стороны или более, имеющие противоположные или несовпадающие цели.

Такие динамические процессы, описываемые дифференциальными уравнениями, называются дифференциальными играми. Становление теории дифференциальных игр связано с исследованиями Айзекса, Понтрягина, Красовского, Субботина и других зарубежных и советских, а позднее, российских, математиков.

и его школа рассматривают игру сближения – уклонения. Метод построения решений этой дифференциальной игры основывается на правиле экстремального прицеливания. Доказана теорема об альтернативе, которая утверждает, что при выполнении локального условия седловой точки маленькой игры в игре сближения – уклонения для всякой начальной позиции справедливо одно из двух утверждений: либо существует позиционная стратегия первого игрока, которая обеспечивает встречу движений, либо существует позиционная стратегия второго игрока, которая обеспечивает уклонение от встречи, как бы ни действовал первый игрок. Решение задачи может быть получено построением некоторого стабильного моста W в пространстве позиций (, ), который, в первом случае, связывает начальную позицию с целью X, а во втором случае, проходя через начальную позицию , минует цель X. Стратегии, удерживающие движение на стабильном мосту W, строятся при использовании правила экстремального прицеливания. В теории позиционных игр реализовавшееся движение понимается как пучок функций, каждая из которых является равномерным пределом некоторой последовательности ломаных при диаметре разбиения, стремящемся к нулю [1]. В данной работе используется это определение реализовавшегося движения.

НЕ нашли? Не то? Что вы ищете?

В работах [2] условия стабильности сформулированы с помощью производных по направлению. В результате получены дифференциальные неравенства [3], которые обобщают основное уравнение дифференциальных игр, записанное Р. Айзексом [4]. В рамках теории позиционных дифференциальных игр разрабатывались алгоритмы, а так же численные методы построения цены игры.

В последние годы теория дифференциальных игр интенсивно развивалась. Наряду с накоплением фактов происходила их систематизация, складывались основные направления теории дифференциальных игр.

В представленной работе изучаются игры с простым движением или однотипные дифференциальные игры. Исследование данного класса дифференциальных игр, когда в правой части уравнений движения стоит сумма управлений первого и второго игроков, актуально с точки зрения возможности сведения к такому виду множества дифференциальных игр («изотропные ракеты», «мальчик и крокодил», контрольный пример и др.) с помощью линейной замены переменных.

Однотипные дифференциальные игры в случае смешанных ограничений изучены в работе [5]. В данной научной работе рассматривается более общий случай, когда первый игрок выбирает свое управление, удовлетворяющее геометрическим ограничениям, при условии минимизации интегральной платы, которая задается выпуклой функцией от нормы управления. Движение системы задается линейными дифференциальными уравнениями.

Для этой игры найдены необходимые и достаточные условия, с помощью которых вычисляются оптимальные управления игроков и множество тех начальных состояний, откуда первый игрок сможет в заданный момент времени вывести фазовую точку на круг заданного радиуса.

В представленной работе рассмотрен случай, когда уравнения движения не удовлетворяют условию линейности, платой является норма фазового вектора. Для такой игры вычислена функция цены игры и найдены оптимальные стратегии игроков.

Задача минимизации интегральной платы.

Постановка задачи.

Рассмотрим игру в пространстве

Здесь и - неотрицательные непрерывные при скалярные функции, - момент окончания игры. Первый игрок выбирает управление второй - управление Расходы ресурсов, потраченные на формирование управления первого игрока задаются интегралом

Предположение 1. Функция определена при всех выпукла по является непрерывной и при всех

Задано число Первый игрок стремится осуществить неравенство минимизируя интеграл.

Стратегией первого игрока является функция вида

Здесь - произвольная функция, удовлетворяющая равенству

а измеримая функция строится в зависимости от начального состояния.

Стратегия второго игрока задается функцией которая удовлетворяет ограничению

Дадим определение движения, порожденного заданными стратегиями. Зафиксируем начальное состояние Возьмем разбиение

c диаметром Построим ломаную

Здесь

Потраченное количество ресурсов задается интегралом с заменой в нем Обозначим

Тогда из ограничений и следует, что для всех Из этого неравенства следует, что семейство ломаных является равномерно ограниченным и равностепенно непрерывным на отрезке По теореме Арцела [6] из любой последовательности ломаных можно выделить подпоследовательность, равномерно сходящуюся на отрезке Под движением будем понимать равномерный предел последовательности ломаных, у которых диаметр разбиения стремится к нулю.

Построение оптимального управления первого игрока.

Зафиксируем измеримую функцию Подставим управление в уравнение и рассмотрим игру с геометрическими ограничениями

Первый игрок, выбирая управление минимизирует величину а второй игрок, выбирая управление ее максимизирует. Обозначим

Теорема 1. [6] Для начального состояния в игре управление , где

если и если

обеспечивает выполнение неравенства

Управление обеспечивает выполнение противоположного неравенства

Из этой теоремы следует, что первый игрок сможет осуществить неравенство в игре с помощью некоторого управления тогда и только тогда, когда

Рассмотрим следующую оптимизационную задачу:

Если для любой измеримой функции не выполнено одно из условий или, то, используя формулу, получим, что Отсюда и из теоремы 1 следует, что управление обеспечивает выполнение неравенства

Отметим, что из условия следует, что неравенства и выполнены для некоторой измеримой функции тогда и только тогда, когда они выполнены для функции Таким образом, условия совместности связей и принимают вид

Пусть выполнены неравенства, а функция удовлетворяет условиям предположения 1. Тогда решение в задаче - существует. Из условия при всех и следует, что нижняя грань функционала на измеримых функциях удовлетворяющих ограничениям и, существует. Это значит, что существует последовательность измеримых функций , удовлетворяющих ограничениям и такая, что

Каждая функция

удовлетворяет на отрезке условию Липшица с константой . По теореме Арцела из нее можно выделить подпоследовательность, которая на отрезке равномерно сходится к некоторой функции Предельная функция так же удовлетворяет на отрезке условию Липшица с той же константой Не вводя новых обозначений, считаем, что сама последовательность функций сходится к равномерно на Если покажем, что существует измеримая функция такая, что

то эта функция будет являться решением задачи -

В самом деле, функции удовлетворяют неравенствам -. Поэтому функции удовлетворяют неравенствам при и Из равномерной сходимости следует, что этим неравенствам уддовлетворяет функция Стало быть, функция удовлетворяет ограничениям и.

Рассмотрим последовательность функций

Из непрерывности функции следует, что она ограничена на множестве некоторым числом Следовательно, каждая из функций удовлетворяет на отрезке условию Липшица с этой константой Поэтому, рассуждая так же как и для последовательности функций , можем считать, что последовательность функций сходится равномерно на отрезке к некоторой функции . Эта предельная функция удовлетворяет условию Липшица с той же константой .

Таким образом, построенные предельные функции и являются абсолютно непрерывными на отрезке и, следовательно, у них почти всюду существуют производные. Допустим, что существует измеримая функция такая, что

для почти всех . Из формулы следует, что . Поэтому . Интегрируя равенство, получим вторую формулу. Согласно формулам и, и Интегрируя неравенство, получим, что функция удовлетворяет первому неравенству.

Введем в рассмотрение многозначную функцию

Из непрерывности функций и следует, что многозначная функция полунепрерывно сверху зависит от . Это значит, что для каждой точки и для любого числа найдется число такое, что для всех

Здесь обозначено .

Обозначим и . Тогда почти всюду на отрезке существуют производные и . Возьмем точку , в которой существуют эти производные. Зафиксируем число и . Тогда

Из формул и следует, что для почти всех . Зафиксируем число . Тогда из включения получим, что существует число такое, что для всех и почти всех . Применяя понятие интеграла от многозначной функции [8], получим, что

Здесь - выпуклая оболочка множества . Поскольку множество, стоящее в правой части, является компактом, тогда, используя формулу, получим, что

Устремим и, учитывая, что - произвольное положительное число, получим, что . Используя теорему Каратеодори [10] получим, что существуют числа такие, что

Из этих формул, применяя лемму о выборе [11], получим, что существуют измеримые на отрезке функции такие, что они удовлетворяют равенствам для почти всех . Следовательно, функция удовлетворяет первому равенству в. Из выпуклости по функций следует, что

Таким образом, построенная функция удовлетворяет неравенству в.

Приведем достаточные условия, при выполнении которых функция является решением задачи - . Пусть измеримая функция удовлетворяет связям и. Пусть существует число и неубывающая на отрезке функция такие, что и

Тогда функция является решением задачи - .

Возьмем произвольную измеримую функцию и запишем функцию Лагранжа

Используя формулу интегрирования по частям в интеграле Римана - Стильтьеса [9], получим

Поэтому из равенств - следует, что

Это неравенство доказывает оптимальность функции

Нелинейная дифференциальная игра со смешанными ограничениями.

Общая постановка задачи.

Рассмотрим игру

(28)

(29)

Здесь - момент окончания игры. Первый игрок, выбирая управления и минимизирует норму Второй игрок, выбирая управление , максимизирует эту норму. Уравнение (29) характеризует расход ресурсов, которые первый игрок тратит на формирование своего управления. На выбор управления первого игрока, наряду с геометрическими ограничениями, накладывается еще ограничение

(30)

Предположение 2. Функции определены при и являются непрерывными.

Предположение 3. При каждых функция является вогнутой по

Предположение 4. Для любого начального условия и для любой измеримой функции дифференциальное уравнение (29) имеет единственное решение определенное при

Рассмотрение данного класса нелинейных дифференциальных игр наряду с изученным выше классом линейных дифференциальных игр минимизации интегральной платы неслучайно. При условии выполнения предположения 3, оптимальные стратегии поведения игроков ищутся в таком же виде (3), (5), с той лишь оговоркой, что функция , которая строится в зависимости от начального условия , должна удовлетворять неравенству

Несложно показать, что движение, порожденное заданными стратегиями, задается ломаной , которая определяется следующим образом: (30)

Оставшийся запас ресурсов определяется формулой .

Обозначим Тогда из ограничений на управления игроков, а также из неравенства при получим, что для всех Из этого неравенства следует, что семейство ломаных (30) является равномерно ограниченным и равностепенно непрерывным на отрезке По теореме Арцела [5] из любой последовательности ломаных (30) можно выделить подпоследовательность, равномерно сходящуюся на отрезке Таким образом в данной задаче так же, как и для предыдущей, под движением будем понимать равномерный предел последовательности ломаных (30), у которых диаметр разбиения стремится к нулю.

Вычисление цены игры.

Поскольку рассматриваемые задачи в какой-то степени являются аналогичными, для нахождения цены данной нелинейной дифференциальной игры рассмотрим задачу с геометрическими ограничениями

(31)

Здесь Первый игрок, выбирая управление минимизирует величину а второй игрок, выбирая управление ее максимизирует. Обозначим

(32)

(33)

(34)

Для полученной задачи с геометрическими ограничениями так же будет верна теорема 1, следовательно функция (32) является функцией цены в игре (31).

Для доказательства существования решения в исходной дифференциальной игре (28) рассмотрим следующую оптимизационную задачу:

(35)

Если задача (35) имеет решение то, как следует из теоремы 1, функция является ценой в исходной игре. В этом случае оптимальная стратегия первого игрока имеет вид а оптимальная стратегия второго игрока равна

Теорема 2. При любых решение в задаче (35) существует.

Д о к а з а т е л ь с т в о. Функция удовлетворяет ограничениям в задаче (35). Из формул (32), (33) следует, что

для любой измеримой функции Поэтому нижняя грань в задаче (35) существует. Это значит, что существует последовательность измеримых функций удовлетворяющая ограничениям в задаче (35), такая, что

(36)

Здесь обозначено

(37)

Каждая из функций удовлетворяет на отрезке условию Липшица с константой Каждая функция является решением дифференциального уравнения (29) с и с начальным условием . Поэтому каждая функция удовлетворяет на отрезке условию Липшица с константой

Таким образом, семейство функций и является равномерно ограниченным и равностепенно непрерывным на отрезке Переходя, если нужно, к подпсоледовательсноти и применяя теорему Арцела можем считать, что при равномерно на отрезке Из равномерной сходимости следует, что

Отсюда и из (36) получим, что

(38)

Предельные функции и удовлетворяют на отрезке условию Липшица. Следовательно, у них почти всюду существуют производные.

Введем в рассмотрение многозначную функцию

(39)

Из непрерывности функций и следует, что многозначная функция (39) полунепрерывно сверху зависит от и Это значит, что для каждых таких чисел и и для каждого числа найдется число такое, что для всех выполнено включение

(40)

Здесь обозначено Обозначим и Тогда почти всюду на отрезке существуют производные и Возьмем точку в которой существуют эти производные. Зафиксируем число и Тогда

(41)

Из формул и следует, что для почти всех Зафиксируем число Тогда существует число такое, что как только Далее Существует номер такой, что при Возьмем Тогда

Применяя понятие интеграла от многозначной функции [8], получим, что при и

(42)

Здесь - выпуклая оболочка множества Поскольку множество, стоящее в правой части (42), является компактом, то, используя формулу (41), получим, что

Устремим . Тогда, учитывая, что - произвольное положительное число, получим включение Отсюда, используя теорему Каратеодори [10] получим, что

(43)

при некоторых Из этих формул, применяя лемму о выборе [8], получим, что существуют измеримые на отрезке функции которые при почти всех удовлетворяют равенствам (43). Обозначим

Тогда из (43), используя вогнутость по функции получим

(44)

Обозначим

Тогда из (44) следует, что при Отсюда и из равенства получим, что при Учитывая формулы (34) и (38), будем иметь неравенство:

Следовательно, функция является решением задачи (35). Теорема доказана.

Заключение.

В представленной работе было рассмотрено два класса дифференциальных игр со смешанными ограничениями и фиксированным моментом окончания: линейная дифференциальная игра минимизации интегральной платы, заданной функцией от нормы управления, и нелинейная дифференциальная игра.

В предположении выпуклости функции, входящей в интегральное ограничение, для обеих задач сформулированы и доказаны теоремы существования оптимальных стратегий поведения игроков, найдены функции цены игры.

Результаты проведенного исследования могут быть использованы для решения более широкого класса задач преследования с фиксированным временем.

Используя приведенное в главах работы определение движения, полученные результаты позволяют решать задачи данного типа программным методом при заданных начальных условиях.

Результаты опубликованы в виде тезисов “Об одном классе однотипных игр со смешанными ограничениями” в материалах [12] Воронежской весенней математической школы «Понтрягинские чтения – XXI» “Современные методы теории краевых задач”, “Об одном классе однотипных игр со смешанными ограничениями на выбор управления” в материалах [13] Всероссийской конференции посвященной 80-ти летию со дня рождения Санкт – Петербургскогогосударственного университета «Устойчивость и процессы управления», в статье [14] “Об одном классе однотипных дифференциальных игр со смешанными ограничениями на управления” Вестника Удмуртского университета.

Список литературы.

[1] , Субботин дифференциальные игры. М.: Наука, 19с.

[2] Субботин основного уравнения теории дифференциальных игр // Докл. АН СССР. 1980. Т.254. №2. С. 293 – 297.

[3] Субботин неравенства и уравнения Гамильтона-Якоби. М.: Наука. 19с.

[4] Дифференциальные игры. М.: Мир, 1967.479 с.

[5] Ухоботов линейная игра со смешанными ограничениями на управления // Прикладная математика и механика. – 1987. – Т. 51, вып.2. – С. 179 – 185.

, Соболев функционального анализа. М.: Наука, 19с.

[7] Ухоботов управления в однотипных дифференциальных играх с фиксированным временем // Вестн. Челяб. ун-та. Сер. мат-ка, механика. 1996. Вып. 1. С. 178 – 184.

Hermes H. The Generalized Differential Equation // Advances in Math. 1970. Vol. 4, no. 29. P. 149 – 169.

Секефальви- Лекции по функциональному анализу. М.: Мир, 19с.

Пшеничный анализ и экстремальные задачи. М.: Наука, 19c.

О некоторых вопросах теории оптимального регулирования // Вест. МГУ. Сер. мат-ка, механика. 1959. Вып. 2 С. 25 – 32.

[12] Об одном классе однотипных игр со смешанными ограничениями // Воронежская весенняя математическая школа “Понтрягинские чтения”. Современные методы теории краевых задач. ВГУ. 2010. С. 73 – 74.

[13] , Об одном классе однотипных дифференциальных игр со смешанными ограничениями на выбор управления // Всероссийская конференция посвященная 80-ти летию со дня рождения . Устойчивость и процессы управления. СпбГУ. 2010. С. 182.

[14] , Об одном классе однотипных дифференциальных игр со смешанными ограничениями на управления // Вест. Удмурт. ун-та. Сер. Мат-ка. 2010. Вып. 1 С. 81 – 86.

Об одном классе однотипных дифференциальных игр

Задача минимизации интегральной платы.

Постановка задачи.

Построение оптимального управления первого игрока.

Нелинейная дифференциальная игра со смешанными ограничениями.

Общая постановка задачи.

Вычисление цены игры.

Заключение.

Список литературы.

Домашний очаг

Справочная информация

Техника

Общество

Образование и наука

Мир

Бизнес и финансы