9. Влияние помех на поведение методов безусловной минимизации
Цель настоящего раздела — выяснить поведение методов безусловной минимизации дифференцируемых функций при наличии помех. Оказывается, что чувствительность методов к помехам различна. Грубо говоря, чем эффективнее метод в идеальном случае (без помех), тем более чувствителен он к разного рода ошибкам. Можно модифицировать методы, сделав их работоспособными в условиях помех. При этом априорная информация о помехах (их уровень, закон распределения и т. д.) может быть эффективно использована.
9.1. Источники и типы помех
1. Источники помех. В реальных задачах применить методы минимизации «в чистом виде» нельзя — ситуация неизбежно осложняется наличием разного рода ошибок и погрешностей. Перечислим некоторые из причин их возникновения.
В простейшем случае, когда минимизируемая функция и ее градиент заданы формулами, ошибки возникают вследствие погрешностей вычисления, связанных с округлением при выполнении арифметических действий на ЭВМ. В результате f(xk), f(xk) и т. д. вычисляются с некоторой ошибкой, т. е. вместо вектора f(xk) мы получаем вектор sk = f(xk)+rk. Здесь помеха rk является детерминированной (ошибки округления в ЭВМ не носят случайного характера) и можнo оценить ее уровень ||rk||≤ε, так как законы образования погрешностей округления хорошо изучены. Величину ε обычно можно считать постоянной (не зависящей от xk) и, как правило, не слишком большой. В случае необходимости ε можно уменьшить, производя вычисления с двойной точностью.
В ряде задач значения f(xk) и f(xk) получаются не с помощью вычислений, а в результате измерений. Такова ситуация при оптимизации на реальном объекте (экстремальное регулирование, планирование эксперимента). Тогда помехи носят случайный характер, свойственный погрешностям измерений. При этом обычно бывает доступна информация об уровне и статистической природе помехи.
Нередко (особенно в задачах адаптации, обучения, распознавания и т. д.) проблема оптимизации ставится следующим образом. Нужно минимизировать детерминированную функцию f(x)
типа среднего риска:
(1)
где функция Q(x, ω) известна, однако распределение Р(ω) не задано. Дана лишь выборка ω1,..., ωk из этого распределения. Тогда точное вычисление f(x) и f(x) в принципе невозможно. В качестве приближенного значения этих величин можно взять
(2)
или более просто
Q(x, ωk) и xQ(x, ωk). (3)
В этом случае значения функции и градиента содержат случайную помеху. Если брать в качестве приближений для f(xk) и f(xk) величины Q(xk, ωk) и xQ(xk, ωk), то помехи будут независимы в различных точках.
Аналогичная ситуация возникает в методе Монте-Карло, когда задача заключается в минимизации f(x) вида (1) и распределение Р(ω) известно, однако вычисление интеграла (1) слишком трудоемко. Тогда можно точные значения f(x) и f(x) заменить выборочными значениями, как и выше.
В ряде задач ошибки возникают из-за того, что значения функции и градиента вычисляются по упрощенным или приближенным формулам. Нередко точное вычисление требует громоздкого расчета функций влияния, решения сложных вспомогательных задач, учета взаимодействия всех параметров и т. д. Все эти вычисления нецелесообразно (а иногда и невозможно) проводить полностью. Их упрощение и огрубление приводят к погрешностям в определении функции и градиента. Это так называемые неустранимые погрешности.
Наконец, во многих методах ошибки возникают не из-за приближенного вычисления функции или градиента, а из-за необходимости решения вспомогательных задач, которое не может быть осуществлено точно. Например, в методе Ньютона на каждом шаге нужно решать систему линейных уравнений, что неизбежно сопряжено с ошибками; в методе сопряженных градиентов требуется проводить одномерную минимизацию, что также может быть сделано лишь приближенно и т. д. В таком случае говорят о погрешностях метода.
2. Типы помех. Как мы видели выше, ошибки при вычислении функции и градиента могут иметь различное происхождение и различную природу. Несколько упрощая реальную ситуацию, можно выделить следующие основные типы помех. Всюду ниже речь идет о вычислении градиента, когда вместо точного значения f(xk) нам доступен вектор
sk = f(xk) + rk (4)
где rk — помехи. Случай приближенного вычисления f(x) исследуется аналогично.
а) Абсолютные детерминированные помехи удовлетворяют условию
||rk||≤ε, (5)
т. е. градиент вычисляется с заданной абсолютной ошибкой. Предполагается, что про помехи не известно ничего, кроме этого условия. В частности, вектор rk может не являться случайным, либо он может быть коррелирован с предыдущими помехами и т. д. Такая ситуация характерна для погрешностей вычислений и систематических ошибок измерений.
б) Относительные детерминированные помехи удовлетворяют условию
(6)
Иначе говоря, градиент вычисляется с относительной ошибкой. В остальном, как и выше, о природе rk ничего не известно. Такие помехи возникают, например, при использовании приближенных формул, дающих фиксированную относительную ошибку.
в) Абсолютные случайные помехи. Предположим, что помехи rk случайны, независимы при различных х, центрированы и имеют ограниченную дисперсию:
(7)
Помехи такого типа характерны для задач, в которых градиент отыскивается в результате измерений на реальном объекте (экстремальное регулирование, планирование эксперимента), а также для задач с функцией типа среднего риска (1).
г) Относительные случайные помехи обладают теми же свойствами, что и в п в), однако их дисперсия убывает по мере приближения к точке минимума:
(8)
Hа практике часто встречаются и другие типы помех например случайные помехи с систематической ошибкой (||Мk||≤ε) или случайные ограниченные помехи (Мrk = 0, ||rk||≤ε). Однако их можно рассматривать как комбинацию основных типов, описанных выше. Поэтому мы ограничимся этими наиболее важными классами помех. Иногда (особенно в теоретических работах) предполагают, что уровень помех εk зависит от номера итерации и εk→0 при k→∞, Такое предпо-
ложение представляется не очень реалистическим. B некоторых случаях можно добиться его выполнения путем повышения точности вычислений и уменьшения погрешности метода.
9. 2. Градиентный метод при наличии помех
1. Постановка задачи. Рассмотрим градиентный метод минимизации дифференцируемой функции f(x) на Rn в ситуации, когда градиент вычисляется с ошибкой:
(1)
Относительно помех rk будут делаться предположения об их принадлежности одному из классов, описанных выше. Функция f(x) будет предполагаться сильно выпуклой (с константой L) и с градиентом, удовлетворяющим условию Липшица (с константой L) — этот класс функций наиболее важен. Нас будет интересовать поведение обычного градиентного метода γk≡γ при наличии помех, а также вопрос о целесообразном выборе длины шага в условиях помех. Обоснование методов будет вестись с помощью общих теорем.
2. Абсолютные детерминированные помехи.
Теорема 1. Пусть
Тогда найдется > 0
такое, что при 0 < γ <
в методе (1) будет
(2)
где
при ε→0, х* — точка минимума f(x).
Доказательство. Введем функцию Ляпунова
(3)
Учитывя, что (3) дифференцируема и имеет результат
![]()
,
который удовлетворяет условию Липшица с константой 1, получаем

где а, b — некоторые константы, причем а→0 при ε→0.
Как нетрудно проверить на примерах, оценка (2) не является завышенной. Таким образом, наличие аддитивных помех приводит к тому, что градиентный метод с постоянным γ перестает сходиться к точке минимума. Он дает лишь возможность попасть в некоторую окрестность минимума, размеры которой тем меньше, чем меньше уровень помех. Сходимость к этой окрестности происходит со скоростью геометрической прогрессии.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 |


