Более экономный способ заключается в пересчете аппроксимации после каждого нового измерения. Опишем схему подобных методов на упрощенной модели Пусть можно предполагать, что функция f(x), х Rп, аффинна в некоторой области: f(x)≈ (a, х) + β и уже вычислены ее значения с помехой в k (k≥n+1) точках:
где ηі — случайные независимые помехи,
Рассмотрим (п+1)-мерные векторы
и запишем измерения в виде уі = (с*, zі) + ηі. Найдем оценку для с* методом наименьших квадратов, т. е.
(12)
Этому методу можно придать рекуррентную форму — новое измерение в точке
может быть учтено с помощью следующей формулы:
(13)
Таким образом, на каждом шаге не нужно заново вычислять оценку для аппроксимирующей функции, решая систему линейных уравнений (12), а достаточно использовать простую рекуррентную формулу (13). Оценка ck может быть использована для реализации шага спуска:
и проверки согласованности линейной модели функции с измерениями. Разумеется, в реальных задачах линейная модель функции правомерна лишь локально, и метод минимизации должен включать «забывание» информации, полученной на ранних итерациях.
Совершенно аналогичные способы могут быть применены для восстановления квадратичной аппроксимации функции по результатам измерений, содержащих случайную ошибку.
9.5. Оптимальные методы при наличии помех
1. Потенциальные возможности итеративных методов при наличии помех. Для детерминированных «невозмущенных» задач, как мы видели, существует множество методов, каждому из которых присуща своя скорость сходимости. Так, для гладких сильно выпуклых функций метод тяжелого шарика сходится быстрее градиентного, метод сопряженных градиентов — быстрее метода тяжелого шарика, метод Ньютона — еще более быстро и т. д. Вопрос об оптимальном в смысле скорости сходимости методе здесь весьма сложен. Оказывается, наличие помех в определенном смысле упрощает ситуацию — оно ограничивает возможности любых методов минимизации. В этом случае существует некая предельная скорость сходимости, которая не может быть превзойдена. Тот метод, для которого эта предельная скорость достигается, естественно считать оптимальным.
Начнем с результатов, устанавливающих потенциальные возможности по скорости сходимости произвольных итеративных алгоритмов (не обязатпьно связанных с минимизацией) при наличии случайных помех Рассмотрим итерационный процесс в Rп:
(1)
где γk≥0 — детерминированные скалярные множители, R(х) — некоторая функция, а ξk — случайные помехи, предполагающиеся независимыми и центрированными
Начальное приближение х0 может быть либо детерминированным, либо случайным, в последнем случае предполагается, что М||х0||2 <∞ и х0, ξi независимы. Предположим, что существует единственная точка х* такая, что R(x*) = 0 и R(x) удовлетворяет условию линейного роста:
(2)
Теорема 1. Пусть для всех k
(3)
Тогда при сделанных выше предположениях для любого метода (1)
(4)
Подчеркнем, что в этой теореме, в отличие от любых теорем сходимости, приводившихся ранее, даются оценки скорости сходимости не сверху, а снизу. Теорема относится к любому способу выбора γk — в частности, и такому, для которого сходимость не имеет места.
Доказательство. Оценим условное математическое ожидание

Отсюда

Стоящая справа кусочно-квадратичная функция достигает минимума по γk при
Отсюда получаем

или, обозначая
Таким образом,

Из теоремы 1 следует, что любой метод вида (1) при сделанных выше предположениях не может сходиться быстрее 1/(a+bk), или асимптотически — быстрее O(1/k).
Приведем некоторые примеры использования этого результата. Pассмотрим градиентный метод минимизации f(x):
(5)
при абсолютных случайных помехах:
(6)
(обратите внимание, что здесь знак неравенства для дисперсии помех изменен на обратный по сравнению с 9.2). Предположим, что f(x) имеет точку минимума х*, а градиент
f(x) удовлетворяет условию Липшица с константой L. Тогда мы находимся в условиях применимости теоремы 1, и из нее следует, что при любом выборе γk для метода (5) справедлива оценка
(7)
Иначе говоря, никакой вариант градиентного метода при наличии абсолютных случайных помех не может сходиться быстрее O(1/k) (точнее,
Заметим, что для градиентного метода с γk = γ/k было
т. е. он асимптотически оптимален по порядку скорости сходимости. Более точно вопрос об оптимальности градиентного метода будет исследован далее.
Рассмотрим теперь метод Ньютона при наличии помех. Будем считать, что матрица [
2f(xk)]-1 вычисляется точно, а градиент содержит аддитивную случайную помеху ξk. В этом случае метод Ньютона (модифицированный за счет введения параметра, задающего длину шага) принимает вид
(8)
Относительно помех ξk будем считать, что они независимы и
(9)
Можно показать, что в условиях теоремы о сходимости «невозмущенного» метода Ньютона детерминированная часть процесса (8) (т. е.
в окрестности решения удовлетворяет условию Липшица, а случайная часть имеет дисперсию, ограниченную снизу. Таким образом, метод (8) также не может сходиться быстрее, чем со скоростью O(1/k). Иначе говоря, наличие случайных помех уничтожает преимущества быстро сходящихся методов минимизации.
Приведем результат, аналогичный теореме 1, но применительно к относительным помехам.
Теорема 2. Пусть выполнены, предположения, сформулированные в начале параграфа, и для всех k
(10)
Тогда для любого метода (1)
(11)
В качестве первого примера использования теоремы 2 рассмотрим градиентный метод при случайных относительных помехах. Пусть f(x) дифференцируема, существует точка минимума х*,
f(x) удовлетворяет условию Липшица с константой L, а помеха в определении градиента независима при различных k и удовлетворяет условиям
Тогда в методе (5) при любых γk выполняется неравенство (11). Иными словами, градиентный метод при случайных относительных помехах не может сходиться быстрее, чем со скоростью геометрической прогрессии.
Вторым примером может служить метод случайного поиска. Пусть f(x) — квадратичная функция:
(12) Рассмотрим метод
(13)
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 |


