Доказательство. В силу выпуклости f(х) имеем

Отсюда
![]()
Разложим f(
+ λ (х -
)) в ряд Тейлора:
![]()
После предельного перехода при λ→0 получим f(x)— f(
) ≥ 0. Отсюда f(x)≤ f(
). Теорема доказана
Из этой теоремы следует, что для выпуклых задач оптимизации отыскание стационарной точки означает отыскание точки побального минимума
Для выявления выпуклости функции можно воспользоваться следующим критерием, если функция f(x) дважды дифференцируема на выпуклом множестве Х
Rп и матрица ее вторых производных f"(x) положительно определена при всех х
X, то f(x) является выпуклой функцией на множестве Х.
Если к матрице f"(x) применить критерии Сильвестра, то критерий выпуклости формулируется так - если все ведущие миноры матрицы f"(x) положительны при всех х
X, то функция f(x) выпукла на множестве X.
Укажем еще одно полезное свойство выпуклых задач.
Теорема 7. Пусть рассматривается выпуклая задача оптимизации. Тогда множество ее решений X* = {
} выпукло. Если при этом функция f(x) строго выпукла на X, то решение задачи единственно, т. е. множество X* состоит из одной moчкu.
Доказательство. Пусть х1 и х2 принадлежат Х* и λ
[0, 1]. Тогда f(х1) = f(х2)= f(
). В силу выпуклости функции f(x) имеем:

Поскольку f(
) - минимальное значение f(x) на Х, то это неравенство может выполниться только как равенство. Следовательно, λх1+(l—λ) х2 — точка минимума. Значит, по определению, множество Х* выпукло.
Пусть теперь функция f(x) строго выпукла. Если предположить, что в Х* существуют две различные точки х1 и х2, то при λ
[0, 1] приведенное выше неравенство должно быть строгим, что невозможно, поскольку f(
) — минимальное значение f(x) на Х. Теорема доказана
6.6.5. Квадратичные функция
Во многих задачах оптимизации рассматриваются квадратичные функции, т. е. функции вида

Положим aij = cij + cji. Тогда матрица A = (aij) будет симметричной. С ее помощью квадратичную функцию можно представить в виде

где х = (х1, х2,..., хп)Т и b = (b1, b2,..., bп)Т.
Градиент и матрица Гессе квадратичной функции представляются следующим образом:
grad f(x)= f′(x)= Ax +b, f"(x) = A.
Чтобы квадратичная функция была выпуклой на Rп, достаточно, чтобы матрица А была положительно определена
В случае минимизации выпуклой квадратичной функции выбор шага αk, на (k + 1)-й итерации по направлению убывания может быть осуществлен из следующих соображений. Запишем

Здесь мы воспользовались равенством (Ahk, хk) = (Ах k, h), поскольку А — симметричная матрица.
Итак, мы выписали квадратный трехчлен р(α). Его минимум достигается при том значении α, которое может быть получено из уравнения р'(α) = 0:
(Ahk,hk) α + (Axk + b,hk) =0.
Отсюда получаем, что

Полученное значение αk неотрицательно, поскольку числитель не положителен по признаку убывания, а знаменатель строго больше нуля в силу положительной определенности матрицы А.
Если квадратичная функция выпукла, то точку минимума можно также найти из уравнения f'(x) = Ax + b = 0, т. е. решая систему линейных алгебраических уравнений с симметричной положительно определенной матрицей.
6.6.6. Градиентные методы
Рассмотрим методы безусловной минимизации, основанные на идее замены минимизируемой функции f(x) в окрестности очередного приближения хk первым членом (линейной частью) ее разложения в ряд Тейлора. Такие методы называют градиентными, поскольку при вычислении хk+1 используются производные функции f(x) первого порядка.
Градиентные методы относятся к классу методов спуска, в которых два последовательных приближения к точке минимума связаны соотношением
xk+1 = xk + αkhk,
где hk — направление убывания функции f(x) в точке и αk — длина шага по направлению убывания hk. Вектор hk берется равным антиградиенту функции f(x) в точке xk, т. е. hk = —f'(xk):
xk+1=xk- αk f'(xk), αk >0, k = 0,1,2,.... (6)
В пользу такого выбора направления убывания могут быть высказаны следующие соображения. В предположении, что функция f(x) дифференцируема на Rn, рассмотрим линейную часть приращения f(x)-f(xk):
(7)
Все возможные направления перемещении от точки xk с конечным шагом α образуют шар Х радиуса α с центром в точке xk: X = {х : ||x — хk||2 ≤ α}. Наша цель найти такое направление убывания, при котором на границе этого шара выполнялись условия, чтобы f(x) < f(xk) и чтобы разность f(xk) - f(x) при этом была наибольшей (т. е. чтобы при фиксированной длине шага по искомому направлению достигалось наименьшее значение f(x)).
Из (7) можно заключить, что эта разность будет наибольшей, если мы минимизируем по х на шаре X линейную часть приращения f(x) — f(xk), равную (f'(xk), x — xk). Воспользовавшись неравенством Коши-Буняковекого, запишем
![]()
Легко видеть, что нижняя грань последнего неравенства достигается при

Таким образом, приходим к выводу, что при фиксированной длине шага α минимум линейной части разложения функции f(x) в ряд Тейлора в окрестности точки xk достигается, если направление вектора h = xk+1 — xk совпадает с направлением антиградиента —f'(xk). Это означает, что направление ангиградиента является самым выгодным из всех направлений убывания.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 |


