Доказательство. В силу выпуклости f(х) имеем

Отсюда

Разложим f( + λ (х - )) в ряд Тейлора:

После предельного перехода при λ→0 получим f(x)— f() ≥ 0. Отсюда f(x)≤ f(). Теорема доказана

Из этой теоремы следует, что для выпуклых задач оптимизации отыскание стационарной точки означает отыскание точки побального минимума

Для выявления выпуклости функции можно воспользоваться следующим критерием, если функ­ция f(x) дважды дифференцируема на выпуклом множестве ХRп и матрица ее вторых произ­водных f"(x) положительно определена при всех хX, то f(x) является выпуклой функцией на множестве Х.

Если к матрице f"(x) применить критерии Сильвестра, то критерий выпуклости формулируется так - если все ведущие миноры матрицы f"(x) положительны при всех хX, то функция f(x) выпукла на множестве X.

Укажем еще одно полезное свойство выпуклых задач.

Теорема 7. Пусть рассматривается выпуклая задача оптимизации. Тогда множество ее ре­шений X* = {} выпукло. Если при этом функция f(x) строго выпукла на X, то решение задачи единственно, т. е. множество X* состоит из одной moчкu.

Доказательство. Пусть х1 и х2 принадлежат Х* и λ[0, 1]. Тогда f(х1) = f(х2)= f(). В силу выпуклости функции f(x) имеем:

Поскольку f() - минимальное значение f(x) на Х, то это неравенство может выполниться только как равенство. Следовательно, λх1+(l—λ) х2 — точка минимума. Значит, по определению, множество Х* выпукло.

Пусть теперь функция f(x) строго выпукла. Если предположить, что в Х* существуют две раз­личные точки х1 и х2, то при λ[0, 1] приведенное выше неравенство должно быть строгим, что невозможно, поскольку f() — минимальное значение f(x) на Х. Теорема доказана

НЕ нашли? Не то? Что вы ищете?

6.6.5. Квадратичные функция

Во многих задачах оптимизации рассматриваются квадратичные функции, т. е. функции вида

Положим aij = cij + cji. Тогда матрица A = (aij) будет симметричной. С ее помощью квадратичную функцию можно представить в виде

где х = (х1, х2,..., хп)Т и b = (b1, b2,..., bп)Т.

Градиент и матрица Гессе квадратичной функции представляются следующим образом:

grad f(x)= f′(x)= Ax +b, f"(x) = A.

Чтобы квадратичная функция была выпуклой на Rп, достаточно, чтобы матрица А была положи­тельно определена

В случае минимизации выпуклой квадратичной функции выбор шага αk, на (k + 1)-й итерации по направлению убывания может быть осуществлен из следующих соображений. Запишем

Здесь мы воспользовались равенством (Ahk, хk) = (Ах k, h), поскольку А — симметричная матрица.

Итак, мы выписали квадратный трехчлен р(α). Его минимум достигается при том значении α, которое может быть получено из уравнения р'(α) = 0:

(Ahk,hk) α + (Axk + b,hk) =0.

Отсюда получаем, что

Полученное значение αk неотрицательно, поскольку числитель не положителен по признаку убывания, а знаменатель строго больше нуля в силу положительной определенности матрицы А.

Если квадратичная функция выпукла, то точку минимума можно также найти из уравнения f'(x) = Ax + b = 0, т. е. решая систему линейных алгебраических уравнений с симметричной положительно определенной матрицей.

6.6.6. Градиентные методы

Рассмотрим методы безусловной минимизации, основанные на идее замены минимизируемой функ­ции f(x) в окрестности очередного приближения хk первым членом (линейной частью) ее разложения в ряд Тейлора. Такие методы называют градиентными, поскольку при вычислении хk+1 используются производные функции f(x) первого порядка.

Градиентные методы относятся к классу методов спуска, в которых два последовательных при­ближения к точке минимума связаны соотношением

xk+1 = xk + αkhk,

где hk — направление убывания функции f(x) в точке и αk — длина шага по направлению убыва­ния hk. Вектор hk берется равным антиградиенту функции f(x) в точке xk, т. е. hk = —f'(xk):

xk+1=xk- αk f'(xk), αk >0, k = 0,1,2,.... (6)

В пользу такого выбора направления убывания могут быть высказаны следующие соображения. В предположении, что функция f(x) дифференцируема на Rn, рассмотрим линейную часть приращения f(x)-f(xk):

(7)

Все возможные направления перемещении от точки xk с конечным шагом α образуют шар Х радиуса α с центром в точке xk: X = {х : ||xхk||2 ≤ α}. Наша цель найти такое направление убывания, при котором на границе этого шара выполнялись условия, чтобы f(x) < f(xk) и чтобы разность f(xk) - f(x) при этом была наибольшей (т. е. чтобы при фиксированной длине шага по искомому направлению достигалось наименьшее значение f(x)).

Из (7) можно заключить, что эта разность будет наибольшей, если мы минимизируем по х на шаре X линейную часть приращения f(x) f(xk), равную (f'(xk), xxk). Воспользовавшись нера­венством Коши-Буняковекого, запишем

Легко видеть, что нижняя грань последнего неравенства достигается при

Таким образом, приходим к выводу, что при фиксированной длине шага α минимум линейной части разложения функции f(x) в ряд Тейлора в окрестности точки xk достигается, если направление век­тора h = xk+1xk совпадает с направлением антиградиента f'(xk). Это означает, что направление ангиградиента является самым выгодным из всех направлений убывания.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97