Д о к а з а т е л ь с т в о. Множество Sα замкнуто.
Поэтому Sα — компактное подмножество Rm. В силу теоремы Вейерштрасса, очевидно, функция f достигает на Sα своего минимума: x* = argminx |
Замечания о единственности решений.
Вопрос о единственности (как, впрочем, и о существовании) решений весьма важен в теоретическом плане. Например, если x* — единственное решение задачи (1) и {xk}
Rm — ограниченная последовательность такая, что f(xk) → f(x*) = min f(x) при k→ ∞, то xk → x* = argmin f(x) при k → ∞. Такое свойство бывает полезным при исследовании приближенных методов решения оптимизационных задач.
Точка x* локального минимума дважды дифференцируемой функции f называется невырожденной, если оператор f ′′(x*) невырожден. Она называется локально единственной, если в некоторой ее окрестности Vx* нет других точек локального минимума функции f.
Теорема о локальной единственности решений. Невырожденная точка локального минимума локально единственна.
Д о к а з а т е л ь с т в о. Допустим противное: x* не является локально единственной точкой минимума, т. е. найдется сходящаяся к x* последовательность {xn} локальных минимумов функции f. Тогда
f ′(xn) – f ′(x*) = f ′′(x*)(xn –x*) + o(xn – x*). |
Поскольку xn и x* — локальные минимумы и, следовательно, стационарные точки, f ′(xn) = f ′(x*) = Θ. Далее, положим (как мы уже делали) gn = (xn – x*)/||xn – x*||. Тогда, очевидно,
| (9) |
Далее рассуждения стандартны: {gn} лежит на единичной сфере в Rm, поэтому ее можно считать сходящейся к некоторому пределу g 0 ≠ Θ. Переходя к пределу в (9), получаем
f ′′(x*)g0 = Θ, |
что противоречит невырожденности оператора f ′′(x*).
Выпуклые функции на Rm.
Особенно легко вопросы существования и единственности решаются для выпуклых функций. Эти функции являются очень важным объектом в теории оптимизационных задач. Начнем с определений.
Функция f: Rm → R называется выпуклой, если при всех x, y
Rm и λ
(0, 1)
f(λx + (1 – λ)y) ≤ λf(x) + (1 – λ)f(y). | (10) |
Если неравенство (10) строгое, то f называется строго выпуклой. Геометрически выпуклость означает, что график функции на интервале (x, y), соединяющем любые точки x и y, лежит не выше прямой, соединяющей точки (x, f(x)) и (y, f(y)) (см. рис. 3,а). Функция f сильно выпукла (с константой c > 0), если неравенство (10) выполняется в следующей более сильной форме
| (11) |

а) б)
Рис. 3.
Геометрически это понятие можно интерпретировать так. Пусть точки отрезка [x, y], соединяющего точки x и y, параметризованы параметром λ: λ → λx + (1 – λ)y. Правая часть неравенства (11) определяет на этом отрезке полином φ второго порядка (от λ). График сильно выпуклой функции над отрезком [x, y] должен лежать ниже параболы — графика этого полинома (см. рис. 3,б).
Критерий выпуклости дифференцируемой функции. Для того, чтобы дифференцируемая функция f была выпуклой необходимо и достаточно выполнения при всех x,y
Rm неравенства
f(x) – f(y) ≥ (f ′(y), x – y). | (12) |
Действительно, определим на отрезке [0, 1] функцию φ, положив
φ(λ) = f(λx + (1 – λ)y). |
Очевидно функция φ выпукла одновременно с функцией f. Кроме того, легко показать, что
φ′(λ) = (f ′(λx + (1 –λ)y), x – y). |
Неравенство (12) в новых обозначениях переписывается в виде
φ(1) – φ(0) ≥ φ′(0), |
или, если воспользоваться формулой Лагранжа,
φ′(τ) ≥ φ′(0), | (13) |
где τ — некоторая точка интервала (0, 1). Из курса математического анализа известно, что для дифференцируемых функций выпуклость эквивалентна монотонности производной. Поэтому, если f выпукла, то φ′ монотонна. Следовательно, имеет место эквивалентное (12) неравенство (13).
Геометрически доказанное утверждение означает, что значения функции f(x) "лежит выше" гиперплоскости
Hy = {(x, ξ)
Rm×R: ξ = f(y) + (f ′(y), x – y)},
касательной в точке (y, f(y)) к графику Gr f ={(x, ξ)
Rm×R:ξ = f(x)} при всех y
Rm (см. рис. 4).

Рис. 4.
Строгая выпуклость дифференцируемой функции, как легко видеть, эквивалентна строгому при x≠y неравенству (12). Сильная же выпуклость функции f эквивалентна выполнению при всех x и y неравенства
f(x) – f(y) ≥ (f ′(y), x – y) + c||x – y||2. | (14) |
Замечание. Функция f
C2 сильно выпукла с константой c в том и только том случае, если f ′′(x) ≥ c при всех x
Rm.
Теорема о разрешимости для сильно выпуклой функции.
Задача (1) с дифференцируемой сильно выпуклой функцией разрешима.
Д о к а з а т е л ь с т в о. Неравенство (14) для y = Θ и произвольного x имеет вид
f(x) ≥ f(Θ) + (f ′(Θ), x) +c||x||2. | (15) |
Для α = f(Θ) множество Sα = {x
Rm: f(x) ≤ α}, во-первых, непусто, поскольку содержит точку Θ, а во-вторых, ограничено, поскольку вне шара B(Θ, ||f ′(Θ)||/c)
f(x) > α. |
Действительно, продолжая (15), при ||x|| > ||f ′(Θ)||/c имеем
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 |


