На очередном шаге имеем хп:

Скорость сходимости полученной последовательности составляет приблизительно 4/3. Это существенно меньше, нежели 2, необходимое для квадратичной сходимости, поэтому в данном случае можно говорить лишь о линейной сходимости, хотя функция всюду непрерывно дифференцируема, производная в корне не равна нулю, и f бесконечно дифференцируема везде, кроме как в корне.
- Если производная в точке корня равна нулю, то скорость сходимости не будет квадратичной, а сам метод может преждевременно прекратить поиск, и дать неверное для заданной точности приближение.
Пусть

Тогда
и следовательно
. Таким образом сходимость метода не квадратичная, а линейная, хотя функция всюду бесконечно дифференцируема.
Ограничения
Пусть задано уравнение
, где
и надо найти его решение.
Ниже приведена формулировка основной теоремы, которая позволяет дать чёткие условия применимости. Она носит имя Канторовича.
Теорема Канторовича.
Если существуют такие константы A,B,C, , что:
на [a, b], то есть f(x) ограничена; на [a, b], и Причём длина рассматриваемого отрезка
. Тогда справедливы следующие утверждения:
; погрешность может быть оценена по формуле Из последнего из утверждений теоремы в частности следует квадратичная сходимость метода:
![]()
Тогда ограничения на исходную функцию f(x) будут выглядеть так:
функция должна быть ограничена; функция должна быть гладкой, дважды дифференцируемой; её первая производная f′(x) равномерно отделена от нуля; её вторая производная f′′(x) должна быть равномерно ограничена.Обобщения и модификации
Метод одной касательной
В целях уменьшения числа обращений к значениям производной функции применяют так называемый метод одной касательной.
Формула итераций этого метода имеет вид:

Суть метода заключается в том, чтобы вычислять производную лишь один раз, в точке начального приближения х0, а затем использовать это значение на каждой последующей итерации:

При таком выборе α0 в точке х0 выполнено равенство:

и если отрезок, на котором предполагается наличие корня х* и выбрано начальное приближение х0, достаточно мал, а производная
непрерывна, то значение
будет не сильно отличаться от
и, следовательно, график
пройдёт почти горизонтально, пересекая прямую у=х, что в свою очередь обеспечит быструю сходимость последовательности точек приближений к корню.
Этот метод можно также рассматривать, как модернизацию метода хорд (секущих), где число γ следует выбрать равным
![]()

Рис.6. Иллюстрация последовательных приближений метода одной касательной, применённого к функции
с начальным приближением в точке x0=1,8..
Многомерный случай
Обобщим полученный результат на многомерный случай.
Пускай необходимо найти решение системы:

Выбирая некоторое начальное значение
, последовательные приближения
находят путём решения систем уравнений:
![]()
где
![]()
Применительно к задачам оптимизации
Пусть необходимо найти минимум функции многих переменных
. Эта задача равносильна задаче нахождения нуля градиента
. Применим изложенный выше метод Ньютона:
![]()
где
— гессиан функции
.
В более удобном итеративном виде это выражение выглядит так:
![\vec{x}^{[j+1]}=\vec{x}^{[j]}-H^{-1}(\vec{x}^{[j]})\nabla](/text/80/174/images/image946.gif)
Следует отметить, что в случае квадратичной функции метод Ньютона находит экстремум за одну итерацию.
Нахождение матрицы Гессе связано с большими вычислительными затратами, и зачастую не представляется возможным. В таких случаях альтернативой могут служить квазиньютоновские методы, в которых приближение матрицы Гессе строится в процессе накопления информации о кривизне функции.
Метод Ньютона — Рафсона
Метод Ньютона — Рафсона является улучшением метода Ньютона нахождения экстремума, описанного выше. Основное отличие заключается в том, что на очередной итерации каким-либо из методов одномерной оптимизации выбирается оптимальный шаг:
![\vec{x}^{[j+1]}=\vec{x}^{[j]}-\lambda_j](/text/80/174/images/image947.gif)
где
Для оптимизации вычислений применяют следующее улучшение: вместо того, чтобы на каждой итерации заново вычислять гессиан целевой функции, ограничиваются начальным приближением
и обновляют его лишь раз в т шагов, либо не обновляют вовсе.
Применительно к задачам о наименьших квадратах
На практике часто встречаются задачи, в которых требуется произвести настройку свободных параметров объекта или подогнать математическую модель под реальные данные. В этих случаях появляются задачи о наименьших квадратах:
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 |


