3. Интерполяция и аппроксимация
3.1. Понятие натурного и вычислительного эксперимента.
Человечество познавало окружающий мир и самого себя в этом мире на основе статистики, которая позволяла ему находить связи между явлениями. Статистика при посредстве человеческого разума породила современную науку – астрономию и математику, физику и генетику.
Поколения астрономов по мере совершенствования приборов и физических представлений о земных законах постепенно могли выявлять законы, по которым живет Солнечная система, хотя до сих пор не могут гарантировать отсутствие неизвестных планет или объяснить происхождение пояса астероидов. Физик XVIII столетия, одержимый некоторой идеей (возникшей явно не на пустом месте), или его последователи могли многочисленными экспериментами установить или опровергнуть ее истинность, хотя и здесь абсолютная истина недостижима – корпускулярная и волновая теория света тому пример. Тем не менее, из наблюдений за страшными молниями и искрами от шерсти ласковой кошки, в итоге проб и ошибок, родилась практически вся современная техника.
Итак, наблюдая и фиксируя какие-то явления, человек решал прямую задачу исследования. Он набирал факты. А далее человеку приходилось решать обратную задачу – воспроизведение закона, которому следовала или следует некоторая система (астрономическая, техническая, экономическая и пр.). Понятно, что по результатам действий системы (часто неполным и искаженными внесистемными факторами) невозможно гарантировать однозначность получаемых выводов при решении обратной задачи.
Тем не менее, человек, если есть возможность, проводит натурный эксперимент, чтобы набрать статистику, которая даст информацию для формулирования закона, которому следует то или иное явление, с целью получения формулы, с помощью которой можно предсказать будущее.
Но не надо забывать, что натурное экспериментальное исследование справедливо только в пределах условий проведенного эксперимента. Иными словами, экспериментальное исследование – тоже модель и поэтому не следует преувеличивать результаты экспериментальных исследований.
Наряду с натурными экспериментами проводятся вычислительные эксперименты. Вычислительный эксперимент приобретает исключительное значение в тех случаях, когда натурные эксперименты и построение физической модели оказываются невозможными.
Проведение вычислительного эксперимента является сложным исследованием и включает в себя несколько этапов:
для исследуемого объекта строится модель, обычно сначала физическая (мысленно, на бумаге), фиксирующая разделение всех действующих в рассматриваемом явлении факторов на главные и второстепенные, которые на данном этапе исследования отбрасываются. Одновременно формулируются допущения и условия применимости модели, границы, в которых будут справедливы полученные результаты. Модель записывается в математических терминах (как правило, в виде дифференциальных или интегро-дифференциальных уравнениях). Очевидно, что создание математической модели проводится специалистами, хорошо знающими данную область естествознания или техники, а также математиками, представляющими себе возможности решения математической задачи. Разрабатывается метод решения сформулированной математической задачи. Эта задача представляется в виде совокупности алгебраических формул, по которым должны вестись вычисления и условия, показывающие последовательность применения этих формул; набор этих формул и условий носит название вычислительного алгоритма. Разрабатываются алгоритм и программа решения задачи на компьютере. Программирование решений определяется теперь не только искусством и опытом исполнителя, а перерастает в самостоятельную науку со своими принципиальными подходами. Проведение расчетов на компьютере. Результат получается в виде некоторой цифровой информации. Точность информации определяется при вычислительном эксперименте достоверностью модели, положенной в основу эксперимента, правильностью алгоритмов и программ (проводятся предварительные «тестовые» испытания). Обработка результатов расчетов, их анализ и выводы. Здесь полученную информацию представляют в наиболее понятном виде, помогающем установить вид зависимостей между входными и выходными параметрами математической модели. Лучше в виде графиков. На этом этапе могут возникнуть необходимость уточнения математической модели (усложнения или, наоборот, упрощения), предложения по созданию упрощенных инженерных способов решения и формул, дающих возможности получить необходимую информацию более простым способом.Решению задач последнего этапа посвящены целые разделы математики, большая часть которых, к сожалению, не изучается студентами в обычных технических и экономических университетах.
3.2. Цели и методы математической обработки результатов вычислительного эксперимента
Целью любого эксперимента является определение качественной и количественной связи между исследуемыми параметрами, либо оценка численного значения какого-либо параметра.
В некоторых случаях вид зависимости между переменными величинами известен по результатам теоретических исследований. Как правило, формулы, выражающие эти зависимости, содержат некоторые постоянные, значения которых и необходимо определить из опыта.
Другим типом задачи является определение неизвестной функциональной связи между переменными величинами на основе данных эксперимента. Такие зависимости называют эмпирическими.
Однозначно определить неизвестную функциональную зависимость между переменными невозможно даже в том случае, если бы результаты эксперимента не имели ошибок. Тем более не следует этого ожидать, имея результаты эксперимента, содержащие известные ошибки, возникающие в процессе вычислений.
Поэтому следует четко понимать, что целью математической обработки результатов вычислительного эксперимента далеко не всегда является нахождение истинного характера зависимости между переменными или абсолютной величины какой-либо неизвестной.
Целью математической обработки чаще всего является представление результатов наблюдений в виде наиболее простой формулы или значения неизвестной с оценкой возможной погрешности ее использования.
Для простоты дальнейшего изложения будем считать, что некоторое явление характеризуется только двумя величинами {Х} и {Y}, связанными между собой некоторой неизвестной функциональной зависимостью. Любую из этих величин с одинаковой степенью можно считать независимой, тогда как другая будет считаться зависимой.
Различают четыре типа зависимостей между переменными:
1)Зависимость между неслучайными переменными, не требующую для своего изучения применения статистических методов;
2) Зависимость случайной переменной y от неслучайных переменных, исследуемую методами регрессионного анализа;
3) Зависимость между случайными переменными y и x, изучаемую методами корреляционного анализа;
4) Зависимость между неслучайными переменными, когда все они содержат ошибки измерения, требующую для своего изучения применения конфлюэнтного анализа.
Вычислительный эксперимент проводится обычно при заданных исходных данных, которые в дальнейшем можно рассматривать в некотором приближении как неслучайные величины.
Результаты же сложного расчета (вычислительного эксперимента), выполненного с помощью, например, метода конечных элементов, в сильнейшей степени зависят от множества факторов, в частности, от ошибок дискретизации и математического представления рассчитываемого объекта, ошибок округления, ошибок усечения, ошибок во входных данных и многих других ошибок, вплоть до ошибок в программировании. Поэтому такие результаты можно рассматривать как уже некие случайные величины.
Поэтому при обработке результатов численного эксперимента чаще всего приходится обращаться к методам регрессионного анализа.
Основу же большинства перечисленных выше методов составляют методы интерполирования и среднеквадратичной аппроксимации.
3.3. Интерполирование.
Интерполирование (интерполяция). Термин происходит от латинского interpolare - «подделывать», «подновлять». Это слово первоначально означало подделку рукописи, т. е. введение в рукописный документ одного или нескольких слов, не находившихся в подлиннике.
Пусть в результате какого-либо сложного эксперимента (в том числе и вычислительного) получена серия данных, которые мы можем представить в виде точек на плоскости в координатах осей x и y. Здесь координаты xi и yi точек считаются соответственно входными и выходными параметрами модели.
Понятно, что можно предположить, что эти точки принадлежат какой-то неизвестной функции. По сути, имеют таблицу значений xi и yi и говорят, что работают с таблично заданной функцией.
Очень часто возникает задача подобрать некоторую простую функцию, которая, во-первых, имела бы в известных точках заданные значения, во-вторых, позволяла находить промежуточные значения функции и в-третьих могла бы показать, как будет изменяться эта функция вне пределов интервала по х, где проводился эксперимент. Понятно, что простая функция вычислялась бы быстрее, проще, и дешевле, нежели проведение эксперимента
Математически получается, что задано некоторое упорядоченное множество вещественных абcцисс х1, х2, ..., хn и связанное с ним множество вещественных ординат у1, у2, ..., уn. Пусть х1< х2< ...< хn и каждое уi есть некоторое вещественное число, отвечающее хi, которое определяется математически или в результате каких-либо наблюдений (см. левый рисунок).
Тогда кривую, которая точно проходит через эти узлы (см. правый рисунок), называют интерполяционной кривой, а точки (xi, yi) - узлами интерполяции.
Задача одномерной интерполяции заключается в построении такой непрерывной функции f, при которой f(хi) ? уi для всех хi, т. е. функция f обязательно должна проходить абсолютно точно через заданные узлы интерполяции. Однако при этом f(xk) должна принимать "разумные" значения для всех xk, лежащих между заданными точками хi. Кроме того, на интерполирующую функцию накладывается еще ряд очевидных ограничений: не иметь особых точек на интервале интерполирования; быть достаточно гладкой; иметь необходимое количество производных и пр.
Интерполяционный многочлен.
Наиболее простое и универсальное представление любой сложной функции, в том числе полученной в результате натурного или численного эксперимента, осуществляется с помощью полинома
![]()
Полиномом в пределе можно описать любую функцию, при наличии достаточного числа значений (точек) этой сложной функции.
Пусть на сегменте [a, b] заданы n + 1 опорных (узловых) точек
. Пусть, кроме того, заданы n + 1 действительных
(например, как значения функции f(x) в узловых точках). Тогда имеем следующую задачу интерполяции.
Найти многочлен
степени не больше n такой, что
для
.
Интерполяцию, повторяем, применяют главным образом тогда, когда относительно f(x) известны только дискретные значения функции y=f{x), и, чтобы вычислить другие её значения между узловыми точками (интерполяция) или за отрезком узловых точек (экстраполяция), ее приближают (заменяют) многочленом
, причем
, где
.
При конкретном числе заданных точек всегда существует только один интерполяционный многочлен, который может быть представлен в различной форме со своим способом нахождения коэффициентов.
Простейшим видом интерполяции является линейная интерполяция, в основе которой лежит аппроксимация кривой на участке между точками (хk, yk) и (xk+1, yk+1) прямой, проходящей через те же точки (см. рисунок). Уравнение прямой можно представить в виде
или в виде![]()
Таким образом, зная два табличных значения yk и yk+1, соответствующих хk и xk+1, с помощью указанных формул можно найти значение функции у при любом значении х в интервале (xk, xk+1). Обычно полагают, что, используя большее число соседних точек и аппроксимируя истинную кривую более сложной линией, можно уточнить полученный результат.
Далее излагаются методы нахождения единственного многочлена n-й степени Pn(x) аппроксимирующего функцию f(x) кривой, проходящей
через все n+1 заданные в таблице точки (хi, yi), где i=0, 1, . . ., п. В этом случае говорят, что многочлен удовлетворяет условиям
Pn(xi) при i=0, 1, ..., п.
Методы отыскания такого многочлена делятся на три группы: методы Лагранжа, разностные методы и итерационные методы.
Мы познакомимся только с первым методом.
Форма Лагранжа:
, где
.
Нетрудно видеть, что
при
и, следовательно, ![]()
Пример 2. Нахождение интерполяционного многочлена.
Пусть x1=4, x2=6, x3=8, x4=10, y1=1, y2=3, y3=8, y4=20.

Форма Ньютона:
, где
при
,
а
, где
,
при
.
Выражением
называется разделенной разностью.
Для определения многочлена в форме Ньютона применяют разностную схему или схему спуска:
j |
|
|
|
|
|
0 |
|
| |||
| |||||
1 |
|
|
| ||
|
| ||||
2 |
|
|
| ||
|
| ||||
3 |
|
|
|
Коэффициенты
многочлена Ньютона равны числам в верхнем спускающемся ряду (выделены цветом).
Для примера 1 разностная схема будет следующей:
j |
|
|
|
|
|
0 | 4 |
| |||
| |||||
1 | 6 | 3 |
| ||
|
| ||||
2 | 8 | 8 |
| ||
6 | |||||
3 | 10 | 20 |

Тогда многочлен Ньютона будет:
![]()
Вывод из вышесказанного следующий: если даны n+1 табличных значений неизвестной функции, всегда можно представить эту функцию приближённо полиномом n-ой степени. Эта операция называется интерполяцией. При этом полином будет проходить через заданные табличными значениями точки - точно, а представлять функцию между точками – неточно.
Как часто встречаются задачи интерполяции?
Задачи интерполирования и экстраполирования возникают в следующих случаях (список не полный):
если решаются прогнозные задачи (экстраполирование); практически всегда при решении экономических задач (интерполирование и экстраполирование); при обработке данных, полученных в экспериментах (интерполирование); всегда при решении задач на компьютерах (интерполирование и экстраполирование); при задании функции графиком или таблицей (интерполирование и экстраполирование); во всех остальных не описанных здесь случаях, если это необходимо.Но интерполяцию можно считать только частным случаем более общего понятия - аппроксимации.
4.4. Аппроксимация.
Термин аппроксимация происходит от латинского approximo - «приближаюсь», буквальное значение – «приближение». Из самого названия следует решаемая аппроксимацией задача: представить приближённо таблично заданную функцию.
Если аппроксимирующая функция точно проходит через заданные экспериментальные точки, то это задача интерполяции, если нет, то это уже задача аппроксимации.
Ниже на рисунке показана одна из возможных аппроксимирующих функций.
Самым распространенным видом аппроксимации является, когда
данные представляют одной функцией, применимой во всем диапазоне табличных данных, при этом не обязательно проходящей через все точки.
Такой подход называется подгонкой кривой, которую стремятся провести так, чтобы её отклонения от табличных данных были минимальными.
Эта функцию удовлетворяют определенным критериям, например, наиболее известному - минимальному среднеквадратичному отклонению значений аппроксимирующей функции при xi от значений yi заданных точек. Существуют и другие критерии.
Метод наименьших квадратов.
В методе наименьших квадратов обычно стремятся свести к минимуму сумму квадратов разностей между значениями функции, определяемыми выбранной кривой и таблицей.
Пусть в таблице задана n+1 точка
и требуется найти аппроксимирующую кривую
в диапазоне
. В этом случае погрешность в каждой табличной точке будет равна
.
Тогда сумма погрешностей определяется выражением
.
Обычно функцию
выбирают в виде линейной комбинации подходящих функций
.
Условие минимума Е определяется уравнениями
.
Поскольку
, то это условие эквивалентно системе уравнений

Эти k уравнений, очевидно, можно представить в виде
.
Так как элементы матрицы в левой части и вектора (столбца) правой определяются табличными данными, то выписанная система k линейных уравнений с k неизвестными может быть решена.
Можно выбрать любую функцию g(x), лишь бы она была линейной относительно своих коэффициентов.
Фактический выбор функции должен осуществляться с учетом специфики табличных данных, под которой понимается их периодичность, экспоненциальный или логарифмический характер, свойства симметрии и наличие асимптотики.
Иногда таблицу разбивают на несколько частей и подбирают отдельную аппроксимирующую кривую для каждой части, однако это надо делать осмотрительно. Такой подход оправдан в тех случаях, когда есть основания полагать, что аппроксимируемые данные соответствуют разным физическим состояниям системы. Примерами могут служить переходы конструкции от устойчивого состояния к неустойчивому, переходы от дозвукового течения к сверхзвуковому или от ламинарного к турбулентному. Пользуясь приближенной формулой, не следует выходить за пределы интервала, в котором она справедлива.


