Лабораторная работа 7
Определение уравнения нелинейной регрессии
При проведении регрессионного анализа характеристикой достоверности аппроксимации служит коэффициент корреляции 0 £ R2 £ 1. Чем ближе R2 к единице, тем ближе аппроксимирующая кривая к экспериментальной зависимости. Выбор характера аппроксимирующей функции ‑ процесс творческий, основанный на априорном знании исследуемого процесса и анализе экспериментальной зависимости. Не всегда с первого раза удается получить достаточную достоверность аппроксимации.
Если при проведении линейного регрессионного анализа получился недостаточно высокий коэффициент корреляции, это свидетельствует, прежде всего, о том, что неправильно выбран вид уравнения регрессии. Очевидно, экспериментальная зависимость имеет более сложный характер, чем линейный.
В Excel имеется функция ЛГРФПРИБЛ( ), обеспечивающая получение уравнения регрессии в виде Y = b×a X. Однако такой вид уравнения регрессии также не всегда дает достаточно высокую степень достоверности аппроксимации. В этом случае следует определять уравнение регрессии в форме пользователя. Это может быть логарифмическая, экспоненциальная, полиномиальная аппроксимации.
Как ни странно, но параметры всех этих нелинейных уравнений регрессии определяются при помощи функции ЛИНЕЙН( ).
В настоящей работе необходимо определить параметры уравнения нелинейной регрессии в форме Y = b×a X, а также R2 для этого уравнения. Затем, независимо от получившегося R2, подобрать другой вид зависимости и определить параметры этого уравнения регрессии.
Последовательность выполнения работы:
1. Ввести исходные данные.
2. Построить диаграмму функции Y = F(X).
3. При помощи функции ЛГРФПРИБЛ( ) определить параметры и R2 уравнения регрессии в виде Y = b×aX.
4. Построить на диаграмме линии тренда различного вида и определить по ним вид аппроксимирующей кривой, наилучшим образом описывающий экспериментальную зависимость.
5. Провести регрессионный анализ, определить параметры уравнения регрессии в виде, выбранном по линиям тренда, используя функцию ЛИНЕЙН( ).
6. Сравнить полученные результаты и сделать выводы.
Исходные данные
Таблица 7.1
Вар | Независимая переменная Х | |||||||||
1 | 1,00 | 1,23 | 1,51 | 1,86 | 2,29 | 2,82 | 3,46 | 4,26 | 5,24 | 6,44 |
2 | -2,00 | -1,80 | -1,62 | -1,46 | -1,31 | -1,18 | -1,06 | -0,96 | -0,86 | -0,77 |
3 | 1,25 | 2,40 | 3,55 | 4,70 | 5,85 | 7,00 | 8,15 | 9,30 | 10,45 | 11,60 |
4 | -1,23 | 0,06 | 1,35 | 2,64 | 3,93 | 5,22 | 6,51 | 7,80 | 9,09 | 10,38 |
5 | -10,00 | -9,00 | -8,10 | -7,29 | -6,56 | -5,90 | -5,31 | -4,78 | -4,30 | -3,87 |
Таблица 7.2
Вар. | Зависимая переменная Y | |||||||||
1 | 0,32 | 0,23 | 0,44 | 0,57 | 0,91 | 1,47 | 2,92 | 6,31 | 16,98 | 56,56 |
2 | 0,40 | 0,55 | 0,51 | 0,68 | 0,56 | 0,76 | 0,67 | 0,80 | 0,71 | 0,86 |
3 | 5,24 | 5,42 | 8,50 | 10,28 | 16,27 | 18,26 | 27,10 | 32,88 | 46,89 | 59,99 |
4 | 1,93 | 1,27 | 2,82 | 2,15 | 4,45 | 4,82 | 7,93 | 8,81 | 13,35 | 16,62 |
5 | 0,09 | 0,12 | 0,19 | 0,14 | 0,35 | 0,25 | 0,42 | 0,43 | 0,66 | 0,65 |
Выполнение работы в среде Excel
Как и в предыдущей работе, исходные данные вносятся в виде столбцов и для независимой переменной Х определяются минимальное и максимальное значения. Строится график экспериментальной зависимости.
Затем выделяется массив, состоящий из пяти строк по вертикали и двух (n+1) столбцов по горизонтали. В массив вводится формула массива ЛГРФПРИБЛ(блок значений Y; блок значений X; ИСТИНА; ИСТИНА). Формула массива реализуется после нажатия комбинации клавиш Shift + Ctrl + Enter.
Результаты вычислений представлены в выделенном массиве. Значения величин, используемых нами в дальнейшем, такое же, как в предыдущей работе. Так же, как в предыдущей работе, можно определить достоверность полученной величины R2.
Для построения линий тренда следует скопировать диаграмму экспериментальной зависимости столько раз, сколько разновидностей линий тренда будет построено. Лучше строить на каждой диаграмме одну линию тренда, чтобы не загромождать диаграмму. Не забудьте вывести на диаграмму уравнение аппроксимирующей функции и достоверность аппроксимации R2.
Сравнив величины R2, выберем вид уравнения регрессии, имеющий максимальное значение R2. Далее будем определять параметры уравнения регрессии такого вида при помощи функции ЛИНЕЙН( ).
Предположим, что максимальное значение R2 получено для полинома второй степени. Следовательно, будем определять параметры квадратного уравнения вида Y = a1×X2+a2×X+b. Можно представить, что это линейное уравнение с двумя неизвестными, одно из которых ‑ Х2, второе ‑ Х.
Прежде чем вводить формулу массива ЛИНЕЙН( ), преобразуем блок исходных данных. Чтобы функцию Y = F(X) можно было рассматривать как функцию двух переменных, добавим в исходные данные столбец Х2.
Далее следует выделить массив размером пять строк по вертикали и три (n+1) столбца по горизонтали. При введении аргументов функции ЛИНЕЙН следует в качестве блока значений Х выделить столбцы Х и Х2.
Результаты вычислений будут представлены в выделенном блоке. Смысл полученных числовых значений приведен в табл.7.3.
Таблица 7.3
a2 | a1 | b |
s [a2] | s [a1] | s [b] |
R2 | ||
Fрасч | df | |
Далее необходимо определить достоверность величины R2.
В случае, если R2 имеет недостаточную величину, следует использовать для аппроксимации полином третьей степени.
Следует помнить, что процесс моделирования ‑ постоянный компромисс между сложностью математической модели и точностью описания ею моделируемого процесса. Чем выше степень полинома, тем лучше он будет описывать экспериментальную зависимость. Однако получение математической модели ‑ не самоцель процесса моделирования. Далее эта модель будет использоваться для исследования моделируемого процесса. В любом случае с уравнением будут производиться некие математические операции, и чем модель сложнее, тем сложнее будет дальнейшая работа с ней. Об этом следует помнить при выборе вида аппроксимирующей функции.
Рассмотрим случай, когда уравнение регрессии представляет собой логарифмическую функцию вида Y = a×LN(X) + b. В этом случае в качестве аргументов функции ЛИНЕЙН следует использовать блок значений Y и блок значений LN(X). Значения LN(X) необходимо предварительно подсчитать.
Аналогично, при использовании в качестве уравнения регрессии функции вида Y = a×EXP(b×X) аргументами функции ЛИНЕЙН будут блок значений Y и блок значений EXP(X).
Контрольные вопросы
1. В каком виде может быть получено уравнение нелинейной регрессии?
2. Какие функции Excel служат для проведения нелинейной регрессии?
Библиографический список
Курицкий оптимальных решений средствами Excel 7.0. – BHV‑Санкт-Петербург, 1997, – С.342–349.
Пример оформления работы 7 представлен в приложении.


