УДК 681.3:543.253
МЕТОД ОЦЕНКИ ОБОБЩАЮЩЕЙ СПОСОБНОСТИ АДАПТИВНЫХ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ В АВТОМАТИЗИРОВАННЫХ СИСТЕМАХ ОПРЕДЕЛЕНИЯ МАССОВОЙ ДОЛИ КОМПОНЕНТОВ СПЛАВА
, ,
Южный научный центр РАН, г. Ростов на Дону, пр. Чехова, 41, Sedov_A. *****@***ru;
Южно-Российский государственный технический университет (Новочеркасский политехнический институт), г. Новочеркасск, ул. Просвещения, 192, *****@***ru
Рассматривается универсальный метод определения обобщающей способности адаптивной математической модели на основе анализа полной дифференциальной чувствительности. Под обобщающей способностью понимается свойство модели давать адекватные результаты не только для обучающей выборки, но и для любых входных данных из рабочего диапазона. Исследовано применение метода для систем определения массовых долей компонентов сплава, с нечеткими, нейронными и компонентными моделями.
Ключевые слова: адаптивная идентификация, обобщающая способность, дифференциальная чувствительность, обучаемые математические модели.
Большинство современных адаптивных компьютерных систем контроля, управления и измерения реализуют принцип настраиваемой математической модели, позволяющий уточнить процесс измерения и косвенного расчета параметров объекта контроля. Важным этапом идентификации и использования подобных моделей является оценка обобщающей способности, то есть свойства модели давать адекватные результаты не только для обучающей выборки, но и для любых входных данных из рабочего диапазона.
Особенностью предлагаемого метода оценки обобщающей способности является использование для этого полной дифференциальной чувствительности. Это позволило адаптивно определять адекватность настройки параметров модели, в частности, определения массовой доли компонент в металлических сплавах, и не учитывать при этом реакцию модели на грубые ошибки измерения при оценке обобщающей способности именно за счет использования характеристики чувствительности модели, а не погрешности аппроксимации, как используется в [1].
Оценка обобщающей способности использовалась при анализе следующих математических моделей для количественного определения массовой доли компонентов сплава по признаковым переменным хронопотенциограмм образца:
1. Модели аппроксимации искомой зависимости массовой доли алгебраическими функциями по методу наименьших квадратов.
2. Моделей искусственных нейронных сетей (ИНС) прямого распространения и с радиальными базисными функциями (РБФ).
3. Модели нечеткого вывода.
Сопоставление перечисленных выше моделей производилась, помимо обобщающей способности, по следующим параметрам:
1. Приведенная погрешность определения массовой доли сплава:
,
где
- истинное значение массовой доли из обучающей выборки;
- вычисленное значение.
2. Чувствительность результата
к флуктуациям входных переменных. Она определяется по каждой признаковой переменной, как отношение относительных приращений расчетного значения массовой доли
и признаковой переменной
:
![]()
Указанная чувствительность характеризует устойчивость работы модели к флуктуациям в хронопотенциограммах, не вызванных изменением состава сплава. Исследования показали, что по данным для разных составляющих сплавов оптимальное значение чувствительности определяется условием: ![]()
Обобщающая способность модели в рабочем диапазоне входных значений определяется следующим образом. Под рабочим диапазоном понимается диапазон значений входных переменных в обучающей выборке. Для этого диапазона определяют максимальное и минимальное расчетные значения массовой доли
. В случае, если эти значения находятся в пределах значений массовой доли
из обучающей выборки, то определяется показатель обобщающей способности модели
. Основные этапы определения обобщающей способности:
а) вычисляются отклики модели
на тестовую последовательность входных образов вида:
![]()
где
– количество образов в тестовой последовательности;
;
– номер признаковых переменных;
– совокупность из
образов обучающей выборки упорядочивается по величине модуля вектора координат каждого образа;
– шаг по
-ой признаковой переменной;
б) по значениям
определяется вектор полных дифференциальных чувствительностей:
![]()
где
– размерность признакового пространства;
–
-я признаковая переменная;
– отклик на
-й образ тестовой последовательности;
- оценка первой частной производной
по
в точке
[2];
в) по графику
(рис.1) полной дифференциальной чувствительности определяют график выборочной полной дифференциальной чувствительности
. Для этого в векторе
выделяются значения
, как наиболее близкие к значениям массовой доли
из обучающей выборки и соответствующие им значения
;
г)
![]() |
полученная зависимость
Если модель адекватно описывает искомую зависимость массовой доли от признаковых переменных
, что определяет его обобщающую способность, то его чувствительность к входным переменным, для оценки которой использована полная дифференциальная чувствительность, будет сохранять свой характер при любых значениях
из рабочего диапазона. Следовательно, при значениях
, отличающихся от
из обучающей выборки, полная дифференциальная чувствительность
и выборочная полная дифференциальная чувствительность
также будут минимально отличаться.
Исходя из этого, показатель обобщающей способности
определяется как величина обратная площади фигуры
(рис. 1), ограниченной кривыми
и
:

Описанный выше алгоритм определения обобщающей способности удобно использовать для оценки качества адаптивной настройки модели непосредственно в реальном масштабе времени.
Для приведенных моделей было проведено сопоставление с использованием перечисленных параметров качества. Предложенный показатель обобщающей способности позволил выделить как наиболее эффективную модель ИНС. Хотя по иным показателям данная модель была близка к сети на основе РБФ. Данное обстоятельство было подтверждено и при непосредственном использовании моделей в составе работающих систем идентификации. Таким образом, была подтверждена обоснованность и эффективность использования предложенного показателя обобщающей способности.
Литература
1. Coupling fast variable selection methods to neural network-based classifiers: Application to multisensor systems / Gualdrón O., Llobet E., Brezmes J., Vilanova X., Correig X.// Sensors and Actuators B: Chemical. – 2006, vol. 114, iss. 1, 30 march, p. 522–529.
2. Машинные методы анализа и проектирования электронных схем: пер с англ. / - М.: Радио и связь, 1988, - 560 с.
3. . Кубические сглаживающие сплайны // Матем. Моделирование. – 1990. – Т.2, №8 с. 112–118.
Method of an estimation of generalizing ability of adaptive mathematical models in the automated systems of definition of a mass fraction of components of an alloy
A. V. Sedov, D. A. Onyshko, S. M. Lipkin, M. S. Lipkin
Southern Scientific Center of Russian Academy of Sciences,
South-Russian state technical university (Novocherkassk polytechnical institute)
The method of definition of generalizing ability of adaptive mathematical model in the automated systems on the basis of the analysis of full differential sensitivity is considered. Generalizing ability thus is understood as ability of model to yield adequate results not only for the examples participated during training, but also for any data from a working range.
Keywords: adaptive identification, generalizing ability, differential sensitivity, trained mathematical models



