Создание экспресс-метода анализа показателей качества на основе многомерного анализа спектральных данных:

1. Бензиновые фракции

, (д. т.н.)

Дается краткое описание методики построения модели системы «бензиновая фракция» методом многомерного анализа. Исходными данными являлись данные спектроскопии в ближней инфракрасной области. Данная модель использовалась для создания экспресс-метода анализа показателей качества бензиновых фракций. Полученный метод может быть рекомендован для внедрения в практику лабораторного анализа на нефтеперерабатывающих заводах для снижения временных и финансовых затрат.

Развитие современных технологий и внедрение их в производство требует все более совершенных систем контроля, как параметров самих технологических процессов, так и производимой продукции.

Пути контроля качества могут быть различными. Прежде всего, выделяют физические и физико-химические методы анализа. За прошедшие 50-100 лет большое распространение получили последние, обладающие неоспоримыми преимуществами по скорости и возможности автоматизации. Зачастую более точный химический анализ уступает место физико-химическому, поскольку не удовлетворяет требованиям по экспрессности определения необходимых показателей.

Одним из наиболее современных и перспективных методов анализа является спектральный метод. Информативность и быстрота получения результатов позволяет надеяться на его внедрение в лабораторную практику на производственных предприятиях. В то же время, остаётся ряд нерешенных проблем, связанных с необходимостью анализа сложных, многокомпонентных смесей [1].

НЕ нашли? Не то? Что вы ищете?

Одним из методов «расшифровки» спектров смесей, состоящих из сотен, тысяч и десятков тысяч компонентов, с целью предсказания состава и показателей качества является метод многомерного анализа данных (Multivariate Data Analysis) – MDA.

Совмещение физически обоснованного и многократно проверенного метода инфракрасной (ИК) спектроскопии с современным методом анализа многомерных данных представляется авторам перспективным при исследовании продуктов нефтепереработки и нефтехимии – сложных многокомпонентных систем, состоящих (преимущественно) из углеводородов и их производных. Результатом использования вышеназванного метода при анализе спектров различных продуктов нефтепереработки и нефтехимии могут быть модели этих систем, пригодные для использования в качестве базы для экспресс-методик спектрального анализа их показателей качества.

Внедрение этих методик способно многократно сократить время единичного измерения и повысить чёткость контроля оператора над технологическим процессом в целом. Сокращение производства бракованной и низкокачественно продукции является финансовым стимулом для внедрения вышеназванных методов.

Анализ многомерных данных (MDA) - это современный подход к моделированию многомерных (многофакторных) процессов и явлений, основанный на применении проекционных математических методов, позволяющих выделить в больших массивах данных скрытые (латентные) переменные и анализировать связи, существующие в изучаемой системе [2]. Подобный подход известен также под названием хемометрика (chemometrics). Реже используется термин «хемометрия». MDA подход применяется в целом ряде областей: от аналитической химии до анализа изображений.

Основные понятия, которыми оперирует MDA:

X – непосредственно измеряемые переменные (исходный сигнал),

Y – определяемые переменные (свойства системы, которые необходимо найти),

PC (ГК) – Principal Component (главная компонента) – направление наибольшего изменения в пространстве переменных X.

PLS (ПЛС) – Projection on Latent Structures (проекция на латентные структуры) – процесс совместного разложения матрицы X и Y с целью отыскания оптимальных регрессионных соотношений для декомпозиции и последующего предсказания.

Для более подробного ознакомления с хемометрической идеологией и её математическим воплощением авторы рекомендуют литературу [2, 3]. К сожалению, русскоязычные издания редки и неполны. Для полного понимания сути MDA необходимы элементарные представления о матричном анализе.

На первом этапе была проведена оцифровка 555 спектров различных бензиновых фракций, измеренных с помощью БИК-анализатора ФТ-10 фирмы Lumex, и перевод их в матричный формат.

Затем, используя пакет MATLAB компании MathWork, написан ряд алгоритмов, необходимых для проведения дальнейшего анализа. К этим алгоритмам относятся: метод регрессии на главные компоненты (PCR – Principal Component Regression), метод проекции на латентные структуры (PLS), алгоритм предсказания определяемых свойств по заданному спектру, алгоритм поиска ошибки калибровки (SEC – Standard Error of Calibration), алгоритм поиска стандартной ошибки кросс-валидации (SECV – Standard Error of Cross-Validation) , алгоритм поиска стандартной ошибки предсказания (SEP – Standard Error of Prediction) и др.

Стандартная ошибка кросс-валидации (SECV) представляет собой величину, характеризующую предсказательную способность калибровки. Процедура кросс-валидации (перекрестной проверки) заключается в поочередном «выбрасывании» (удалении) одного образца из градуировочной модели и расчете градуировки без этого выброшенного образца с последующим предсказанием его свойств. Расчётная формула:

где – число анализируемых образцов, – результат анализа определяемого показателя качества для i-го образца стандартными методами; – результат предсказания значения определяемого показателя качества для i-го образца по градуировке, построенной без его участия.

Важнейшим вопросом многомерного анализа является вопрос о количестве главных компонент, необходимых для наиболее точного предсказания свойств объектов, не входящих в калибровочную модель. Увеличение количества главных компонент на первом этапе ведёт к уменьшению как величины SEC, так и SECV. При дальнейшем росте числа ГК величина SEC продолжает падать (вплоть до нуля при бесконечно большом числе ГК), а SECV начинает расти. Оптимальным считается число ГК, при котором SECV минимальна. В работе это число составляло от 5 до 9, что соответствует данным, приводимым в литературе по хемометрическому подходу к анализу бензина [4].

На рис. 1 представлена зависимость стандартной ошибки кросс-валидации от числа главных компонент, используемых при разложении, на примере плотности – одного из определяемых свойств. Локальный минимум достигается при 6 ГК.

Рисунок 1. Изменение ошибки кросс-валидации при росте числа главных компонент (на примере анализа плотности)

В результате проведенного анализа показана возможность применения положений MDA к анализу ИК-спектров бензиновых фракций различных процессов. Найдены оптимальные параметры калибровки, и построена модель системы «бензиновая фракция».

Используя полученную модель, создана методика быстрого анализа качества бензиновых фракций на основе спектроскопии в ближнем инфракрасном диапазоне, применимая как в процессе получения компонентов товарного бензина, так и при их смешении. Время измерения всех необходимых свойств сокращено с часов до минут при малой стоимости единичного измерения. Кроме того, для использования полученного метода нет необходимости привлекать высококвалифицированных сотрудников.

Использование созданного метода позволит проводить определение показателей качества бензиновых фракций на заводе с периодичностью раз в час, а не раз в сутки как это имеет место сейчас.

Библиографический список

1.  Заидель спектрального анализа. – М., 1965.

2.  Jackson J. E. A User's Guide to Principal Components. John Wiley and Sons, 1991.

3.  Esbensen K. H., Schönkopf S., Midtgaard T. Multivariate Analysis in Practice. Trondheim: Camo, 1994.

4.  Bohács Gy., Ovádi Z., Salgó A. // J. Near Infrared Spectrosc. No 6. 1998. Р. 341-348.