Создание экспресс-методов анализа продуктов нефтепереработки и нефтехимии на основе колебательной спектроскопии тема автореферата и диссертации по химии, 02.00.13 ВАК РФ
Балабин, Роман Михайлович
АВТОР
|
||||
кандидата технических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
2013
ГОД ЗАЩИТЫ
|
|
02.00.13
КОД ВАК РФ
|
||
|
На правах рукописи
Балабин Роман Михайлович
Создание экспресс-методов анализа продуктов
нефтепереработки и нефтехимии на основе колебательной
спектроскопии
Специальность 02.00.13 - «Нефтехимия»
АВТОРЕФЕРАТ 1 4 №
диссертации на соискание ученой степени кандидата технических наук
005540432
Москва - 2013
005540432
Работа выполнена в Российском Государственном университете нефти и газа имени И.М. Губкина на кафедре органической химии и химии нефти
Доктор технических наук, профессор кафедры органической химии и химии нефти РГУ нефти и газа имени И.М. Губкина
Сафиева Равняя Загидулловна
1. Доктор химических наук, профессор. Главный научный сотрудник Института нефтехимического синтеза РАН имени A.B. Топчиева
Гюльмалиев Агаджан Мирза оглы
2. Доктор химических наук, профессор кафедры общей и неорганической химии РГУ нефти и газа имени И.М. Губкина
Локтев Алексей Сергеевич
Ведущая организация: ФГБОУ ВПО «Московский
государственный университет тонких химических технологий имени М.В. Ломоносова» (МИТХТ)
Защита диссертации состоится «19» декабря 2013 года в_в аудитории 541
на заседании диссертационного совета Д212.200.04 при Российском государственном университете нефти и газа имени И.М. Губкина по адресу: 119991, г. Москва, Ленинский проспект, д. 65.
С диссертацией можно ознакомиться в библиотеке Российского Государственного университета нефти и газа имени И.М. Губкина
Автореферат разослан «18» ноября 2013 года
Научный руководитель:
Официальные оппоненты:
Ученый секретарь диссертационного совета кандидат технических наук
Л.Ф. Давлетшина
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность проблемы
Интенсивное воздействие человека на окружающую среду приводит на сегодняшний день к повсеместному ужесточению экологических норм и правил. Нефть и газ - основные источники энергии человечества сегодня -являются в тоже самое время, к сожалению, и одними из основных источников загрязнения атмосферы, почвы и воды. Очевидно, что ужесточение норм и стандартов в нефтяной и газовой промышленностях невозможно без более тщательного и всестороннего контроля как самих производственных процессов, так и выпускаемой ими продукции. В связи с этим становятся актуальными быстрые, точные, надежные, информативные и недорогие методы анализа состава и качества нефтяных систем.
Внедрение высокоскоростных экспресс-методов анализа состава и качества продуктов нефтепереработки и нефтехимии способно повысить эффективность использования сырья и энергоресурсов (например, за счет снижения доли отходов производства), уменьшить долю бракованной и низкокачественной продукции, оптимизировать качество готовой продукции (к примеру, повысить октановое число товарного бензина при мониторинге процесса компаундирования в режиме реального времени) и тем самым минимизировать воздействие на окружающую среду при производстве необходимой человечеству продукции. При этом именно спектроскопические методы являются наиболее перспективными, поскольку позволяют получить полную информацию о химическом составе и дисперсном состоянии нефтяных систем. В связи с этим актуальной задачей является создание методов экспресс-анализа нефтяных систем на основе колебательной спектроскопии, позволяющих перейти к непрерывному (поточному) контролю качества продукции.
Цель работы: разработка высокоточных экспресс-методов анализа продуктов нефтепереработки и нефтехимии (товарного бензина и его фракций, дизельного топлива), а также биотоплив (спирто-бензиновых композиций,
биодизельного топлива) на основе колебательной спектроскопии в ближней инфракрасной (БИК) области с использованием современных методов машинного обучения, включающих в себя нейронные сети, машины опорных векторов, генетические алгоритмы и т.д.
Основные задачи исследований:
- анализ существующих экспресс-методов контроля качества сырья и продукции нефтяного происхождения, выявление их основных преимуществ и недостатков;
- сравнение различных хемометрических методов анализа спектральных данных в ближней ИК области и обоснование выбора оптимального подхода для нефтяных систем;
- выявление основных закономерностей влияния физико-химических свойств и группового химического состава нефтяных систем на точность и надежность получаемых многомерных калибровочных моделей;
исследование влияния спектрального диапазона на точность многомерных калибровочных моделей, подбор оптимальных длин волн.
Научная новизна:
1. Показана применимость ближней инфракрасной спектроскопии (совместно с наиболее современными методами анализа спектральных данных) для определения параметров состава и качества широкого спектра нефтяных систем: от бензина до растворов нефтяных макромолекул, включающих асфальтены. Показано систематическое изменение точности прогноза от сложности исследуемой системы.
2. Проведено широкое сравнение методов многомерного анализа для решения задач по созданию высокоточных экспресс-методов анализа состава и качества нефтяных систем. Выбраны оптимальные подходы к анализу спектральных и референтных данных.
3. Показано превосходство регрессионных методов на основе опорных векторов над нейронными сетями для анализа свойств и показателей качества нефтяных систем и топлив.
4. Рассчитаны оптимальные спектральные диапазоны в ближней ИК области, наиболее подходящие для построения калибровочных моделей нефтяных систем. Проведено сравнение методов выбора оптимальных длин волн.
5. Предложен метод учета нелинейности оптического отклика в сложных многокомпонентных системах нефтяного происхождения. Показано превосходство нелинейных калибровочных методов над классическими линейными.
Практическая ценность и реализация в промышленности
1. Разработанный способ экспресс-анализа товарного бензина и его фракций позволяет всего за несколько минут получить информацию о плотности топлива, его фракционном составе (ТНК, температура выкипания 10% об., температура выкипания 50% об., температура выкипания 90% об., ТКК) и доле бензола, используя лишь один БИК спектр.
2. Разработанный способ экспресс-анализа дизельного топлива позволяет получить информацию о содержании в нем серы, используя исключительно данные БИК спектроскопии.
3. Разработанный способ экспресс-анализа спирто-бензиновых композиций (этанол-бензиновых смесей) позволяет получить информацию об их плотности и содержании в них спирта.
4. Разработанный способ экспресс-анализа биодизельного топлива (многоком-понентной смеси, преимущественно состоящей из моноалкиловых эфиров) позволяет получить информацию о его плотность, вязкость, а также измерить долю спирта и воды в химической системе, используя лишь один БИК спектр.
5. Подобранные оптимальные спектральные диапазоны позволяют сократить время единичного оптического измерения, а в ряде случаев и уменьшить стоимость необходимого оборудования.
з
Апробация работы
Основные положения диссертационной работы докладывались и обсуждались на VI Всероссийской студенческой научно-практической конференции «Химия и химическая технология в XXI веке» (г. Томск, 2005 г.); Международной конференции молодых учёных по фундаментальным наукам «Ломоносов-2005» (г. Москва, 2005 г.); Всероссийской конференции с международным участием «Математика, ее приложения и математическое образование» (г. Улан-Удэ, 2005 г.); Четвертой международной конференции молодых ученых и специалистов «0птика-2005» (г. Санкт-Петербург, 2005 г.); Международной конференции молодых учёных по фундаментальным наукам «Ломоносов-2006» (г. Москва, 2006 г.); 60-ой Межвузовской студенческой научной конференции «Нефть и газ - 2006» (г. Москва, 2006 г.); Международной конференции молодых учёных по фундаментальным наукам «Ломоносов-2007» (г. Москва, 2007 г.); 61-ой Межвузовской студенческой научной конференции «Нефть и газ - 2007»; Международной конференции «Physical Chemistry of Interfaces and Nanomaterials X» (Сан Диего, США, 2011 г.)
Публикации
По материалам диссертации опубликовано 7 статей в научно-технических журналах, включенных в перечень ВАК, и 11 тезисов научных докладов.
Структура и объем работы
Диссертационная работа включает введение, 5 глав, основные выводы, список литературы из 169 наименований.
Общий объем работы - 114 страниц машинописного текста, в том числе 12 рисунков и 11 таблиц.
СОДЕРЖАНИЕ РАБОТЫ
Во введении к диссертации обоснована актуальность темы диссертационной работы, сформулированы цели и задачи исследований, представлена научная новизна и практическая значимость работы.
Состав Г—Л
Спектр
Спектр
Свойство
Состав
Свойство
Рис. 1. Иллюстрация взаимосвязи «спектр-свойство»
В первой главе вводится терминология и расшифровываются основные сокращения, используемые в основном тексте. Дается общая характеристика экспресс-методов анализа состава и качества химических систем; обсуждается связь «спектр-свойство» (рис. 1). Несмотря на то, что для многих нефтяных систем можно подобрать «информативный» спектральный диапазон, извлечение из него информации о свойствах и показателях качества является нетривиальной задачей, требующей специального подхода. Метод ближней инфракрасной (БИК) спектроскопии рассматривается как высокоперспективная методика для анализа промышленных продуктов. Дается общее представление о теории нормальных колебаний молекулы, уравнении Шредингера в приближении Борна-Опенгеймера (Н1 Ч'у = Ех Ч;у), вводится понятие о естественных и нормальных координатах, дается решение квантовомеханический задачи о гармоническом осцилляторе, описываются правила отбора для колебательных переходов (Ду< = 1) и их типы, вводится важнейшее в БИК спектроскопии понятие об обертоне. Здесь приводится описание групповых (характеристических) частот, силового поля молекулы и анализ неизвестного химического соединения. Рассматриваются закономерности, лежащие в основе количественного анализа смесей, закон
Бугера-Ламберта-Бера (Б = —= Ь1с), включая подробное рассмотрение ближнего ИК диапазона, его места в современной колебательной
спектроскопии, преимуществ и недостатков с точки зрения анализа нефтяных систем.
Вводится понятие о теоретическом и статистическом подходах к анализу спектральных данных, отмечается, что среди многочисленных попыток применения традиционного анализа спектральных данных в нефтяной отрасли можно найти несколько удачных работ. В то же время, не стоит переоценивать эти результаты, поскольку (несмотря на отдельные успехи) в общем случае подобный подход не применим. Традиционные анализ спектров и соответствующих референтных данных можно рекомендовать лишь на первом этапе обработки. Это позволяет во многих случаях лучше «понять» экспериментальные данные, выделить важные корреляции и т.п.
В случае неприменимости традиционного анализа выход может быть найден путем применения статистического анализа спектральных данных. В этом случае нет необходимости в наличии полных и точных сведений о составе и структуре исследуемой системе. Анализ выполняется на основе статистической аналогии между известными и предсказываемыми величинами.
Кратко рассматриваются многомерные методы анализа спектральных данных и те алгоритмы, которые были использованы в данной диссертации при анализе ближних инфракрасных (БИК) спектров ряда нефтепродуктов. Основное внимание уделено идеям, лежащим в основах тех или иных методов.
Далее в тексте обсуждаются традиционных методы регрессии: линейная и нелинейная регрессия, множественная линейная регрессия: = = ЕГ а1с1 = асТ _ а также современные методы многомерного
анализа спектральных и референтных данных анализ, дается определение хемометрики как «[■■•] химической дисциплины, применяющей математические, статистические и иные методы, основанные на формальной логике, для построения (или отбора) оптимальных методов измерения (и планирования эксперимента), а также для извлечения наиболее важной информации из экспериментальных данных. Далее приведены примеры применения ИК спектроскопии в химии и химической технологии.
Завершается глава рассмотрением ряда случаев применения БИК спектроскопии в аналитической химии и химии нефти: анализа бензина и спирто-бензиновых композиций, дизельного и биодизельного топлив, нефти, керосина, мазута, смол пиролиза и даже водо-нефтяных эмульсий.
Во второй главе приведены основные характеристики объектов исследования (табл. 1), которые включают в себя:
1. бензины (95 образцов; ОАО «ОрскНефтеСинтез» и ОАО «КиришиНефтеоргСинтез»),
2. образцы дизельного топлива (125 образцов; ОАО «Астраханьгазпром»)
3. спирто-бензиновые композиции (117 образцов)
4. растворы нефтяных макромолекул (асфальтенов, смол, и парафинов) в толуоле (120 образцов)
5. растворы нефтяных смол в бензоле (105 образцов)
6. биодизельное топливо (612 образцов; «Yugrostexport», «Biosam», «Sokhna Biodiesel Co.»)
Приведено описание получения нефтяных макромолекул путем осаждения (асфальтены, парафины) и адсорбции на силикагеле (смолы). Дана процедура спектральных измерений исследуемых образцов (а) в ближнем инфракрасном диапазоне свыше 8000 см"1 с использованием инфракрасного Фурье-анализатора «ИНФРАЛЮМ ФТ-10» (Люмэкс, РФ) и (б) ниже 8000 см"1 с использованием МРА Multi Purpose FT-NIR Analyzer (Брукер, Германия).
Приведено описание следующих методов обработки спектральных и референтных данных:
1. предварительная обработка спектральных данных, используя вторую производную (полученную с помощью фильтров Савицкого-Голая), с последующим вычитанием среднего и ортогональной коррекцией сигнала;
2. оценка эффективности моделей с использованием среднеквадратичной ошибки предсказания, полученная на независимом тестовом наборе;
3. оптимизация (гипер)параметров моделей с использованием среднеквадратичной ошибки при перекрестной проверки (кросс-валидации)
Таблица 1. Характеристика исследованных образцов: тип и свойства объекта, количество образцов в выборке, диапазон изменения исследуемого параметра, погрешность референтного (стандартного) метода, и спектральный диапазон.
Нефтяная система Свойство Ед. изм. Кол-во образцо в Диапазон Погрешность референтного метода Спектр, диап. (см"1)
Мин. Макс. Макс. Мин.
Бензин Плотность при 20 °С кг м'3 95 640 800 0,5 14000 8000
ТНК °С 95 35 59 1-5 14000 8000
Темп, выкипания 10% об. (Т10) °С 95 58 117 1-5 14000 8000
Темп, выкипания 50% об. (Т50) °С 95 93 128 1-5 14000 8000
Темп, выкипания 90% об. (Т90) °С 95 121 175 1-5 14000 8000
ТКК °С 95 178 205 1-5 14000 8000
Доля бензола % масс. 57 0 10 0,10-0,25 13500 8500
Биотопливо: этанол-бензиновая композиция Плотность при 20 °С кг м-3 117 672 785 0,5 13500 8500
Доля этанола % масс. 75 0 15 0,05 13500 8500
Дизельное топливо Общее содержание серы ррш 125 303 5100 2-20 11000 4000
Нефтяные макромолекулы Содержание асфальтенов % масс. 120 0 10 0,01 14000 8000
Содержание смол % масс. 120 0 30 0,01 14000 8000
Содержание парафинов % масс. 120 0 10 0,01 14000 8000
Биодизельное топливо Плотность при 20 °С кг м'3 612 (103+509) 858 928 0,05-0,10 9000 4500
Вязкость MM¿ с"1 612 2,8 9,2 -1% 9000 4500
Доля метанола ррш 612 159 2200 - 9000 4500
Содержание ррш 612 101 1513 5-10 9000 4500
воды
Растворы нефтяных смол Концентрация смол мг л*' 105 0 6000 1,1 13000 9000
4. выбор переменных и сокращение размерности при использовании метода главных компонент (МГК) и метода проекций на латентные структуры, а также с использованием поэтапной множественной линейной регрессии {англ. stepwise multiple linear regression, MLR-step), интервальной версии метода проекции на латентные структуры (англ. interval partial least squares regression, iPLS), обратной версии iPLS (англ. backward iPLS, BiPLS), прямой версии iPLS (англ. forward iPLS, FiPLS), метода проекции на латентные структуры с использованием скользящего окна {англ. moving window partial least squares
Таблица 2. Характеристики инфракрасного анализатора «ИнфраЛЮМ ФТ-10»
Характеристика Единица измерения Значение
Производительность (прибл.) изм./ч 20
Объем кюветы см3 4-40
Отклонение3 на частоте 8700" см"' % 0,1
Отклонение3 на частоте 100006 см"' % 0,1
Отклонение" на частоте 124006 см"' % 0,1
Максимальная погрешность измерения волновых чисел см"' 1,0
Рабочий спектральный диапазон см"' 8600-12500
Разрешение см"' 1,2,4, 8,16
Уровень положительного и отрицательного псевдорассеянного света, вызванный нелинейностью (Ьотогтписмппй системы % 0,25
Уровень шумов" на частоте 8700 см"' % 0,6
Уровень шумов" на частоте 10000 см"1 % 0,1
Уровень шумов" на частоте 12400 см"' % 0,6
Габаритные размеры мм 580x515x295
Вес кг 37
Потребляемая мощность Вт 160
а Линии 100% пропускания от номинального значения. 6 Среднее по интервалу ±100 см'1. "Линии 100% пропускания.
regression, MWPLS), а также ряда его модификаций (англ. modified/changeable size moving window partial least squares, CSMWPLS/MCSMWPLSR; англ. searching combination moving window partial least squares, SCMWPLS), алгоритма последовательный проекций (англ. successive projections algorithm, SPA), метода удаления неинформативных переменных (англ. uninformative variable elimination, UVE; включая комбинацию UVE-SPA), алгоритма имитации отжига (англ. simulated annealing, SA), искусственных нейронных сетей с обратным распространением (англ. back-propagation artificial neural networks, BPANN), сетей Кохонена (англ. Kohonen artificial neural network, KANN), и генетических алгоритмов (англ. genetic algorithms, GAs; включая комбинацию GA-iPLS).
Таблица 3. Характеристики ближнего ИК спектрометра «Bruker Optics MP А»
Характеристика Единица измерения Значение
Производительность (прибл.) изм./ч 20
Объем кюветы" см^ 1-2
Рабочий спектральный диапазон см"' 4000-12000
Разрешение см ' 1-32
Габаритные размеры мм 400x589x262
Масса кг 32
Потребляемая мощность Вт 180
а Имеется возможность измерения вне кюветного отделения.
5. регрессионные методы для построения модели «спектр-свойство», включавшие в себя множественную линейную регрессию (МЛР), регрессию на главные (PTK/PCR), метод проекций на латентные структуры (ПЛС/PLS), нелинейные версии ПЛС: с полиномиальной (Poly-PLS) и со сплайн-аппроксимациями (Spline-PLS), искусственные нейронные сети (ИНС/ANN), а также методы опорных векторов (MOB/SVM): регрессию методом опорных векторов (англ. support vector regression, SVR) и машины опорных векторов на основе метода наименьших квадратов (англ. least-squares support vector machine, LSSVM/LS-SVM).
В третьей главе проведен анализ бензиновых фракций и товарных бензинов на основе данных БИК спектроскопии и сравнение линейных и нелинейных методов многомерной регрессии. Обсуждается методика определения свойств и показателей качества бензинов Орского и Киришского нефтеперерабатывающих заводов, а также Астраханского ГПЗ, на основе спектроскопии в ближней инфракрасной области (рис. 2). Следует отметить, что данное исследование является первым в своем роде - автором не было найдено ни одного упоминания о нейросетевом подходе к предсказанию состава, свойств или показателей качества продуктов газоконденсатного происхождения^
Рис. 2. Пример ближнего ИК спектра нефтяного бензина (максимальное пропускание составляет 5 усл. ед.).
Для предсказания свойств и показателей качества бензина были
построены калибровочные модели на основе следующих методов: метод
11
множественной линейной регрессии (MLR), метод регрессии на главные компоненты (PCR), метод проекции на латентные структуры (PLS), метод полиномиальной PLS (Poly-PLS), метод сплайн PLS (Spline-PLS), искусственные нейронные сети (ANN). Были использованы три метода предварительной обработки спектральных данных: логарифмирование, дифференцирование и двойное дифференцирование - наилучшим образом зарекомендовавшие себя при исследовании бензинов нефтяного происхождения.
Density IB Т10 Т50 Т90 FB
Рис. 3. Среднеквадратичные ошибки (RMSECV) различных калибровочных алгоритмов. Модели: MLR - множественная линейная регрессия; PCR - регрессия на главные компоненты; PLS - проекция на латентные структуры; ANN - искусственная нейронная сеть. Свойства: Density - плотность при 20 °С; IB - ТНК; ТЮ - температура выкипания 10% об.; Т50 - температура выкипания 50% об.; Т90 - температура выкипания 90% об.; FB - ТКК.
На примере спектральных и референтных данных бензинов и бензиновых фракций можно показать сколь существенно влияния метода построения калибровочной модели. На рис. 3 показана эффективность каждой из использованных моделей (с оптимизированными параметрами). Модели приведены в порядке возрастания эффективности. Как видно, ошибка кросс-валидации меняется в широких пределах: от 2 до 8.5 кг м"3 для плотности. Для данного набора данных наихудшие результаты показала множественная линейная регрессия, наилучшие - нейронная сеть. Стандартный хемометрический PLS метод занял промежуточное положение: данный подход в полтора раза менее эффективен, чем ANN, но в два с половиной раза эффективнее MLR (по соотношению ошибок кросс-валидации).
Наибольшее различие эффективности калибровочных моделей наблюдалось для октанового числа и плотности (в 5 и 10 раз, соответственно); наименьшее - для фракционного состава / температур выкипания (в 3 раза).
Для более полного анализа практической эффективности различных математических методов необходим учет таких факторов как время обучения и сложность построения. Можно отметить, что если по эффективности методы располагаются в следующей последовательности: ANN > Poly-PLS ~ Spline-PLS > PLS > PCR » MLR, то по временным затратам: MLR = PCR = PLS ~ Poly-PLS « ANN < Spline-PLS и сложности MLR = PCR = PLS = Poly-PLS > Spline-PLS » ANN модели располагаются в существенно иной последовательности.
Из приведенных данных становится ясно, что «квази»-нелинейные методы, требующие временных затрат близких ко времени обучения нейронных сетей и обладающие сопоставимой сложностью для понимания, но не дающие существенного выигрыша в точности, т.е. являются малопригодными для наших задач. Наилучшее решение задачи регрессии было достигнуто с использованием метода нейронных сетей. Несмотря на сложность и требовательность к ресурсам (временным и вычислительным), данный метод показал многократное превосходство над линейными аналогами.
Как видно из рис. 3, линейные модели (MLR, PCR, PLS) в целом показали себя значительно хуже, нежели нелинейные (Poly-PLS, Spline-PLS, ANN). Это говорит о сложной связи «спектр-свойство» (см. рис. 1) для такого объекта как бензин. Причина этого может крыться в нелинейной взаимосвязи «состав-свойство». Следует отметить, что нелинейность взаимосвязи «состав-спектр» является нехарактерной для углеводородных систем. В принципе, ввиду относительной химической инертности углеводородов легкие нефтяные системы (бензин, дизельное топливо, керосин) являются удачным объектом для применения ПЛС. В то же время колоссальное количество компонент в системе даже в случае наиболее легких нефтепродуктов приводит к возможности наблюдения нелинейности и в этом случае.
Успешное применение нейросетевого подхода для построения калибровочной модели бензина можно объяснить описанной ранее способностью нейронных сетей аппроксимировать сложные зависимости, не поддающиеся эффективной полиномиальной (Poly-PLS) или сплайн-аппроксимации (Spline-PLS).
К целом, задача о построении калибровочной модели для предсказания свойств и показателей качества бензинов Орского и Киришского НПЗ, а также Астраханского ГПЗ, на основе БИК спектроскопии в диапазоне 8000-14000 см"1 является решенной. Нам удалось добиться точности сопоставимой с точностью гостированного метода, при многократно меньших временных затратах на единичное измерение. Сложность БИК анализа является минимальной и не требует от оператора каких-либо специальных знаний или навыков. Важным фактом является эффективность модели, построенной на бензинах трех разных заводов, с принципиально различным сырьем и разной технологической цепочкой. Это говорит об устойчивости модели, её способности к обобщению.
В итоге, следует отметить, что нам удалось обобщить модель на случай трех производителей и двух видов сырья. Был показан факт возможности совместной калибровки бензинов различного происхождения. Был создан
метод БИК анализа бензинов и бензиновых фракций, рекомендуемый для внедрения в реальную производственную практику сразу трех заводов.
В четвертой главе представлено сравнение нелинейных методов анализа спектральных и референтных данных для анализа (био)топлив и растворов нефтяных макромолекул. В данном исследовании использовались пять типов химических систем нефтяного происхождения: бензин; спирто-бензиновое топливо; дизельное топливо; растворы нефтяных макромолекул (смол, асфальтенов и парафинов) в ароматических растворителях.
Таблица 4. Результаты применения линейных и нелинейных методов анализа данных к БИК
спектрам различных нефтяных систем.
Система Свойство Ед. изм. ПЛС/PLS Poly-PLS
LV RMSEP LV n RMSEP
Бензин Плотность при 20 °С кг м~3 10 2.8 9 3 2.4
ТНК °С 10 2.0 15 5 1.6
Темп, выкипания 10% об. (Т10) °С 9 2.2 9 4 1.8
Темп, выкипания 50% об. (Т50) °С 12 2.4 14 3 1.9
Темп, выкипания 90% об. (Т90) °С 18 2.8 14 5 2.2
ТКК °С 19 2.8 18 3 2.1
Доля бензола % масс. 5 0.87 5 2 0.85
Биотопливо: этанол-бензиновая композиция Плотность при 20 °С кг м"3 11 2.70 9 3 2.40
Доля этанола % масс. 5 0.22 3 2 0.22
Дизельное топливо Общее содержание серы ррт 6 344 6 3 341
Нефтяные макромолекулы Содержание асфальтенов % масс. 5 0.41 (0.43) 5 2 0.25
Содержание смол % масс. 3 0.79 (0.79) 5 2 0.71
Содержание парафинов % масс. 6 0.35 (0.39) 6 2 0.35
Растворы нефтяных смол Концентрация смол мг л"1 3 2.1 (2.1) 2 2 2.1
Представленные нефтяные системы существенно различаются по составу, структуре, свойствам и поведению. Количество «эффективных компонент» в исследованных нефтяных системах, вариьирует от одной до миллионов. Точность и воспроизводимость референтных данных существенно отличается для разных свойств исследованных химических систем (для разных наборов данных). Столь высокое многообразие химических систем позволяет надеяться на возможность сформулировать общие закономерности о БИК анализе продуктов нефтяного происхождения и применимости методов многомерного анализа данных к их спектральным данным.
В табл. 4 собраны результаты применения калибровочных моделей на основании метода проекции на латентные структуры для различных нефтяных систем. Как видно из данной таблицы, результаты ПЛС методов существенно различаются в зависимости об объекта исследования. В некоторых случаях (плотность и фракционный состав бензинов и спирто-бензиновых композиций) удалось добиться достаточно высокой точности предсказания; в других случаях (состав растворов нефтяных макромолекул или доля серы в дизельном топливе) при использовании ПЛС были достигнуты лишь посредственные результаты. Можно предположить, что сложность и многокомпонентность системы имеет непосредственное значение для итоговой точности калибровки: достаточно сравнить точность определения процента нефтяных смол в системе, содержащий только растворитель и смолы, и в системе из всего набора нефтяных макромолекул.
При анализе табл. 4 надо отметить низкую эффективность полиномиальной версии ПЛС-регрессии. Несмотря на то, что данный алгоритм должен существенно увеличивать точность предсказания в случае высокой нелинейности в зависимости «спектр-свойство», на практике это наблюдается
только в случае с определением содержания асфальтенов (где ошибка
16
предсказания ПЛС снижается на 40% при переходе к Ро1у-РЬ8). В остальных случаях эффект практически не виден. Можно заключить, что метод полиномиальной регрессии на латентные структуры не является лучшим выбором при анализе нефтяных систем: его обобщающей способности не достаточно для обработки нелинейных спектральных данных сложных систем нефтяного происхождения. В простых же случаях точности обычного ПЛС вполне достаточно.
Результаты анализа БИК спектров нефтяных систем с использованием искусственных нейронных сетей представлены в табл. 5.
Таблица 5. Результаты применения искусственных нейронных сетей к БИК спектрам различных нефтяных систем.
Система Свойство Ед. изм. ИНС/ANN
Кол-во вход, нейронов Кол-во нейронов внут. слоя RMSEP
Бензин Плотность при 20 °С кг м~3 10 7 2.0
ТНК °С 16 8 1.3
Темп, выкипания 10% об. (Т10) °С 19 6 1.4
Темп, выкипания 50% об. (Т50) °С 15 9 1.6
Темп, выкипания 90% об. (Т90) °С 14 9 1.7
ТКК °С 18 1 1.7
Доля бензола % масс. 12 5 0.58
Биотопливо: этанол-бензиновая композиция Плотность при 20 °С кг м"3 9 7 1.90
Доля этанола % масс. 8 5 0.13
Дизельное топливо Общее содержание серы ррш 7 5 155
Нефтяные макромолекулы Содержание асфальтенов % масс. 5 3 0.15
Содержание смол % масс. 5 4 0.30
Содержание парафинов % масс. 5 3 0.13
Растворы Концентрация мг л"1 3 2 1.9
нефтяных смол смол
Точность предсказания при использовании ИНС существенно повышается во всех случаях кроме одного (смолы в бензоле). Среднее снижение ошибки предсказания по сравнению с ПЛС составляет 41±15%. Наибольший эффект достигается при обработке данных по асфальтенам (-63%), при почти идентичных снижениях ошибки для остальных макромолекул нефти.
Таблица 6. Результаты применения методов опорных векторов к БИК спектрам различных
нефтяных систем.
Система Свойство Ед. изм. SVR LS-SVM
РС RMSEP РС RMSEP
Бензин Плотность при 20 °С кг м"3 5 2.0 6 2.0
ТНК °С 8 1.4 8 1.3
Темп, выкипания 10% об. (Т10) °С 8 1.4 8 1.4
Темп, выкипания 50% об. (Т50) °С 7 1.5 7 1.6
Темп, выкипания 90% об. (Т90) °С 10 1.8 9 1.8
ТКК °С 10 1.8 10 1.7
Доля бензола % масс. 5 0.53 6 0.58
Биотопливо: этанол-бензиновая композиция Плотность при 20 °С кг м-3 7 1.91 6 1.92
Доля этанола % масс. 5 0.14 6 0.16
Дизельное топливо Общее содержание серы ррт 7 136 7 131
Нефтяные макромолекулы Содержание асфальтенов % масс. 4 0.15 4 0.13
Содержание смол % масс. 6 0.29 4 0.26
Содержание парафинов % масс. 5 0.12 5 0.12
Растворы нефтяных смол Концентрация смол мг л"1 3 2.3 3 2.0
Подобный эффект может быть объяснен крайне высокой способностью асфальтенов к агрегации и ассоциации, с образованием димеров, широкого спектра олигомеров, различных кластеров и агрегатов. Поскольку процесс агрегации (как и процесс разделения системы на фазы) зависит от концентрации вещества, при спектральном анализе асфальтеновых растворов можно ожидать высокую нелинейность оптического отклика. Это приводит к необходимости нелинейного подхода к анализу получаемых спектральных данных. И ИНС могут быть рекомендованы как высокоэффективный метод для подобного анализа.
Представленные результаты показывают высокую эффективность нейросетевого подхода к анализу спектральных данных нефтяных систем в ближнем ИК диапазоне, вне зависимости от пределов выкипания нефтяных фракций или состава самих систем. Различные свойства и параметры качества нефтепродуктов могут быть предсказаны нейронными сетями с высокой точностью.
В табл. 6 суммируются результаты по анализу 14 наборов данных различных нефтяных систем методами опорных векторов. Для сравнения представлены как результаты регрессии методом опорных векторов, так и результаты, полученные при использовании машин опорных векторов на основе метода наименьших квадратов. В целом можно увидеть, что на основе МОВ-методов можно построить градуировочные модели не хуже, чем на основе ИНС. В случае же определения серы в дизельном топливе и состава растворов нефтяных макромолекул, методы опорных векторов дают меньшую ошибку, нежели ИНС (на 15±1%). Хорошая точность также достигается использованием БУИ. при определении доли бензола.
Для таких параметров как температура выкипания 90% об., доля этанола и содержание нефтяных смол в бензольном растворе, регрессия MOB приводит в большей ошибке, чем ИНС (на 7%, 11% и 7%, соответственно). Последний премер малорепрезентативен, поскольку для смол все многомерные методы дают практически идентичные результаты (±8%).
Разница между MOB методами невелика: 3±8% в точности, при превосходстве машин опорных векторов на основе метода наименьших квадратов. Относительная существенная разница, превышающая 10%, наблюдается в случае определения бензола, асфальтенов и смол.
CL Ш V) S сс
Щ PLS ИЯИШ Poly-PLS
I ISVR _ _ I LS-SVM
Iküákk
Density IB
T10 T50
T90
FB [Benzene]
Density [EtOH] [Sulfur] [A]
Рис. 4 Среднеквадратичные ошибки (RMSEP) применения различных калибровочных алгоритмов для обработки данных для нефтяных систем. Модели: PLS - проекция на латентные структуры; ANN - искуственная нейронная сеть; SVR - регрессия методом опорных векторов; LS-SVM — машины опорных векторов на основе метода наименьших квадратов. Системы и свойства: (верхний ряд) Бензин - плотность при 20 °С, ТНК, температура выкипання 10% об. (Т10), температура выкипания 50% об. (Т50), температура
выкипания 90% об. (Т90), ТКК, доля бензола; (нижний ряд) Этанол-бензиновые композиции
- плотность при 20 °С, доля этанола; Дизельное топливо - общее содержание серы; Нефтяные макромолекулы - содержание асфальтенов [А], содержание смол [Я], содержание парафинов [Р]; Растворы нефтяных смол - концентрация смол [И].
Из табл. 6 можно сделать вывод, что оба МОВ-метода являются высокоэффективными при анализе БИК спектров нефтяных систем. Экспресс-методы анализа на их основе отличаются высокой точностью итогового предсказания. Оба метода могут быть рекомендованы для практического применения. Особенности же алгоритма дают небольшое преимущество Ь8-вУМ. Наши данные подтверждают ранее имевшиеся в литературе утверждения об эффективности МОВ-моделей для анализа БИК спектров, зашумленных вариациями в температуре образцов, и позволяют обобщить данный вывод на широкий спектр продуктов нефтепереработки и нефтехимии.
Window size (w)
Рис. 5. Оптимизация размера окна для MWPLS метода при анализе доли воды в биодизельном топливе с помощью MJIP. Исходный результат показан горизонтальной серой
линией.
Несмотря на близость точностей предсказания свойств и параметров качества различных нефтяных систем в случае использования ИНС и MOB (рис. 4), методы опорных векторов обладают рядом дополнительных преимуществ, позволяющих рекомендовать их для анализа БИК спектров. В частности, вариативность результатов, полученных при различном разбиении набора образцов на обучающую и тестовые выборки, существенно ниже для MOB, чем для ИНС: [130-133] против [147-281] ррш для серы в дизельном топливе, [0.15-0.17] против [0.13-0.30] % масс. Д-для доли этанола в СБК, и так далее. Кроме того, детерминистический характер MOB регрессии, т.е. отсутствие зависимости от начальных параметров обучения, делает процесс создания и реализации экспресс-метода анализа качества проще, надежнее и понятнее конечному потребителю (например, заводской аналитической лаборатории).
В пятой главе представлены результаты исследований по применению различных методов выбора переменных (длин волн в случае с БИК спектрами) для анализа состава и качества биодизельного топлива. Проведено сравнение методов. Использование сразу четырех наборов референтных данных (плотность, вязкость, доля воды и содержание метанола) позволяет сделать однозначные выводы о точности и надежности различных методов выбора переменных в применении к БИК спектрам.
Тестирование пятнадцати и шестнадцати различных методов выбора оптимального спектрального диапазона позволило найти наиболее подходящий для каждой конкретной характеристики биотоплива (рис. 5). Таким образом были построены оптимальные модели для предсказания параметров состава и качества топлива.
Применение методов выбора переменных к данным по плотности биодизельного топлива позволяет снизить ошибку калибровки на 40-65% и 725% для MJIP и ПЛС методов, соответственно. Среднее снижение ошибки составило 52±8% и 16±6% для MJIP и ПЛС, соответственно. Наилучшие результаты были достигнуты при использовании методов выбора переменных
на основе нейронных сетей: BP-ANN метод совместно с МЛР дал ошибку предсказания (RMSEP) в 1,38 кг/м3, а K-ANN метод совместно с ПЛС дал ошибку предсказания в 0,64 кг/м3.
Результаты применения методов выбора переменных к данным о вязкости биодизелыюго топлива подобны результатам для плотности, но немного им уступают: снижение ошибки предсказания находится в диапазоне 41-61% и 3-29% при средних в 50±7% и 14±8% для МЛР и ПЛС, соответственно. Возможная причина подобных результатов состоит в том, что вязкость является менее линейным свойством химической системы, нежели плотность. Также следует отметить более низкую точность референтных данных для вязкости биотоплива относительно данных о его плотности.
В то время как нейросетевые методы выбора переменных (конкретно, ICANN) лидируют по точности при использовании множественной линейной регрессии (RMSEP = 0,292 мм2/с), комплексный UVE-SPA метод доказал своё превосходство при использовании совместно с ПЛС (RMSEP = 0,144 мм2/с). Примечательным является факт несколько большего улучшения точности градуировки вязкости относительно плотности (29% против 25%).
Относительное изменение ошибки предсказания содержания воды в биодизельном топливе составило от 43% до 65% и от -1% до 30% для МЛР и ПЛС, соответственно. В случае использования CSMWPLS ошибка ПЛС даже возросла на 1%. Среднее же снижение неточности калибровочной модели составило 53±8% и 13±9% для МЛР и ПЛС, соответственно.
■■■ MLR-step ШШ iPLS ■Hi BIPLS ШШШ FiPLS ■■■ MWPLS
CSMWPLS ШШ SCMWPLS ШИШЯ MCSMWPLSR SPA UVE
UVE-SPA ■H SA ■■■ BP-ANN
K-ANN — GA ■■■ GA-iPLS
Density
Viscosity
[Water]
[Methanol]
Рис. 6. Сравнение 16 методов выбора переменных для МЛР при анализе плотности, вязкости, доли воды и спирта в биодизельном топливе. Тонкая горизонтальная линия показывает исходный МЛР уровень, толстая - исходный ПЛС уровень. См. с. 8-9 с перечнем сокращений методов и алгоритмов.
Определение доли метанола в биодизеле на основании БИК спектров может быть весьма точным при верном подборе метода выбора переменных. Точность МЛР метода возросла на 40-54%, в то время как точность ПЛС изменилась от +1% до -24%. Средние значения относительного изменения составили 52±8% и 11 ±9% для МЛР и ПЛС, соответственно.
RMSEP при определении доли метанола в биодизельном топливе методами К-ANN и МЛР составило 114 ррт. Среднеквадратичные ошибки предсказания алгоритма имитации отжига и BP-ANN в 83,9 и 84,3 ррт, соответственно, позволили им стать лидерами в рейтинге методов выбора переменных для ПЛС метода. Совсем небольшое отставание наблюдается и для ГА (85 ррт).
Применение методов выбора переменных при построении регрессионной модели методом МЛР позволило снизить ошибку предсказания в среднем по всем четырем свойствам биодизельного топлива на 52±8% (рис. 6).
В целом шестнадцать (4-6) примененных методов можно разнести в три класса по итоговой точности: (а) пизкоэффективные методы (MLR-step, iPLS, BiPLS, FiPLS, MWPLS, CSMWPLS, SCMWPLS и MCSMWPLSR) со средним снижением в 45±3%; (б) эффективные методы (SPA, UVE и UVE-SPA) со средним снижением в 55±3%; (в) высокоэффективные методы (SA, BP-ANN, ICANN, ГА и GA-iPLS) со средним снижением в 61±3%.
Рисунок 6 показывает, что достаточно сложные методы, например ГА, имеют заметное преимущество над более простыми алгоритмами выбора переменных при анализе БИК спектров биодизельного топлива.
Применение алгоритмов выбора переменных позволяет снизить ошибку ПЛС предсказания на 14±8% (рис. 7). Мы видим, что снижение не столь значительно, как в случае с МЛР методом.
Все пятнадцать методов выбора оптимального спектрального диапазона можно классифицировать на два класса по точности: (а) низкоэффективные (iPLS, BiPLS, FiPLS, MWPLS, CSMWPLS, SCMWPLS, MCSMWPLSR и SPA), которые снижают ошибку предсказания на 8±5%; (б) высокоэффективные (UVE, UVE-SPA, SA, BP-ANN, KANN, ГА и GA-iPLS), которые снижают ошибку предсказания на 20±6%.
К сожалению, ни один из методов выбора переменных не позволяет ПЛС модели приблизится по точности к нейронным сетям (рис. 7). Разность погрешностей лучшей комбинации «метод выбора переменных + ПЛС» и ИНС составляет от 52% (плотность биотоплива) до 112% (вязкость биотоплива). Таким образом можно заключить, что анализ БИК спектров биодизельного топлива однозначно нуждается в применении нелинейных регрессионных моделей (ИНС, MOB и др.) для наилучшего предсказания параметров качества. Простота и надежность линейных методов (МЛР/ПЛС) является крайне важной при окончательном выборе многомерного метода анализа для его внедрения в производственную практику анализа биодизеля на основе БИК спектроскопии.
а. ш
сл
IfPLS I BiPLS I FiPLS MWPLS CSMWPLS SCMWPLS MCSMWPLSR SPA UVE
UVE-SPA SA
BP-ANN I K-ANN 3GA
I GA-iPLS
Density Viscosity [Water] [Methanol]
Рис. 7. Сравнение 15 методов выбора переменных для TTJTC при анализе плотности, вязкости, доли воды и спирта в биодизельном топливе. Тонкая горизонтальная линия показывает исходный ПЛС уровень, толстая - исходный ИНС уровень. См. с. 8-9 с перечнем сокращений методов и алгоритмов.
В итоге была создана работоспособная методика анализа четырех важных (нормированных) параметров биодизельного топлива, причем все четыре значения могут быть получены по результатам всего одного спектроскопического измерения. Были определены и оптимизированы спектральные диапазоны (длины волн), являющиеся наиболее информативными для каждого показателя качества.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ
1. Показана применимость ближней инфракрасной спектроскопии для определения параметров состава и качества широкого спектра нефтяных систем: от бензина до растворов нефтяных макромолекул, включающих асфальтены. Проведено широкое сравнение методов многомерного анализа для решения данных задач.
2. Разработана экспериментальная методика экспресс-анализа бензина и дизельного топлива на основе БИК спектроскопии, позволяющая количественно оценить плотность, вязкость и температурные параметры нефтепродуктов. Методика использует нейронные сети в качестве метода построения калибровочных моделей.
3. Разработана экспериментальная методика экспресс-анализа биотоплив: спирто-бензиновых композиций и биодизельного топлива - позволяющая количественно оценить плотность, вязкость, а также долю спирта и воды в химической системе. Методика использует методы опорных векторов для построения моделей «спектр-свойство».
4. Рассчитаны оптимальные спектральные диапазоны в ближней ИК области, наиболее подходящие для построения калибровочных моделей нефтяных систем. Проведено сравнение методов выбора оптимальных длин волн.
5. Предложен метод учета нелинейности оптического отклика в сложных многокомпонентных системах нефтяного происхождения. Показано превосходство нелинейных калибровочных методов над классическими линейными.
Основное содержание диссертации опубликовано в следующих работах:
1. R. М. Balabin, Е. I. Lomakina, R. Z. Safieva, «Neural network (ANN) approach to biodiesel analysis: Analysis of biodiesel density, kinematic viscosity, methanol and water contents using near infrared (NIR) spectroscopy» Fuel 90, 2007 (2011).
2. R. M. Balabin, E. I. Lomakina, «Support vector machine regression (SVR/LS-SVM) - an alternative to neural networks (ANN) for analytical chemistry? Comparison of nonlinear methods on near infrared (NIR) spectroscopy data» Analyst 136, 1703 (2011).
3. R. M. Balabin, R. Z. Safieva, «Near-infrared (NIR) spectroscopy for biodiesel analysis: Fractional composition, iodine value, and cold filter plugging point from one vibrational spectrum» Energy Fuels 25, 2373 (2011).
4. R. M. Balabin, R. Z. Safieva, E. I. Lomakina, «Gasoline classification using near infrared (NIR) spectroscopy data: Comparison of multivariate techniques» Anal. Chim. Acta 671,27(2010).
5. R. M. Balabin, R. Z. Safieva, «Gasoline classification by source and type based on near infrared (NIR) spectroscopy data» Fuel 87, 1096 (2008).
6. R. M. Balabin, R. Z. Safieva, E. I. Lomakina, «Comparison of linear and nonlinear calibration models based on near infrared (NIR) spectroscopy data for gasoline properties prediction» Chemometr. Intell. Lab. Syst. 88, 183 (2007).
7. R. M. Balabin, S. V. Smirnov, «Variable selection in near-infrared (NIR) spectroscopy: Benchmarking of feature selection methods on biodiesel data» Anal. Chem. Acta 692, 63 (2011).
8. Балабин P.M. // Химия и химическая технология в XXI веке: Материалы VI Всероссийской студенческой научно-практической конференции - Томск, 11-12 мая 2005 г. - Томск: Изд.ТПУ, 2005. - с. 152.
9. Балабин P.M. // Химия и химическая технология в XXI веке: Материалы VI Всероссийской студенческой научно-практической конференции - Томск, 11-12 мая 2005 г. - Томск: Изд.ТПУ, 2005. - с. 101.
10. Балабин P.M., Сафиева Р.З. // Актуальные проблемы науки и высшего образования. Научный сборник. - Москва: МГУТУ, 2005. - с. 130. ISBN 5-89933-055-4
11. Balabin R.M. // 58-ая Межвузовская студенческая научная конференция «Нефть и газ - 2004». Секция 10. - М.: РГУ нефти и газа им. И. М. Губкина, 2004. - с. 46.
12. Сафиева Р.З., Сюняев Р.З., Балабин P.M., Демыгин С.С., Чулюков О.Г. // 6-ая научно-техническая конференция «Актуальные проблемы состояния и развития нефтегазового комплекса России». - М.: РГУ нефти и газа им. И. М. Губкина, 2005. -с. 158.
13. Балабин P.M. // Материалы Международной конференции студентов и аспирантов по фундаментальным наукам «Ломоносов-2005». Секция «Химия», т. 1. М.: 2005. - с. 6.
14. Балабин P.M. // 59-ая Межвузовская студенческая научная конференция «Нефть и газ - 2005». Тезисы докладов. Секция «Химическая технология и экология в нефтяной и газовой промышленности». - М.: РГУ нефти и газа им. И. М. Губкина, 2005. - с. 20.
15. Балабин P.M., Картынова Ю.А. // Тезисы докладов Шестой Всероссийской конференции молодых ученых, специалистов и студентов по проблемам газовой промышленности России «Новые технологии в газовой промышленности». 27-30 сентября 2005 г. Секция 5. Современные проблемы переработки газа и газоконденсата. - Москва, 2005 г. - с. 37.
16. Балабин P.M., Филатов В.В. // Тезисы докладов Шестой Всероссийской конференции молодых ученых, специалистов и студентов по проблемам газовой промышленности России «Новые технологии в газовой промышленности». 27-30 сентября 2005 г. Секция 5. Современные проблемы переработки газа и газоконденсата. Москва, 2005 г. - с. 17.
17. Балабин P.M. // 60-ая Межвузовская студенческая научная конференция «Нефть и газ - 2006». Тезисы докладов. Секция «Химическая технология и экология в нефтяной и газовой промышленности». - М.: РГУ нефти и газа им. И. М. Губкина, 2006.
18. Балабин P.M. // 61-ая Межвузовская студенческая научная конференция «Нефть и газ - 2007». Тезисы докладов. Секция «Химическая технология и экология в нефтяной и газовой промышленности». - М.: РГУ нефти и газа им. И. М. Губкина, 2007.
Для заметок и комментариев:
\/
30
Министерство образования и науки Российской Федерации
Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Российский Государственный Университет нефти и
газа имени И. М. Губкина» (РГУ нефти и газа им. И. М. Губкина)
04201450367 на правах рукописи
БАЛАБИН РОМАН МИХАЙЛОВИЧ
СОЗДАНИЕ ЭКСПРЕСС-МЕТОДОВ АНАЛИЗА ПРОДУКТОВ НЕФТЕПЕРЕРАБОТКИ И НЕФТЕХИМИИ НА ОСНОВЕ КОЛЕБАТЕЛЬНОЙ
СПЕКТРОСКОПИИ
Специальность 02.00.13 - «Нефтехимия»
Диссертация на соискание ученой степени кандидата технических наук
Научный руководитель: доктор технических наук, профессор Сафиева Р. 3.
Москва - 2013
Содержание
ВВЕДЕНИЕ
3
ГЛАВА 1. ЛИТЕРАТУРНЫЙ ОБЗОР......................................................................................................
1.1. Спектроскопия в ближнем инфракрасном диапазоне
1.2. Многомерные методы анализа спектральных данных
1.3. Применение БИК спектроскопии в аналитической химии и химической технологии
7
ГЛАВА 2. ОБЪЕКТЫ И МЕТОДЫ ИССЛЕДОВАНИЯ
,45
2.1. Объекты исследования
2.2. Методы исследования
2.2.1. Выделение нефтяных макромолекул 2.2.3. Спектральные измерения
2.3. Обработка данных
2.3.1. Предварительная обработка спектральных данных
2.3.2. Оценка эффективности и оптимизация моделей
2.3.3. Выбор переменных и сокращение размерности
2.3.4. Регрессионные модели
2.3.5. Алгоритмы и программное обеспечение
ГЛАВА 3. АНАЛИЗ БЕНЗИНОВЫХ ФРАКЦИЙ И ТОВАРНЫХ БЕНЗИНОВ НА ОСНОВЕ ДАННЫХ БИК СПЕКТРОСКОПИИ. СРАВНЕНИЕ ЛИНЕЙНЫХ И НЕЛИНЕЙНЫХ МЕТОДОВ................................................72
3.1. Репрезентативность данных и ширина выборки
3.2. Построение калибровочных моделей РГК методами
3.3. Построение калибровочных моделей ПЛС методами
3.4. Построение калибровочных моделей нейронными сетями
ГЛАВА 4. АНАЛИЗ НЕФТЯНЫХ ТОПЛИВ, БИОТОПЛИВ И РАСТВОРОВ НЕФТЯНЫХ МАКРОМОЛЕКУЛ НА ОСНОВЕ ДАННЫХ БИК СПЕКТРОСКОПИИ. СРАВНЕНИЕ НЕЛИНЕЙНЫХ МЕТОДОВ...............................85
4.1. Репрезентативность данных и ширина выборки
4.2. Построение калибровочных моделей ПЛС методами
4.3. Построение калибровочных моделей нейронными сетями
4.4. Построение калибровочных моделей МОВ-методами
4.5. Общее сравнение методов анализа БИК спектров исследованных систем
ГЛАВА 5. ВЫБОР ПЕРЕМЕННЫХ ДЛЯ БИК СПЕКТРОСКОПИИ НЕФТЯНЫХ СИСТЕМ. СРАВНЕНИЕ МЕТОДОВ...............................................................................................................................................................95
5.1. Выбор методов и систем
5.2. Биодизельное топливо
5.3. Дизельное топливо
5.4. Растворы нефтяных макромолекул
5.5. Общее сравнение методов выбора переменных для БИК спектров нефтяных систем
ВЫВОДЫ..............................................................................................................................................................103
Список литературы............................................................................................................................................107
ВВЕДЕНИЕ
Интенсивное воздействие человека на окружающую среду приводит на сегодняшний день к повсеместному ужесточению экологических норм и правил. Нефть и газ - основные источники энергии человечества сегодня - являются в тоже самое время, к сожалению, и одними из основных источников загрязнения атмосферы, почвы и воды. Очевидно, что ужесточение норм и стандартов в нефтяной и газовой промышленностях невозможно без более тщательного и всестороннего контроля как самих производственных процессов, так и выпускаемой ими продукции. В связи с этим, при обновлении и модернизации нефтяной индустрии в целом, возникает потребность в быстрых, точных, надежных, информативных и недорогих методах анализа состава и качества нефтяных (в том числе, нефтяных дисперсных) систем.
Уже имеющиеся многочисленные и обычно хорошо себя зарекомендовавшие стандартные методы контроля качества нефтепродуктов, обладая высокой точностью и надежностью, зачастую не отличаются достаточной скоростью и низкой ценой. Это, в свою очередь, является основным препятствием для нефте- или газоперерабатывающего завода при контроле выпускаемой продукции в режиме реального времени (англ. online control) [1,2]. Внедрение же высокоскоростных экспресс-методов анализа состава и качества нефтяных систем способно повысить эффективность использования сырья и энергоресурсов (например, за счет снижения доли отходов производства), уменьшить долю бракованной и низкокачественной продукции, оптимизировать качество готовой продукции (к промеру, повысить октановое число товарного бензина при мониторинге процесса компаундирования
в режиме реального времени) и тем самым минимизировать воздействие на окружающую среду при производстве необходимой человечеству продукции [3]. Следует обратить внимание, что истощение нефтяных запасов, вследствие их активного использования, также является стимулом к повышению управляемости нефтяными производствами и более бережному обращению с сырьем, с каждым днем все более ценным.
Спектроскопические методы являются прекрасными кандидатами на роль методов контроля состава и качества нефтепродуктов за счет своей высокой информативности, относительной простоты и невысокой стоимости [4-8]. Из всего многообразия спектральных методов колебательная спектроскопия в инфракрасном (ИК) диапазоне представляется наиболее перспективным методом анализа преимущественно оптически непрозрачных нефтепродуктов, прежде всего за счет высокой информативности колебательных спектров углеводородов нефти и нефтяных систем [8]. Технические требования и особенности нефтяной промышленности (например, высокая пожароопасность производств и нежелательное расположение ценного оборудования и людей поблизости от реакторов и трубопроводов) позволяют утверждать, что спектроскопия в ближнем инфракрасном (БИК) диапазоне является наиболее подходящим методом для создания быстрых и недорогих методов анализа параметров качества нефтепродуктов. Возможность передачи БИК излучения по оптоволоконным кабелям на десятки и сотни метров (т.е. возможность удаленного мониторинга), низкая цена оборудования и его простота (как и простота его обслуживания), почти полное сохранение информативности классического среднего ИК диапазона - вот основные преимущества БИК при создании экспресс методов контроля состава и качества нефтяных систем [5]. Поскольку создание подобных методов представляет
большое практическое значения для современного нефтегазового комплекса, экспериментальные исследования в области БИК спектроскопии нефтяных систем можно назвать перспективными и значимыми. Следует также отметить, что колоссальный размер современной нефтегазовой индустрии позволяет даже небольшим улучшениям (например, +0,1 ед. октанового числа при компаундировании), вызванным применением более точных или более быстрых методов, производить существенный эффект в абсолютном выражении.
Целью настоящей работы являлись разработка экспресс методов лабораторного анализа нефтепродуктов на основе спектроскопии в ближнем ИК диапазоне и исследование возможностей современных методов математического анализа данных для создания точных и надежных аналитических методик БИК анализа нефтяных систем.
Практическая значимость работы определяется необходимостью изучения факторов, влияющих на точность и надежность спектроскопического анализа нефтяных систем, и разработки методов предсказания параметров состава и качества продуктов нефтяной и газовой промышленности.
Проведенное исследование позволяет сделать вывод о применимости ближней инфракрасной спектроскопии в качестве лабораторного метода проверки качества нефтепродуктов (бензин, дизельное топливо, биотопливо и т.д.) при использовании соответствующего математического аппарата по многомерному анализу спектральных данных и по машинному обучению (англ. machine learning). Предложенные экспериментальные методики могут быть использованы для прогнозирования состава и качества нефтепродуктов, а также для их классификации. Разработанные экспериментальные методики оценки состава и качества могут (после соответствующей модификации) быть применены для
контроля качества в режиме реального времени on-line или непосредственно «в трубе» (англ. inline). С использованием данной методики могут быть исследованы как непосредственно нефтяные системы, так и их смеси с иными компонентами (спиртами, эфирами, и др.). Данные по оптимальной математической обработки БИК спектров могут быть использованы при анализе иных систем нефтяного происхождения или при использовании иных экспериментальных данных: данных оптической спектроскопии, спектроскопии ядерного магнитного резонанса, спектроскопии комбинационного рассеяния света, диэлектрической спектроскопии и др.
ГЛАВА 1. Литературный обзор
1.1. Терминология. Перечень условных обозначений
На данный момент (конец 2013 г.) в России практически отсутствует литература по многомерному анализу данных. То, что имеется в доступе, является либо англоязычными изданиями, либо переводом (обычно с большим запаздыванием) западных авторов. Итогом подобной ситуации стало то, что на сегодня не сложилось русскоязычной хемометрической терминологии [4-151]. Для того, чтобы не вводить читателя в заблуждение и не создавать собственных терминов и сокращений, мы приводим ниже список общепринятых англоязычных сокращений, используемых в тексте. Кроме перевода, дается расшифровка хемометрических аббревиатур на английском языке.
ANN (ИНС) Искусственная нейронная сеть [artificial neural network]
API American Petroleum Institute
CA Кластерный анализ [cluster analysis]
FB Температура конца кипения
GA Генетические алгоритмы [genetic algorithms]
IB Температура начала кипения
KNN Кластеризация по методу К ближайших соседей
LS Латентные структуры [latent structures]
MAE Средняя относительная ошибка
MAPEC Средняя относительная ошибка калибровки
MAPECV Средняя относительная ошибка кросс-валидации
МАРЕР Средняя относительная ошибка предсказания
MCR Многомерное разрешение кривых [multivariate curve resolution]
MDA Многомерный анализ данных [multivariate data analysis]
MLR Метод множественной линейной регрессии [multiple linear
regression]
PC (ГК) Главная компонента [principal component]
PCA (МГК) Метод главных компонент / Анализ главных компонент [principal component analysis]
PCR (РГК) Метод регрессии на главные компоненты [principal component regression]
PLS (П/1С) Метод проекций на латентные структуры [projection to latent structures]
Poly-PLS Полиномиальная версия метода проекций на латентные структуры
[polinomial PLS] RMSE Среднеквадратичная ошибка
RMSEC Среднеквадратичная ошибка калибровки
RMSECV Среднеквадратичная ошибка кросс-валидации
RMSEP Среднеквадратичная ошибка предсказания
S/N (SNR) Соотношение "сигнал/шум" SAE Society of Automotive Engineers
SE Стандартная ошибка
Spline-PLS Сплайн-версия метода проекций на латентные структуры [spline PLS]
Т10 Температура выкипания 10% об.
Т50 Температура выкипания 50% об.
Т90 Температура выкипания 90% об.
Т96 Температура выкипания 96% об.
WNN Вейвлетная нейронная сеть [wavelet neural network]
ABT Атмосферно-вакуумная трубчатка
БИК Ближний инфракрасный диапазон
Б Л Базовая линия
ДНП Давление насыщенного пара
ДТ Дизельное топливо
ик Инфракрасный
KP Комбинационное рассеяние (рамановский эффект)
МТБЭ Метилтретбутиловый эфир
НПВО Нарушенное полное внутреннее отражение
НПЗ Нефтеперерабатывающий завод
04 Октановое число
очи •> Октановое число по исследовательскому методу
очм Октановое число по моторному методу
ПАВ Поверхностно-активное вещество
по Программное обеспечение
СБК Спирто-бензиновая композиция
ЭТБЭ Этилтретбутиловый эфир
ЯМР Ядерный магнитный резонанс
1.2. Общие замечания
Создание экспресс-метода анализа состава и показателей качества состоит из трех основных стадий:
1. Выбор одного из методов спектроскопии (подбор «информативного» спектрального диапазона).
2. Математическая обработка спектральных и референтных данных (создание калибровочной модели).
3. Проверка работоспособности модели (в условиях реального производственного процесса).
На первом шаге построения экспресс-метода исследователь выбирает тот диапазон, который может быть использован для создания калибровочной модели. Идеологию выбора такого диапазона может проиллюстрировать схема, приведенная на рис. 1.1.
Состав
Состав
Спектр
Спектр
Свойство
Свойство
Рис. 1.1. Схема, иллюстрирующая связь «спектр-свойство».
Комментирую рис. 1.1, необходимо отметить, что связь «состав-свойство» (как прямая, так и обратная) не вызывает сомнений. Основное внимание исследователя привлекает связь «состав-спектр». Если однозначность прямой связи «состав-спектр» может быть достигнута подбором соответствующего спектрального
диапазона, характерного для исследуемой системы, то обратная связь («спектр-состав») не всегда очевидна: зачастую её наличие в многокомпонентных системах (коими являются большинство видов сырья и многие продукты нефтепереработки и нефтехимии) может быть выявлено только за счет использования современных алгоритмов обработки спектральных данных. Но даже при этом описание данной связи в явном виде не всегда возможно.
Аналогичные рассуждения относятся и к связи «состав-свойство». При наличии «нелинейности» в многокомпонентной системе (неаддитивности свойств -часто наблюдаемого явления при анализе продуктов нефтепереработки и нефтехимии) связь «состав-свойство» также многократно усложняется. Кроме того, при анализе некоторых нефтепродуктов используется ряд показателей качества, которые вообще не характерны для индивидуальных веществ (например, октановое число). При использовании таких, чисто эксплуатационных свойств, не приходится ожидать аддитивности даже для относительно простых систем.
В итоге можно сделать вывод, что несмотря на то, что для многих нефтяных систем можно подобрать «информативный» спектральный диапазон, извлечение из него информации о свойствах и показателях качества является нетривиальной задачей, требующей специального подхода.
1.3. Спектроскопия в ближнем инфракрасном диапазоне
Как уже отмечалось во Введении, спектроскопические методы в целом, и метод ближней инфракрасной (БИК) спектроскопии в частности, являются высокоперспективными методиками для анализа промышленных продуктов [4-8]. Колебательная спектроскопия (инфракрасная или комбинационного рассеяния) позволяет получать информацию о химическом составе даже многокомпонентных систем за счет высокой чувствительности ИК спектра к химической структуре молекул, наличию и взаимоположению отдельных атомов и химических групп [6,8].
1.3.1. Теория нормальных колебаний молекулы
Применение методов колебательной спектроскопии в химии и химической технологии требует фундаментальных знаний в области теории колебательных спектров. На данный момент теория колебательной спектроскопии проработана достаточно для того, чтобы решать многие практически важные задачи как химии, так и химической технологии [6-8]. В этой части мы остановимся на наиболее важных моментах теории колебательной спектроскопии (прежде всего, инфракрасной) [9-15].
1.3.1.1. Уравнение Шредингера в приближении Борна-Опенгеймера
Колебательные энергетические уровни молекулы можно получить решением соответствующей квантовомеханической задачи [9-13]. Как известно [9,11,13], состояние молекулы как единой системы из ядер и электронов описывается полной волновой функцией Ф. При подстановки данной волновой функции в уравнение Шредингера (1.1) можно получить энергию стационарных состояний Е данной молекулы.
НФ = f Ф
(1.1)
где Й- квантовомеханический оператор Гамильтона (гамильтониан).
В приближении Борна-Опенгеймера, учитывающем большое различие масс электронов и атомных ядер (приблизительно 1 к 104), можно разделить электронное и ядерное движение. В хорошем приближении можно разделить также колебательное и вращательное движение ядерного скелета молекулы. В этом случае оказывается возможным записать три уравнения вида (1.1) для ядерного колебательного, ядерного вращательного и электронного движений. Нас будет интересовать только первое из них
а Ф,=ev Ф, (1.2)
где нижний индекс v означает принадлежность соответствующей функции или переменной к колебательной [англ. vibrational] составляющей полного движения молекулы.
1.3.1.2. Естественные и нормальные координаты
Для рассмотрения колебательного движения необходимо ввести систему координат, описывающую только относительное смещение ядер. Для N-атомной молекулы можно ввести ЗЛ/-6 таких координат {Qk}, так что каждая их них будет полностью характеризовать смещение ядер относительно равновесных положений в каком-то одном равновесном колебательном состоянии. Данные координаты получили название нормальных координат [6]. Каждая нормальная координата
является линейной функцией совокупности естественных координат молекулы -длин связей, валентных углов и т.д.
При использовании нормальных координат колебательную волновую функцию и колебательную энергию Л/-атомной молекулы можно представить как произвед�