Новый подход к идентификации компонентов сложных смесей органических соединений с использованием газовой хроматографии/масс-спектрометрии тема автореферата и диссертации по химии, 02.00.02 ВАК РФ

Самохин, Андрей Сергеевич АВТОР
кандидата химических наук УЧЕНАЯ СТЕПЕНЬ
Москва МЕСТО ЗАЩИТЫ
2013 ГОД ЗАЩИТЫ
   
02.00.02 КОД ВАК РФ
Диссертация по химии на тему «Новый подход к идентификации компонентов сложных смесей органических соединений с использованием газовой хроматографии/масс-спектрометрии»
 
Автореферат диссертации на тему "Новый подход к идентификации компонентов сложных смесей органических соединений с использованием газовой хроматографии/масс-спектрометрии"

На правах рукописи

005050076

Самохин Андрей Сергеевич

НОВЫЙ ПОДХОД К ИДЕНТИФИКАЦИИ КОМПОНЕНТОВ СЛОЖНЫХ СМЕСЕЙ ОРГАНИЧЕСКИХ СОЕДИНЕНИЙ С ИСПОЛЬЗОВАНИЕМ ГАЗОВОЙ ХРОМАТОГРАФИИ/МАСС-

СПЕКТРОМЕТРИИ

02.00.02 - Аналитическая химия

гшвгшз

Автореферат диссертации на соискание ученой степени кандидата химических наук

Москва - 2013

005050076

Работа выполнена на кафедре аналитической химии Химического факультета Московского государственного университета им. М.В. Ломоносова

Научный руководитель:

Доктор химических наук, профессор Ревельский Игорь Александрович Химический факультет Московского государственного университета им. М.В. Ломоносова

Официальные оппоненты:

Доктор химических наук Бродский Ефим Соломонович Институт проблем экологии и эволюции им. А.Н. Северцова РАН

Доктор физико-математических наук Померанцев Алексей Леонидович Институт химической физики им. H.H. Семенова РАН

Ведущая организация:

Санкт-Петербургский государственный университет

Защита состоится 20 марта 2013 года в 13 ч. 00 мин. в конференц-зале на заседании диссертационного совета Д 002.021.01 при Федеральном государственном бюджетном учреждении науки Институте общей и неорганической химии им. Н.С. Курнакова Российской академии наук (ИОНХ РАН) по адресу: 119991, ГСП-1, г. Москва, Ленинский проспект, д. 31.

С диссертацией можно ознакомиться в библиотеке ИОНХ РАН по адресу: г. Москва, Ленинский проспект, д. 31.

С авторефератом можно ознакомиться на сайте ИОНХ РАН: www.igic.ras.ru. Автореферат разослан 18 февраля 2013 года.

Ученый секретарь диссертационного совета, кандидат химических наук

Н.Б. Генералова

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Идентификация1 следовых количеств неизвестных2 органических соединений, входящих в состав сложных многокомпонентных смесей, является одной из наиболее сложных и важных задач современной аналитической химии. В настоящее время для ее решения главным образом используют метод газовой хроматографии/масс-спектрометрии с электронной ионизацией (ГХУМС(ЭИ)). Данное обстоятельство объясняется высокой чувствительностью и селективностью метода ГХ/МС, а также наличием баз данных масс-спектров ЭИ, использование которых значительно ускоряет и упрощает процедуру идентификации неизвестных органических соединений. Однако вопросу достоверности такой идентификации не уделяется должного внимания. Обычно вещество считается идентифицированным, если значение величины степени совпадения, рассчитанной между экспериментальным масс-спектром и библиотечным масс-спектром соединения, возглавляющего список возможных кандидатов, превышает установленную исследователем границу. Строгое обоснование такого подхода в литературе отсутствует, а влияние условий регистрации масс-спектров (тип масс-анализатора, способ осуществления калибровки прибора и др.) на результаты поиска по базе данных не учитывается.

Целью работы являлась разработка подхода к повышению достоверности идентификации следовых количеств компонентов сложных смесей органических соединений при использовании метода ГХ/МС(ЭИ). Для достижения поставленной цели было необходимо:

о изучить вопрос воспроизводимости масс-спектров ЭИ, представленных в базах данных и полученных экспериментально с помощью масс-спектрометров различных типов;

о провести статистическое исследование интенсивности пика молекулярного

иона в масс-спектрах ЭИ (представленных в соответствующих базах данных); о изучить вопрос достоверности идентификации неизвестных органических соединений, основанной на проведении поиска по базам данных масс-спектров ЭИ с использованием коммерчески доступного программного обеспечения;

1 В настоящей работе под термином «идентификация» понимается отождествление анапита с известным органическим соединением.

2 В настоящей работе под термином «неизвестное соединение» понимается известное органическое соединение, возможность присутствия которого в исследуемом образце априорно не рассматривается исследователем.

о рассмотреть возможность увеличения достоверности идентификации, основанной на сопоставлении экспериментальных масс-спектров неизвестного соединения и возможного кандидата (зарегистрированных при одних и тех же условиях) с помощью метода главных компонент; о рассмотреть возможность применения математических методов для выделения «чистых» и неискаженных масс-спектров соединений, хроматографические профили которых накладываются друг на друга.

Научная новизна. Изучен вопрос воспроизводимости масс-спектров ЭИ, представленных в базах данных и полученных экспериментально с использованием масс-спектрометров различных типов. Показано, что различия между масс-спектрами проявляются в основном не в наборе пиков фрагментных ионов, а в значениях их интенсивностей.

Впервые определено распределение органических соединений в зависимости от интенсивности пика молекулярного иона в масс-спектрах ЭИ (представленных в соответствующих базах данных). Установлено, что относительная интенсивность пика молекулярного иона в масс-спектрах ЭИ не превышает 1% для порядка четверти органических соединений.

Изучен вопрос достоверности идентификации неизвестных органических соединений, основанной на проведении поиска по базам данных масс-спектров ЭИ (с использованием компьютерной программы MS Search). Показано, что в общем случае результаты библиотечного поиска являются ориентировочными.

Показана возможность использования метода главных компонент для дифференциации (основанной на рассмотрении только масс-спектральных данных) следовых количеств органических соединений (о-, м-, я-диметилбензола), обладающих практически идентичными масс-спектрами ЭИ.

Предложен подход, позволяющий значительно повысить достоверность идентификации следовых количеств неизвестных органических соединений при использовании метода ГХ/МС(ЭИ). Подход основан на выборе наиболее вероятного кандидата с помощью баз данных масс-спектров ЭИ (и индексов удерживания) и последующем сопоставлении экспериментальных масс-спектров неизвестного и предполагаемого соединений (зарегистрированных при одних и тех же условиях) с помощью метода главных компонент и /-критерия Стьюдента.

Практическая значимость. Рассмотрена возможность использования коммерческих баз данных масс-спеюров ЭИ для проведения достоверной идентификации неизвестных органических соединений. Показано, что результаты библиотечного поиска следует рассматривать как ориентировочные.

Показана возможность значительного увеличения достоверности идентификации следовых количеств аналитов, основанной на сопоставлении экспериментальных масс-спектров ЭИ неизвестного соединения и возможного кандидата (зарегистрированных при одних и тех же условиях) при совместном использовании метода главных компонент и Меритерия Стьюдента. Практическое применение предложенного подхода особенно целесообразно в тех случаях, когда необходима высокая достоверность идентификации (например, в судебной химии).

Рассмотрена возможность извлечения «чистых» и неискаженных масс-спектров ЭИ органических соединений, хроматографические профили которых накладываются друг на друга, с использованием различных подходов (метода «вычитания фона», прокрустова анализа) и ряда компьютерных программ (AMDIS, ChromaTOF). Полученные результаты имеют особое значение в случае анализа следовых количеств аналитов и показывают, что при наличии общих значений m/z в масс-спектрах коэлюируемых соединений и высоком содержании мешающего компонента только прокрустов анализ позволяет выделить неискаженные масс-спектры.

Положения, выносимые на защиту.

о Результаты исследования, посвященного межприборной воспроизводимости масс-спектров ЭИ и ее влиянию на достоверность идентификации неизвестных органических соединений, о Результаты статистического исследования интенсивности пика молекулярного иона в масс-спектрах ЭИ (представленных в соответствующих базах данных), показывающие, что для порядка четверти органических соединений интенсивность пика молекулярного иона в масс-спектрах ЭИ не превышает 1%. о Результаты, полученные при изучении вопроса достоверности идентификации неизвестных органических соединений, основанной на использовании баз данных масс-спектров ЭИ, и показывающие невысокую достоверность библиотечного поиска, о Новый подход к достоверному сопоставлению масс-спектров (зарегистрированных при одних и тех же условиях), основанный на совместном использовании метода главных компонент и ¿-критерия Стьюдента и позволяющий значительно увеличить достоверность идентификации в случае использования метода ГХ/МС(ЭИ). о Результаты сопоставления ряда программ и математических подходов, предназначенных для выделения «чистых» масс-спектров соединений, хроматографические пики которых разделены неполностью.

Вклад автора состоит в проведении всего объема экспериментальных исследований, обработке данных, интерпретации и обобщении полученных результатов.

Апробация работы. Результаты работы были представлены на III Всероссийской конференции «Масс-спекгрометрия и ее прикладные проблемы» (Москва, 2009), на VII Международном зимнем симпозиуме по хемометрике «Modern Methods of Data Analysis» (Санкт-Петербург, 2010), на IV Всероссийской конференции «Фундаментальные вопросы масс-спектрометрии и ее аналитические применения» (Звенигород, 2010), на IV Всероссийской конференции «Масс-спектрометрия и ее прикладные проблемы» (Москва, 2011), на Международной конференции «Conferentia Chemometrica 2011» (Шюмег, Венгрия, 2011), на VIII Международном зимнем симпозиуме по хемометрике «Modern Methods of Data Analysis» (Дракино, 2012), на XIII Международной конференции «Chemometrics in Analytical Chemistry» (Будапешт, Венгрия, 2012), на Всероссийской конференции по аналитической спектроскопии (Краснодар, 2012) и на XIII Международной конференции «European Meeting on Environmental Chemistry» (Москва, 2012).

Публикации. По материалам диссертации опубликовано 7 статей (в рецензируемых журналах) и 12 тезисов докладов.

Структура и объем работы. Диссертация состоит из введения, пяти глав, заключения, выводов и списка литературы. Во введении отражена актуальность темы работы, сформулирована цель, научная новизна, практическая значимость и положения, выносимые на защиту. В первой главе рассмотрены основные подходы к идентификации следовых количеств органических веществ, описанные в литературе и основанные на использовании метода ГХ/МС. Во второй главе описано используемое оборудование, исходные вещества и техника эксперимента. В третьей главе рассмотрена возможность проведения достоверной идентификации неизвестных соединений, основанной на поиске по базам данных масс-спектров ЭИ. В четвертой главе рассмотрена возможность использования метода главных компонент для сравнения масс-спектров, зарегистрированных при одних и тех же условиях. В пятой главе проведено сопоставление подходов, предназначенных для выделения «чистых» масс-спектров коэлюируемых соединений. Работа изложена на 108 страницах, содержит 31 рисунок и 23 таблицы. Список литературы содержит 157 источников.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Оборудование, исходные вещества. техника эксперимента. При проведении анализа использовали ряд приборов:

о времяпролетный масс-спектрометр низкого разрешения «TruTOF HT» (Leco), соединенный с газовым хроматографом «Agilent 7890А» (Agilent Technologies); о времяпролетный масс-спектрометр низкого разрешения «Pegasus HT» (Leco), соединенный с газовым хроматографом «Agilent 7890А» (Agilent Technologies); о квадрупольный масс-спектрометр «Trace DSQ» (Thermo Electron), соединенный

с газовым хроматографом «Trace GC ultra» (Thermo Electron); о масс-спектрометр типа ионная ловушка «PolarisQ» (Thermo Electron) с внешним источником ионизации, соединенный с газовым хроматографом «Trace GC ultra» (Thermo Electron).

Разделение проводили на капиллярных хроматографических колонках с неполярной (100%-диметилполисилоксан) или слабополярной (5%-фенил, 95%-диметилполисилоксан) неподвижной фазой. Длина хроматографических колонок составляла 10-30 м, внутренний диаметр - 0,1-0,32 мм, толщина пленки неподвижной фазы - 0,1-0,25 мкм. В качестве газа-носителя использовали гелий марки А (99.95%) или гелий марки 60 (99.9999%). Скорость потока составляла 0,51,5 мл мин-1. Температура источника ионов в большинстве случаев была равна 250 °С. Энергия ионизирующих электронов составляла 70 эВ. Скорость сканирования составляла 1-3 спектров с-1 в случае квадрупольного масс-спектрометра и масс-спектрометра типа ионная ловушка и 5-20 спектров с-1 в случае времяпролетных масс-спектрометров.

Для обработки (и моделирования) данных использовали следующее программное обеспечение: MS Search 2.0g (NIST), ChromaTOF 4.32 (Leco), AMDIS 2.70 (NIST), Quai Browser 2.0 (Thermo Fisher), Maple 13 (Maplesoft), Microsoft Excel 2007 (Microsoft Corporation), надстройку Chemometrics Add-In для программы Microsoft Excel (авторы надстройки - A.JI. Померанцев и O.E. Родионова), a также ряд компьютерных программ, написанных нами на языке программирования С.

При анализе растворов модельных соединений в хроматографическую колонку вводили 0,1-1,3 нг каждого аналита. В работе использовали ряд растворов модельных соединений и образец фармацевтического препарата:

о модельная смесь 10 органических соединений (1-октанол, н-ундекан, 2,6-диметилфенол, метиловый эфир октановой кислоты, 2,6-диметиланилин, нафталин, и-додекан, 1-деканол, н-тридекан и метиловый эфир декановой кислоты) в н-гексане (тестовая смесь №31, Chrompack);

о индивидуальные растворы о-, м-, и-диметилфенола и этилбензола (PolyScience

Corporation) в н-гексане; о индивидуальные растворы 2,4- и 2,5-диметилфенола (PolyScience Corporation) в н-гексане;

о модельная смесь 1-октанола, 1-нонанола, 1-деканола, 1-ундеканола,

1-додеканола, 1-тетрадеканола (PolyScience Corporation) в н-гексане; о модельная смесь 64 соединений, используемая в методике ЕРА-8270; о фармацевтический препарат Ксеникал (Roche).

Различие между масс-спектрами ЭИ, зарегистрированными в неидентичных условиях. Известно, что условия регистрации (тип масс-анализатора, способ ввода пробы, загрязненность источника ионов и ионной оптики и др.) могут оказывать влияние на вид масс-спектра ЭИ и, как следствие, на результаты библиотечного поиска. К сожалению, публикации, посвященные данной проблеме, в литературе практически отсутствуют. В связи с этим нами было проведено комплексное сопоставление масс-спектров ЭИ, зарегистрированных в неидентичных условиях. Были рассмотрены масс-спектры как полученные нами, так и представленные в базах данных OCAD и NIST'08.

Модельная смесь 10 органических соединений (1-октанол, н-ундекан, 2,6-диметилфенол, метиловый эфир октановой кислоты, 2,6-диметиланилин, нафталин, н-додекан, 1-деканол, н-тридекан и метиловый эфир декановой кислоты) была проанализирована 5 раз на трех различных хромато-масс-спектрометрах (времяпролетном, квадрупольном и ионной ловушке). В хроматографическую колонку было введено порядка 1,3 нг каждого из указанных аналитов. Очищенные масс-спектры были выделены с помощью программы AMDIS. В качестве примера на Рис. 1 представлены масс-спектры 1-октанола, 2,6-диметилфенола, н-додекана и метилового эфира декановой кислоты. Как видно из Рис. 1, масс-спектры, зарегистрированные с помощью квадрупольного и времяпролетного приборов, весьма похожи и могут отличаться от спектров, зарегистрированных с помощью ионной ловушки. Различие в масс-спектрах проявляется не в наборе интенсивных пиков фрагментных ионов, а в значениях их интенсивностей. Например, масс-спектры метиловых эфиров органических кислот, зарегистрированные с помощью ионной ловушки, характеризуются более высокими интенсивностями пиков ионов [M - CnH2n+i]+ (по сравнению с квадрупольным и времяпролетным приборами). В случае ароматических соединений и ациклических предельных углеводородов визуальные различия между масс-спектрами, зарегистрированными на приборах различных типов, практически отсутствуют.

1СЮ

50-

100 6&

1С» ЗУ

10050-

50 60 70 аз 90 100 110 m/z

100 50-

100 50

100 50

J 93 112126 170

J 97 112126

Q

J 96 112 127141 170

50 80 110 140 170

10050-

143

50 80 110 140 170 200

Рис. 1. Масс-спектры 1-октанола (а), 2,6-диметилфенола (б), н-додекана (в) и метилового эфира декановой кислоты (г), зарегистрированные с помощью времяпролетного (ТОР), квадрупольного (<3) масс-спектрометров и масс-спектрометра типа ионная ловушка (ІТ). В хроматографическую колонку было введено порядка 1,3 нг анапитов.

Каждый экспериментальный масс-спектр был использован для проведения поиска по базе данных масс-спектров3 NIST'05 (поиск осуществляли с помощью программного обеспечения MS Search). Средние значения величины степени совпадения Match4 (п = 5) представлены в Табл.1. В случае времяпролетного и квадрупольного приборов для каждого компонента смеси были получены приемлемые результаты (заданное соединение занимало первую или вторую позицию

3 Поиск по базе данных заключается в расчете величины степени совпадения между экспериментальным и библиотечными масс-спектрами и ранжировании веществ-кандидатов в порядке уменьшения данной величины.

4 Величина степени совпадения Match (рассчитанная с использованием алгоритма «Identity», реализованного в программном обеспечении MS Search) представляет собой сумму двух слагаемых. Первое слагаемое отражает степень «похожести» масс-спектров, рассчитанную по оптимизированному методу скалярного произведения (координаты вектора в /^-мерном пространстве задаются как: *JT^>m2, где т - определенное значение m/z, 1„ - интенсивность соответствующего

масс-спектрального пика). При расчете второго слагаемого учитывается различие в отношениях интенсивностей соседних пиков в рассматриваемом масс-спектре и масс-спектре сравнения. Величина степени совпадения Match может изменяться в диапазоне от 0 (когда масс-спектры не содержат общих значений m/z) до 999 (когда масс-спектры полностью совпадают).

в списке возможных кандидатов; средние значения величины Match находились в диапазоне 916-960). В случае ионной ловушки только ароматические соединения одновременно характеризовались как высоким значением величины Match (более 900), так и первой (или второй) позицией в списке возможных кандидатов. Для ациклических предельных углеводородов и первичных спиртов неудовлетворительный результат (заданное соединение не входило в список первых 10 кандидатов) мог быть объяснен невысокой «уникальностью» масс-спектров (молекулярные ионы не были зарегистрированы, а значения m/z фрагментных ионов характерны для большого числа органических соединений).

Табл. 1. Средние значения величины степени совпадения Match (п = 5), полученные при сравнении экспериментальных и библиотечных (NIST'05) масс-спектров. В скобках указаны значения стандартного отклонения.

Название соединения Величина степени совпадения Match

Времяпролетный масс-спектрометр Квадрупольный масс-спектрометр Масс-с пектрометр типа ионная ловушка

1-октанол 952 (6) 942 (6) 723 (16)**

н-ундекан 930 (3) 938(11) 826 (8)***

2,6-диметилфенол 953 (4)* 940(11)* 908 (6)*

метиловый эфир октановой кислоты 932 (9) 916(10) 790 (8)

2,6-диметиланилин 960 (2) 952 (6) 921 (9)*

нафталин 954(1) 959 (4)* 918(5)*

н-додекан 935 (7) 946 (6) 815(6)**

1-деканол 934 (9) 927 (9) 773(16)**

н-тридекан 923 (6) 947 (7) 826 (9)**

метиловый эфир декановой кислоты 926 (2) 922 (9) 780 (9)

* заданное соединение в ряде случаев занимало вторую позицию в списке возможных кандидатов, что объяснялось похожестью масс-спектров веществ кандидатов: (2,6-диметилфенол, 2,3-диметилфенол, 2,5-диметилфенол), (2,6-диметиланилин, 2,3-диметиланилин, 2,5-диметиланилин), (нафталин, азулен);

** заданное соединение не входило в список первых 10 веществ-кандидатов; *** заданное соединение не входило в список первых 5 веществ-кандидатов.

Также нами был рассмотрен ряд масс-спектров, представленных в базах данных КГІБТ'ОЯ (подбиблиотека герИЬ5) и ОСАБ у.86. Нами были выбраны соединения, для которых в базах данных было представлено наибольшее число масс-спектров. В случае базы данных ОСАЭ были рассмотрены 128 соединений (для каждого из

5 В случае базы данных М8Т масс-спектры представлены в двух подбиблиотеках: таіпІіЬ и герИЬ. Подбиблиотека таіпІіЬ является основной и содержит только по одному масс-спектру для каждого соединения. Подбиблиотека герИЬ содержит дополнительные масс-спектры соединений, уже представленных в таіпІіЬ.

6 ОСЛО является базой данных Организации по запрещению химического оружия.

которых было представлено как минимум 3 масс-спектра). В случае базы данных NIST'08 были рассмотрены 358 соединений (для каждого из которых в базе данных содержалось как минимум 4 масс-спектра). Общее число рассматриваемых масс-спектров составило 430 для базы данных OCAD и 1485 для базы данных NIST'08.

Библиотечные масс-спектры, отвечающие одному и тому же соединению, различались в основном интенсивностями отдельных масс-спектральных пиков (тогда как набор значений m/z практически не менялся). При этом, чем дальше два масс-спектральных пика отстояли друг от друга, тем сильнее могло меняться их отношение в масс-спектрах, зарегистрированных в неидентичных условиях. Например, для соседних масс-спектральных пиков (Дm/z = 1) вероятность того, что отношение 7(i) /7<i>

m/z / m/z+Am/z « s г\ /

(2) . 2)- превысит 1,5, составляла всего 6%; однако, если расстояние между

^mil / *mh+Amíi

рассматриваемыми пиками превышало 100 единиц шкалы m/z, то эта вероятность возрастала до 39%.

Интенсивность пика молекулярного иона в масс-спектрах ЭИ. Молекулярный ион является наиболее значимым ионом в масс-спектрах ЭИ органических соединений. Наличие пика молекулярного иона позволяет определить молекулярную массу неизвестного соединения и увеличивает достоверность идентификации. Общепринято, что отсутствие пика молекулярного иона в масс-спектрах ЭИ снижает достоверность идентификации неизвестных соединений, основанной на библиотечном поиске. В соответствии с результатами, полученными группой профессора Амирава7, порядка 30% соединений (из базы данных NIST'93) имеют малоинтенсивный (менее 1%) пик молекулярного иона в соответствующих масс-спектрах ЭИ. Насколько нам известно, эти данные не были подтверждены другими исследователями, а более подробная информация в литературе не представлена. В связи с этим нами было проведено статистическое исследование, целью которого являлось определение распределения органических соединений в зависимости от интенсивности пика молекулярного иона в масс-спектрах ЭИ. В работе было рассмотрено порядка 187000 соединений из базы данных масс-спектров NIST'08 и около 182000 соединений из базы данных масс-спектров Wiley 8th.

На Рис. 2 представлено распределение органических соединений в зависимости от интенсивности пика молекулярного иона (/[м]), нормированной на основной пик. Распределения, полученные для соединений, представленных в базах данных NIST'08 и Wiley 8th, весьма близки (в случае интегрального распределения различие не

7 Информация об интенсивности пика молекулярного иона получена в рамках кандидатской диссертации (DaganS. Mass spectrometry in supersonic molecular beams, PhD Thesis. Tel-Aviv University. 1996) и представлена на сайте: http://www.tau.ac.il/chemistry/amirav/smbms.shtml.

превышает 5%). Только порядка 26% соединений характеризуются интенсивным пиком молекулярного иона (7[М] > 50%). При этом пик молекулярного иона является основным пиком в масс-спектрах 14% соединений. Пик молекулярного иона малоинтенсивен или вообще отсутствует (/[м] <1%) в случае порядка 24% соединений.

Рис. 2. Дифференциальное (а) и интегральное (б) распределения органических соединений в зависимости от интенсивности пика молекулярного иона (нормированной на основной пик).

Возможность достоверной идентификации неизвестных соединений. основанной на поиске по базам данных масс-спектров ЭИ. Несмотря на широкое использование баз данных масс-спектров ЭИ и программ библиотечного поиска, на сегодняшний день не предложены граничные значения величины степени совпадения (ни для одного алгоритма библиотечного поиска), позволяющие говорить о достоверной идентификации неизвестного соединения. В связи с этим вещество считается идентифицированным, если значение величины степени совпадения для первого соединения в списке возможных кандидатов превышает установленную исследователем границу. Пороговое значение величины степени совпадения, используемое различными авторами, может изменяться в широких пределах, однако какое-либо обоснование выбора именно такого значения, как правило, отсутствует. Нами была поставлена цель - оценить надежность идентификации неизвестных соединений, основанной на проведении поиска по коммерческим базам данных масс-спектров ЭИ.

Из базы данных NIST'08 нами были выбраны 45 соединений, для каждого из которых в подбиблиотеке replib было представлено 5, 6 или 7 масс-спектров ЭИ. Общее число рассматриваемых масс-спектров составило 230. Каждый из масс-спектров был использован для проведения поиска по базе данных NIST'08 (подбиблиотека mainlib), поиск осуществляли с помощью программного обеспечения MS Search. В каждом случае во внимание принимали позицию заданного соединения в списке возможных кандидатов, значение величины Match, рассчитанное для заданного соединения, а также значение величины Match, рассчитанное для соединения, занимающего вторую (или первую в случае неправильной

0 10 20 30 40 50 60 70 80 90 100 Интенсивность пика молекулярного иона, %

0 10 20 30 40 50 60 70 80 90 100 Интенсивность пика молекулярного иона, %

идентификации) строчку в списке возможных кандидатов. Исходя из полученных данных, нами были определены величины ошибок первого и второго рода8 в зависимости от значения величины степени совпадения (Match), выбранного в качестве порогового (Табл. 2). Высокая величина ошибки первого рода для низких пороговых значений величины Match (ниже 850) объясняется тем, что заданное соединение не возглавляло список возможных кандидатов в 18,1% случаев. Как видно из Табл. 2, в общем случае (когда заранее неизвестно, присутствует ли масс-спектр исследуемого соединения в базе данных) вне зависимости от значения величины Match, выбранного в качестве порогового, вероятность неверной идентификации (ложноположительной или ложноотрицателыюй) превышает 40%.

Табл. 2. Величины ошибок первого и второго рода, возникающих при идентификации неизвестных соединений с использованием поиска по базам данных масс-спектров ЭИ, в зависимости от значения величины степени совпадения (Match), выбранного исследователем в качестве граничного.

Пороговое значение Match Ошибка I рода Ошибка II рода* Ошибка II рода**

950 94,9 1,7 1,7

900 43,5 8,4 18,6

850 22,4 14,8 46,8

800 19,8 17,3 67,1

750 19,4 17,7 78,1

700 18,6 18,1 89,9

* величина ошибки II рода была рассчитана для случая, когда заданное соединение присутствует в базе данных масс-спектров;

** величина ошибки II рода была рассчитана для случая, когда заданное соединение отсутствует в базе данных масс-спектров.

Надежное сопоставление масс-спектров (зарегистрированных при одних и тех же условиях), основанное на совместном использовании метода главных компонент и критерия Стыодента. На основании представленных выше данных можно заключить, что идентификация, основанная на использовании баз данных масс-спектров ЭИ, в общем случае носит предположительный характер. В ряде случаев учет библиотечных (или расчетных) индексов удерживания может увеличить надежность идентификации. Однако в случае метода ГХ/МС наивысшая надежность идентификации может быть достигнута только при проведении анализа неизвестного и предполагаемого соединений в одних и тех же условиях и сопоставлении экспериментально полученных времен удерживания и масс-спектров ЭИ. Времена удерживания являются одномерными аналитическими сигналами, поэтому их сравнение не вызывает трудностей. В свою очередь, масс-спектры ЭИ - многомерны,

8 Ошибка первого рода имеет место в случае ложноотрицательной идентификации, ошибка второго рода - в случае ложноположительной идентификации.

и их сравнение является более сложной задачей. В практике химического анализа для сопоставления масс-спектров (зарегистрированных при одних и тех же условиях) обычно используют всего два подхода, однако оба подхода имеют весьма серьезные ограничения.

о Визуальное сравнение масс-спектров необъективно и не позволяет оценить

«похожесть» масс-спектров количественно, о Сравнение интенсивностей отдельных масс-спектральных пиков используется при проведении идентификации предполагаемых соединений9. Однако во внимание принимаются только несколько значений m/z (обычно три). Нами был предложен подход к надежному сопоставлению масс-спектров (зарегистрированных при одних и тех же условиях), основанный на совместном использовании метода главных компонент и /-критерия Стьюдента. Краткое описание подхода представлено ниже. Несколько параллельных масс-спектров, отвечающих предположительно двум различным соединениям, должны быть зарегистрированы при одних и тех же экспериментальных условиях. Каждый масс-спектр (нормированный на основной пик) должен быть представлен в виде вектора-строки. Матрица, образованная путем объединения соответствующих векторов, должна быть центрирована и проанализирована с помощью метода главных компонент10.

Если масс-спектры отвечают разным соединениям, то первая главная компонента должна разделить объекты (то есть масс-спектры) на две группы. Если масс-спектры отвечают одному и тому же соединению, то различия между объектами обусловлены случайными факторами, скрытая структура данных отсутствует, а все главные компоненты (включая первую) содержат только шум. В результате при сопоставлении масс-спектров можно использовать значения только первой главной компоненты. Предполагая, что интенсивности масс-спектральных пиков подчиняются нормальному распределению, можно показать, что первая главная компонента

9 Данный способ сравнения спектров описан в ряде нормативных документов:

о Commission Decision 2002/657/ЕС of 12 August 2002, Official journal of the European

Communities 2002, L221, 8-36. о Guidance for industry: mass spectrometry for confirmation of the identity of animal drug residues:

final guidance. FDA, Washington, 2003. о WADA Technical Document - TD201OIDCR, 2011.

10 Матрица размером К * N может быть представлена в виде /Сточек в пространстве размерностью N. Основная идея метода главных компонент заключается в переходе к новой системе координат, оси которой получили название главных компонент. Вначале, как правило, проводят центрирование исходной матрицы, графическая интерпретация которого заключается в смещении начала координат ^-мерного пространства в центр облака данных. Затем определяют направление наибольшего изменения данных. Это направление и является осью первой главной компоненты. Каждая следующая главная компонента выбирается с тем расчетом, чтобы она была ортогональна уже выбранным главным компонентам и также определяла направление наибольшего изменения данных.

распределена нормально. Таким образом, для сравнения значений первой главной компоненты может быть использован ¿-критерий Стьюдента.

£ Л- 100-äö

ян

66 77

..Ц . ... Ill .

106

І-.

70 90 m/z

1CD-Э0-O

51

-fv

50

63

77

106

I

70 90 m/z

looser 0-

51

63 77

■■■I i. , ■■-In-.

106

70 90 m/z

110

Рис. 3. Масс-спектры ЭИ о-диметилбензола (а), .и-диметилбензола (б) и л-диметилбензола (в), зарегистрированные в идентичных условиях с помощью времяпролетного масс-спектрометра. В хроматографическую колонку было введено около 1 нг аналитов.

Возможность использования предложенного подхода для нахождения различий между практически идентичными масс-спектрами была показана на примере нескольких групп органических соединений: о о-, м-, л-диметилбензол и этилбензол;

о 1-октанол, 1-нонанол, 1-деканол, 1-ундеканол, 1-додеканол и 1-тетрадеканол; о бенз[Ь]флуорантен, бенз[к]флуорантен и бенз[а]пирен. Для каждой пары соединений, принадлежащих одной и той же группе, было найдено статистически значимое различие между соответствующими масс-спектрами (даже для доверительной вероятности Р = 99,9%). В качестве примера на Рис. 3 представлены масс-спектры о-, м-, и-диметилбензола, зарегистрированные при одних и тех же условиях с использованием времяпролетного масс-спектрометра. Как видно из Рис. 3, спектры содержат один и тот же набор пиков и визуально не отличаются друг от друга. Результаты сопоставления масс-спектров с использованием метода главных компонент и t-критерия Стьюдента обобщены в Табл. 3.

Табл. 3. Рассчитанные для каждой пары соединений значения коэффициента Стьюдента (л, = л2 = 5). Табличное значение коэффициента Стьюдента: 1щ,т (Р = 99,9 %;/= 8) = 5,0.

о-диметилбензол л<-диметилбензол л-диметилбензол

о-диметилбензол - 16 12

.и-диметилбензол 16 - 10

л-диметилбензол 12 10 -

Возможность достоверной идентификации следовых количеств неизвестных органических соединений с помощью метода ГХ/МСОИ). Предложенный нами подход к сопоставлению масс-спектров может быть использован для повышения достоверности идентификации следовых количеств неизвестных соединений, когда заключительным этапом является анализ неизвестного и предполагаемого соединений

методом ГХ/МС(ЭИ) в идентичных экспериментальных условиях. Раствор 2,4-диметилфенола (концентрацией ОДнгмкл-1) был рассмотрен нами в качестве «неизвестного»11 образца, а хроматографический пик 2,4-диметилфенола - в качестве пика «неизвестного» соединения, идентификацию которого нужно было провести.

100"

П Л

5 х

s s

У и

О I

X <и

65 jfdJbr

50 60 70 80 90 100 110 120

m/z

Рис. 4. Масс-спектры ЭИ «неизвестного» соединения (а) и 2,5-диметилфенола (б), зарегистрированные в идентичных условиях при использовании времяпролетного масс-спектрометра.

«Неизвестное» соединение было охарактеризовано масс-спектром ЭИ (Рис. 4-а) и индексом удерживания (Л/«„еИзвестное» соед. ~ 1155), которые были использованы для поиска по соответствующим базам данных. По результатам поиска наиболее вероятным кандидатом являлся 2,5-диметилфенол (Л/г.з-димспифеиол ~ 115212). Раствор 2,5-диметилфенола (концентрацией ОДнгмкл-1) и «неизвестный» образец были проанализированы при одних и тех же экспериментальных условиях. Разница между временами удерживания «неизвестного» и предполагаемого соединения составила всего 0,15 с (или 0,06%). Визуальное различие между зарегистрированными масс-спектрами ЭИ отсутствовало (Рис. 4). Исходя из полученных данных, можно было бы сделать обоснованный вывод, что «неизвестное» соединение является 2,5-диметилфенолом, однако это была бы ошибочная идентификация.

Чтобы увеличить надежность идентификации, три параллельных масс-спектра «неизвестного» соединения и 2,5-диметилфенола были зарегистрированы в идентичных условиях и сопоставлены с помощью метода главных компонент и ¿-критерия Стьюдента. График счетов для первой и второй главных компонент представлен на Рис. 5-а. Объекты, отвечающие масс-спектрам «неизвестного» соединения и возможного кандидата, разделены первой главной компонентой. Рассчитанное значение коэффициента Стьюдента было равно 36 и значительно превышало табличное значение tKfnlT.(P= 99,9%;/= 4) = 8,6. Наличие статистически значимого различия между масс-спектрами «неизвестного» соединения и возможного кандидата позволило избежать проведения ошибочной идентификации.

В данном случае термин «неизвестный» написан в кавычках, поскольку в исследовании использовали раствор, известного нам состава.

12 Представленный индекс удерживания был экспериментально получен в следующей работе: MjosS.A., MeierS., BoitsovS. Alkylphenol retention indices,//J. Chromatogr. A. 2006. Vol. 1123.N 1. 98105.

гк

а

гк

б

о

гк

-го—-г-

-8 0 -4

4

8

-2 -1

2,

о

-1

о

-1 -

-2

• «неизвестное» соединение

о 2,5-Диметилфенол

• «неизвестное» соединение о 2,4-диметилфенол

Рис. 5. Графики счетов для первой и второй главных компонент, полученные в процессе сравнения

масс-спектров «неизвестного» соединения с масс-спектрами 2,5-диметилфенола (а) и 2,4-диметилфенола (б). Каждая точка на графике представляет собой масс-спектр. ГК, и ГК2 - оси первой и второй главной компоненты. Высоты хроматографических пиков «неизвестного» соединения и предполагаемого кандидата были приблизительно равны.

После исключения 2,5-диметилфенола из рассмотрения наиболее вероятным кандидатом стал 2,4-диметилфенол (Л/2,4-диметилфенол ~ 1150). Масс-спектры «неизвестного» соединения и 2,4-диметилфенола (зарегистрированные при одних и тех же условиях) были сопоставлены с использованием описанного выше подхода. График счетов для первой и второй главных компонент представлен на Рис. 5-6. В данном случае табличное значение коэффициента Стьюдента 'крит.СР= 95%;/= 4) = 2,8 превышало рассчитанное (i;=l,0), исходя из чего был сделан вывод о том, что «неизвестное» соединение является 2,4-диметилфенолом.

В процессе проведения данного исследования было установлено, что масс-спектры ЭИ, зарегистрированные для разных количеств аналита, могут статистически значимо отличаться друг от друга. В связи с этим при использовании данного подхода к сопоставлению масс-спектров в реальной практике необходимо подбирать концентрации растворов таким образом, чтобы высоты хроматографических пиков неизвестного и предполагаемого соединений были приблизительно одинаковыми.

На заключительном этапе исследования нами была рассмотрена возможность увеличения надежности идентификации неизвестного соединения при анализе реального объекта. В качестве объекта исследования был выбран фармацевтический препарат Ксеникал. Один из компонентов, зарегистрированных в процессе анализа, был идентифицирован с использованием базы данных масс-спектров NIST'08 как 1-додеканол. Для увеличения надежности идентификации образец фармацевтического препарата и модельный раствор 1-додеканола были проанализированы при одних тех же экспериментальных условиях, а зарегистрированные масс-спектры были сопоставлены с помощью метода главных компонент и /-критерия Стьюдента. Статистически значимое различие между масс-спектрами обнаружено не было

(?„,„,(Р = 95%;/= 4) = 2,8 > £ = 1,9).

Предложенный нами подход к сопоставлению масс-спектров (основанный на совместном использовании метода главных компонент и г-критерия Стьюдента) позволяет значительно увеличить надежность идентификации следовых количеств аналитов в случае проведения анализа неизвестного соединения и предполагаемого кандидата (выбранного, например, на основании библиотечного поиска) методом ГХ/МС(ЭИ) в идентичных условиях.

Использование математических подходов для выделения «чистых» масс-спектров. Возможности метода ГХ/МС позволяют за один анализ проводить разделение и определение более 100 соединений. Однако при работе со сложными многокомпонентными смесями возможно наложение пиков исследуемых веществ друг на друга или на мешающие компоненты матрицы, что может затруднить процедуру идентификации неизвестных соединений. В связи с этим одной из актуальных задач является разработка математических подходов, позволяющих проводить выделение «чистых» масс-спектров соединений, хроматографические профили которых разделены неполностью.

При наложении хроматографических пиков соединений, масс-спектры которых не содержат общих значений m/z, выделение «чистых» и неискаженных масс-спектров обычно не представляет сложностей. Гораздо сложнее провести очистку масс-спектров, содержащих большое число общих значений m/z. При использовании алгоритмов библиотечного поиска небольшое искажение интенсивностей масс-спектральных пиков не приведет к существенному изменению величины степени совпадения. Однако в случае сравнения масс-спектров с использованием метода главных компонент даже незначительные ошибки на стадии выделения «чистых» масс-спектров могут привести к неправильной идентификации.

В связи с этим нами была рассмотрена возможность выделения «чистых» и неискаженных масс-спектров коэлюируемых соединений с помощью метода «вычитания фона»13, при использовании прокрустова анализа14, а также с помощью коммерческих компьютерных программ AMDIS и ChromaTOF, предназначенных для

13 Данный метод заключается в вычитании из масс-спектра, зарегистрированного в максимуме хроматографического пика, усредненного масс-спектра близлежащей области хроматограммы. Обычно этот подход используют для исключения из экспериментального масс-спектра значений m/z, отвечающих фону прибора, однако в ряде случаев он может быть успешно применен для очистки масс-спектров коэлюируемых соединений.

14 Прокрустов анализ основан на использовании метода главных компонент, позволяющего провести разложение матрицы, содержащей хромато-масс-спектральные данные, на матрицу счетов и матрицу нагрузок. Линейное преобразование (масштабирование и вращение) матрицы нагрузок позволяет перейти к матрице «чистых» масс-спектров (однако для этого нужно обладать информацией о направлении осей чистых соединений в пространстве главных компонент). В настоящей работе элементы матрицы перехода рассчитывали, используя априорную информацию о характеристичных значениях m/z коэлюируемых соединений.

автоматической обработки хромато-масс-спектральных данных. Использование смоделированных хромато-масс-спектральных данных позволило варьировать хроматографическое разрешение компонентов, отношение концентраций компонентов, величину шума, а также число общих значений m/z, присутствующих в масс-спектрах коэлюируемых соединений.

При наличии общих значений m/z в масс-спектрах коэлюируемых соединений только прокрустов анализ позволил во всех случаях выделить совершенно неискаженные масс-спектры, которые не имели статистически значимого различия с исходными спектрами, используемыми при моделировании данных. Метод «вычитания фона» позволил получить приемлемые результаты только при отсутствии общих значений m/z в масс-спектрах коэлюируемых соединений. Масс-спектры, очищенные с помощью программного обеспечения AMDIS, во многих случаях были сильно искажены (масс-спектральные пики, отвечающие общим значения m/z, либо вовсе не были извлечены, либо их интенсивности были извлечены некорректно). В случае программного обеспечения ChromaTOF (при условии, что отношение концентраций компонентов не превышало 10) очищенные масс-спектры визуально не отличались от исходных спектров, используемых при моделировании хромато-масс-спектральных данных (однако использование метода главных компонент в ряде случаев показало наличие статистически значимых различий между очищенными и исходными спектрами).

Нами показано, что прокрустов анализ может быть использован для выделения «чистых» масс-спектров неизвестного соединения и предполагаемого кандидата при проведении их сопоставления с использованием метода главных компонент и /-критерия Стьюдента. Однако для применения данного подхода необходима априорная информация о числе химических компонентов (присутствующих на рассматриваемом фрагменте хроматограммы) и характеристичных значениях m/z коэлюируемых соединений. В реальной практике данная информация может быть получена, например, с помощью программного обеспечения ChromaTOF.

выводы

о Проведено сопоставление масс-спектров ЭИ, зарегистрированных в неидентичных условиях. Показано, что различия между масс-спектрами проявляются в основном не в наборе пиков фрагментных ионов, а в значениях их интенсивностей.

о Впервые определено распределение органических соединений (представленных в базах данных масс-спектров ЭИ) в зависимости от интенсивности пика молекулярного иона. Установлено, что пик молекулярного иона отсутствует в масс-спектрах ЭИ порядка четверти органических соединений (что снижает достоверность результатов библиотечного поиска), о Экспериментально показано, что результаты поиска по базам данных масс-спектров ЭИ следует рассматривать как ориентировочные, поскольку нет однозначной корреляции между величиной степени совпадения и достоверностью идентификации, о Предложен подход, позволяющий значительно увеличить достоверность идентификации следовых количеств аналитов при использовании метода ГХ/МС(ЭИ). Подход основан на выборе наиболее вероятного кандидата с помощью библиотечного поиска и последующем сопоставлении экспериментальных масс-спектров неизвестного и предполагаемого соединений (зарегистрированных при одних и тех же условиях) с помощью метода главных компонент и i-критерия Стьюдента. о Проведено сопоставление ряда математических подходов для выделения «чистых» и неискаженных масс-спектров коэлюируемых соединений. Показано, что при наличии общих значений m/z в масс-спектрах коэлюируемых соединений и высоком содержании мешающего компонента только прокрустов анализ позволяет выделить неискаженные масс-спектры.

СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Самохин А.С., Ревельский И.А. Применение метода главных компонент для выделения «чистых» масс-спектров в газохроматографическом - масс-спектралыюм анализе. // Масс-спектрометрия. 2010. Т. 7. № 2. С. 132-138.

2. Самохин А.С., Ревельский А.И., Чепелянский Д.А., Ревельский И.А. Возможность достоверной идентификации неизвестных соединений при использовании программы MS Search и коммерческой базы данных масс-спектров электронной ионизации. // Масс-спектрометрия. 2011. Т. 8. № 1. С. 65-67.

3. Самохин А.С., Ревельский А.И., Ревельский И.А. Сопоставление масс-спектров электронной ионизации ряда соединений (ММ < 200 Да), зарегистрированных с помощью различных типов масс-спектрометров. // Масс-спектрометрия. 2011. Т. 8. №2. С. 106-110.

4. Samokhin A., Revelsky I. Distinguishing by principal component analysis o-xylene, m-xylene, p-xylene and ethylbenzene using electron ionization mass spectrometry. // Eur. J. Mass Spectrom. 2011. Vol. 17. N 5. P. 477-480.

5. Самохин А.С., Ревельский И.А. Интенсивность пика молекулярного иона в масс-спектрах электронной ионизации. // Масс-спектрометрия. 2012. Т. 9. № 1. С. 58-60.

6. Самохин А.С., Ревельский И.А. Надежное сопоставление масс-спектров, зарегистрированных в идентичных условиях, с помощью метода главных компонент. // Аналитика и контроль. 2012. Т. 16. № 3. С. 269-274.

7. Samokhin A., Revelsky I. Reliable comparison of electron ionization mass spectra recorded under identical experimental conditions. // Spectrosc. Lett. 2013. Vol. 46. N 2. P. 117-121.

8. Самохин А.С., Ревельский А.И., Ревельский И.А. Применение метода главных компонент для выделения «чистых» масс-спектров в ГХ-МС анализе. Тезисы докладов III Всероссийской конференции с международным участием «Масс-спектрометрия и ее прикладные проблемы», 18-22 мая, Москва, 2009. С. 35.

9. Samokhin A.S., Revelsky I.A. Application of principal component analysis for extraction of pure mass spectra from gas chromatography/mass spectrometry data. Book of Abstracts. 7th Winter Symposium on Chemometrics «Modern Methods of Data Analysis». February 15-19, 2010, Saint Petersburg, Russia. P. 37-38.

10. Самохин А.С., Ревельский И.А., Ревельский А.И. Увеличение достоверности идентификации неизвестных соединений при использовании баз данных масс-спектров электронной ионизации. Тезисы докладов Четверной Всероссийской конференции «Фундаментальные вопросы масс-спектрометрии и ее аналитические применения», 10 - 14 октября, Звенигород, 2010. С. 58-59.

11. Самохин А.С., Рыбальченко КВ., Ревельский И.А. Различие между масс-спектрами электронной ионизации, зарегистрированными в неидентичных условиях. Тезисы докладов IV Всероссийской конференции с международным участием «Масс-спектрометрия и ее прикладные проблемы», 5-9 сентября, Москва, 2011.С. 28.

12. Самохин А.С., Ревельский И.А. Статистическое исследование интенсивности пика молекулярного иона в масс-спектрах электронной ионизации. Тезисы докладов IV Всероссийской конференции с международным участием «Масс-спектрометрия и ее прикладные проблемы», 5-9 сентября, Москва, 2011. С. 47.

13. Ревельский И.А., Самохин А.С., Леднева А.В., Чепелянский Д.А., Бурмыкин Д.А., Ревельский А.И. Достоверное установление молекулярной массы — необходимое условие надежной идентификации следов компонентов смесей. Тезисы докладов IV Всероссийской конференции с международным участием «Масс-спектрометрия и ее прикладные проблемы», 5-9 сентября, Москва, 2011.С. 58.

14. Samokhin A.S., Revelsky I.A. Differentiation of electron ionization mass spectra of o-, m-, p-xylene and ethylbenzene using principal component analysis. Book of Abstracts. Conferentia Chemometrica 2011. September 18 - 21, 2011, Sumeg, Hungary. P. P35.

15. Samokhin A.S., Revelsky I.A. Identification of unknown organic compounds based on comparison of electron ionization mass spectra. Book of Abstracts. 8th Winter Symposium on Chemometrics «Modern Methods of Data Analysis». February 27 -March 2, 2012, Drakino, Russia. P. 24-25.

16. Samokhin A.S., Revelsky I.A. Reliable comparison of electron ionization mass spectra of unknown compound and possible candidate registered under the same experimental conditions. Book of Abstracts. XIII Chemometrics in Analytical Chemistry. June 25 - 29, 2012, Budapest, Hungary. P. 90.

17. Самохин А. С., Ревельский И.А. Возможность использования масс-спектров электронной ионизации для проведения достоверной идентификации неизвестных органических соединений. Тезисы докладов Всероссийской конференции по аналитической спектроскопии с международным участием, 23-29 сентября, Краснодар, 2012. С. 205.

18. Samokhin A.S., Revelsky A.I., Revelsky I.A. Absence of spectral skew, high-speed acquisition, automatic peak finding and mass spectra purification as key aspects of non-target GC/MS analysis. Book of Abstracts. 13th European Meeting on Environmental Chemistry. December 5 - 8, 2012, Moscow, Russia. P. 24.

19. Samokhin A.S., Revelsky I.A. Extraction of unbiased mass spectra in case of unresolved chromatographic peaks. Book of Abstracts. 13th European Meeting on Environmental Chemistry. December 5-8, 2012, Moscow, Russia. P. 45.

Автор работы выражает искреннюю благодарность:

о своему научному руководителю И.А. Ревельскому;

о компании Leco за предоставление времяпролетных масс-спектрометров

TruTOF НТ и Pegasus НТ для проведения исследований; о A.B. Гармашу, Э.Д. Вирюсу и А.И. Ревельскому за обсуждение результатов,

представленных в работе; о О.В.Поляковой и А.Т.Лебедеву за предоставление смеси среднелетучих

органических соединений, используемой в работе; о И.В. Рыбальченко за предоставление базы данных OCAD;

о А. Шнайдеру за предоставление образ1(а фармацевтического препарата

Ксеникал, исследуемого в работе; о А. Фиалкову и А. Амираву за предоставление фрагмента кандидатской диссертации С. Дагана.

Заказ № 63-А/02/2013 Подписано в печать 13.02.2013 Тираж 120 экз. Усл. п.л. 1

"Цифровичок", тел. (495) 649-83-30 www.cfr.ru; e-mail: info@cfr.ru

 
Содержание диссертации автор исследовательской работы: кандидата химических наук, Самохин, Андрей Сергеевич

ВВЕДЕНИЕ.

ГЛАВА 1. ИДЕНТИФИКАЦИЯ НЕИЗВЕСТНЫХ ОРГАНИЧЕСКИХ СОЕДИНЕНИЙ, ОСНОВАННАЯ НА ИСПОЛЬЗОВАНИИ МЕТОДА ГАЗОВОЙ ХРОМАТОГРАФИИ/МАСС-СПЕКТРОМЕТРИИ С ЭЛЕКТРОННОЙ ИОНИЗАЦИЕЙ (ЛИТЕРАТУРНЫЙ ОБЗОР).

Что понимают под терминами «идентификация» и «неизвестное соединение».

Подходы к идентификации неизвестных органических соединений.

Интерпретация масс-спектров ЭИ.

Использование смоделированных масс-спектров ЭИ.

Поиск по базе данных масс-спектров ЭИ.

Сопоставление масс-спектров неизвестного соединения и возможного кандидата, зарегистрированных в одних и тех же условиях.

Газохроматографические индексы удерживания.

Выделение «чистых» масс-спектров коэлюируемых соединений.

ГЛАВА 2. ОБОРУДОВАНИЕ, ИСХОДНЫЕ ВЕЩЕСТВА, ТЕХНИКА ЭКСПЕРИМЕНТА.

Оборудование.

Исходные вещества.

Техника эксперимента.

ГЛАВА 3. ДОСТОВЕРНОСТЬ ИДЕНТИФИКАЦИИ НЕИЗВЕСТНЫХ ОРГАНИЧЕСКИХ СОЕДИНЕНИЙ, ОСНОВАННОЙ НА ПОИСКЕ ПО БАЗАМ ДАННЫХ МАСС-СПЕКТРОВ ЭИ.

Различие между масс-спектрами ЭИ, зарегистрированными в неидентичных экспериментальных условиях.

Интенсивность пика молекулярного иона в масс-спектрах ЭИ (представленных в базах данных).

Возможность достоверной идентификации неизвестных соединений, основанной на поиске по базам данных масс-спектров ЭИ.

ГЛАВА 4. СОПОСТАВЛЕНИЕ МАСС-СПЕКТРОВ, ОСНОВАННОЕ НА ИСПОЛЬЗОВАНИИ МЕТОДА ГЛАВНЫХ КОМПОНЕНТ.

Дифференциация органических соединений, обладающих практически идентичными масс-спектрами ЭИ, основанная на использовании метода главных компонент.

Сопоставление масс-спектров, основанное на совместном использовании метода главных компонент и f-критерия Стьюдента

Использование метода главных компонент и i-критерия Стьюдента для надежного сопоставления масс-спектров.

Использование метода главных компонент и f-критерия Стьюдента для достоверной идентификации «неизвестного» соединения.

Минимальное число экспериментов, необходимое для сопоставления масс-спектров с использованием метода главных компонент и f-критерия Стьюдента.

Порядок действий при идентификации неизвестного органического соединения.

Идентификация примеси в фармацевтическом препарате.

ГЛАВА 5. ВЫДЕЛЕНИЕ «ЧИСТЫХ» МАСС-СПЕКТРОВ КОЭЛЮИРУЕМЫХ СОЕДИНЕНИЙ.

Сопоставление возможностей метода «вычитания фона», прокрустова анализа и компьютерных программ AMDIS и ChromaTOF.

Использование прокрустова анализа для выделения «чистых» масс-спектров в случае наличия большого числа общих значений m/z в масс-спектрах коэлюируемых соединений.

 
Введение диссертация по химии, на тему "Новый подход к идентификации компонентов сложных смесей органических соединений с использованием газовой хроматографии/масс-спектрометрии"

Актуальность темы. Идентификация следовых количеств неизвестных органических соединений, входящих в состав сложных многокомпонентных смесей, является одной из наиболее сложных и важных задач современной аналитической химии. В настоящее время для ее решения главным образом используют метод газовой хроматографии/масс-спектрометрии с электронной ионизацией (ГХ/МС(ЭИ)). Данное обстоятельство объясняется высокой чувствительностью и селективностью метода ГХ/МС, а также наличием баз данных масс-спектров ЭИ, использование которых значительно ускоряет и упрощает процедуру идентификации неизвестных органических соединений. Однако вопросу достоверности такой идентификации не уделяется должного внимания. Обычно вещество считается идентифицированным, если значение величины степени совпадения, рассчитанной между экспериментальным масс-спектром и библиотечным масс-спектром соединения, возглавляющего список возможных кандидатов, превышает установленную исследователем границу. Строгое обоснование такого подхода в литературе отсутствует, а влияние условий регистрации масс-спектров (тип масс-анализатора, способ осуществления калибровки прибора и др.) на результаты поиска по базе данных не учитывается.

Целью работы являлась разработка подхода к повышению достоверности идентификации следовых количеств компонентов сложных смесей органических соединений при использовании метода ГХ/МС(ЭИ).

Для достижения поставленной цели было необходимо: о изучить вопрос воспроизводимости масс-спектров ЭИ, представленных в базах данных и полученных экспериментально с помощью масс-спектрометров различных типов; о провести статистическое исследование интенсивности пика молекулярного иона в масс-спектрах ЭИ (представленных в соответствующих базах данных); о изучить вопрос достоверности идентификации неизвестных органических соединений, основанной на проведении поиска по базам данных масс-спектров ЭИ с использованием коммерчески доступного программного обеспечения; о рассмотреть возможность увеличения достоверности идентификации, основанной на сопоставлении экспериментальных масс-спектров неизвестного соединения и возможного кандидата (зарегистрированных при одних и тех же условиях) с помощью метода главных компонент; о рассмотреть возможность применения математических методов для выделения «чистых» и неискаженных масс-спектров соединений, хроматографические профили которых накладываются друг на друга.

Научная новизна. Изучен вопрос воспроизводимости масс-спектров ЭИ, представленных в базах данных и полученных экспериментально с использованием масс-спектрометров различных типов. Показано, что различия между масс-спектрами проявляются в основном не в наборе пиков фрагментных ионов, а в значениях их интенсивностей.

Впервые определено распределение органических соединений в зависимости от интенсивности пика молекулярного иона в масс-спектрах ЭИ (представленных в соответствующих базах данных). Установлено, что относительная интенсивность пика молекулярного иона в масс-спектрах ЭИ не превышает 1% для порядка четверти органических соединений.

Изучен вопрос достоверности идентификации неизвестных органических соединений, основанной на проведении поиска по базам данных масс-спектров ЭИ (с использованием компьютерной программы MS Search). Показано, что в общем случае результаты библиотечного поиска являются ориентировочными.

Показана возможность использования метода главных компонент для дифференциации (основанной на рассмотрении только масс-спектральных данных) следовых количеств органических соединений (о-, м-, /7-диметилбензола), обладающих практически идентичными масс-спектрами ЭИ.

Предложен подход, позволяющий значительно повысить достоверность идентификации следовых количеств неизвестных органических соединений при использовании метода ГХ/МС(ЭИ). Подход основан на выборе наиболее вероятного кандидата с помощью баз данных масс-спектров ЭИ (и индексов удерживания) и последующем сопоставлении экспериментальных масс-спектров неизвестного и предполагаемого соединений (зарегистрированных при одних и тех же условиях) с помощью метода главных компонент и i-критерия Стьюдента.

Практическая значимость. Рассмотрена возможность использования коммерческих баз данных масс-спектров ЭИ для проведения достоверной идентификации неизвестных органических соединений. Показано, что результаты библиотечного поиска следует рассматривать как ориентировочные.

Показана возможность значительного увеличения достоверности идентификации следовых количеств аналитов, основанной на сопоставлении экспериментальных масс-спектров ЭИ неизвестного соединения и возможного кандидата (зарегистрированных при одних и тех же условиях) при совместном использовании метода главных компонент и ^критерия Стьюдента. Практическое применение предложенного подхода особенно целесообразно в тех случаях, когда необходима высокая достоверность идентификации (например, в судебной химии).

Рассмотрена возможность извлечения «чистых» и неискаженных масс-спектров ЭИ органических соединений, хроматографические профили которых накладываются друг на друга, с использованием различных подходов (метода «вычитания фона», прокрустова анализа) и ряда компьютерных программ (АМ018, СЬготаТОР). Полученные результаты имеют особое значение в случае анализа следовых количеств аналитов и показывают, что при наличии общих значений т/г в масс-спектрах коэлюируемых соединений и высоком содержании мешающего компонента только прокрустов анализ позволяет выделить неискаженные масс-спектры.

Положения, выносимые на защиту. о Результаты исследования, посвященного межприборной воспроизводимости масс-спектров ЭИ и ее влиянию на достоверность идентификации неизвестных органических соединений. о Результаты статистического исследования интенсивности пика молекулярного иона в масс-спектрах ЭИ (представленных в соответствующих базах данных), показывающие, что для порядка четверти органических соединений интенсивность пика молекулярного иона в масс-спектрах ЭИ не превышает 1%. о Результаты, полученные при изучении вопроса достоверности идентификации неизвестных органических соединений, основанной на использовании баз данных масс-спектров ЭИ, и показывающие невысокую достоверность библиотечного поиска, о Новый подход к достоверному сопоставлению масс-спектров (зарегистрированных при одних и тех же условиях), основанный на совместном использовании метода главных компонент и ¿-критерия Стьюдента и позволяющий значительно увеличить достоверность идентификации в случае использования метода ГХ/МС(ЭИ). о Результаты сопоставления ряда программ и математических подходов, предназначенных для выделения «чистых» масс-спектров соединений, хроматографические пики которых разделены неполностью.

Вклад автора состоит в проведении всего объема экспериментальных исследований, обработке данных, интерпретации и обобщении полученных результатов.

Апробация работы. Результаты работы были представлены на III Всероссийской конференции «Масс-спектрометрия и ее прикладные проблемы» (Москва, 2009), на VII Международном зимнем симпозиуме по хемометрике «Modern Methods of Data Analysis» (Санкт-Петербург, 2010), на IV Всероссийской конференции «Фундаментальные вопросы масс-спектрометрии и ее аналитические применения» (Звенигород, 2010), на IV Всероссийской конференции «Масс-спектрометрия и ее прикладные проблемы» (Москва, 2011), на Международной конференции «Conferentia Chemometrica 2011» (Шюмег, Венгрия, 2011), на VIII Международном зимнем симпозиуме по хемометрике «Modern Methods of Data Analysis» (Дракино, 2012), на XIII Международной конференции «Chemometrics in Analytical Chemistry» (Будапешт, Венгрия, 2012), на Всероссийской конференции по аналитической спектроскопии (Краснодар, 2012) и на XIII Международной конференции «European Meeting on Environmental Chemistry» (Москва, 2012).

Публикации. По материалам диссертации опубликовано 7 статей (в рецензируемых журналах) и 12 тезисов докладов.

Структура и объем работы. Диссертация состоит из введения, пяти глав, заключения, выводов и списка литературы. Во введении отражена актуальность темы работы, сформулирована цель, научная новизна, практическая значимость и положения, выносимые на защиту. В первой главе рассмотрены основные подходы к идентификации следовых

 
Заключение диссертации по теме "Аналитическая химия"

выводы о Проведено сопоставление масс-спектров ЭИ, зарегистрированных в неидентичных условиях. Показано, что различия между масс-спектрами проявляются в основном не в наборе пиков фрагментных ионов, а в значениях их интенсивностей. о Впервые определено распределение органических соединений (представленных в базах данных масс-спектров ЭИ) в зависимости от интенсивности пика молекулярного иона. Установлено, что пик молекулярного иона отсутствует в масс-спектрах ЭИ порядка четверти органических соединений (что снижает достоверность результатов библиотечного поиска), о Экспериментально показано, что результаты поиска по базам данных масс-спектров ЭИ следует рассматривать как ориентировочные, поскольку нет однозначной корреляции между величиной степени совпадения и достоверностью идентификации, о Предложен подход, позволяющий значительно увеличить достоверность идентификации следовых количеств аналитов при использовании метода ГХ/МС(ЭИ). Подход основан на выборе наиболее вероятного кандидата с помощью библиотечного поиска и последующем сопоставлении экспериментальных масс-спектров неизвестного и предполагаемого соединений (зарегистрированных при одних и тех же условиях) с помощью метода главных компонент и f-критерия Стьюдента. о Проведено сопоставление ряда математических подходов для выделения «чистых» и неискаженных масс-спектров коэлюируемых соединений. Показано, что при наличии общих значений m/z в масс-спектрах коэлюируемых соединений и высоком содержании мешающего компонента только прокрустов анализ позволяет выделить неискаженные масс-спектры.

ЗАКЛЮЧЕНИЕ

Работа посвящена важной проблеме современной аналитической химии - идентификации следовых количеств компонентов смесей органических соединений. В первой части работы рассмотрена возможность проведения достоверной идентификации с использованием метода ГХ/МС(ЭИ) и баз данных масс-спектров ЭИ. Показано, что по ряду причин (главной из которых является высокая вероятность ошибочной идентификации) результаты библиотечного поиска следует рассматривать как ориентировочные и для достоверной идентификации необходимо проводить сопоставление масс-спектров ЭИ, зарегистрированных при одних и тех же экспериментальных условиях. Во второй части работы предложен подход к надежному сопоставлению масс-спектров (зарегистрированных при одних и тех же условиях), основанный на совместном использовании метода главных компонент и f-критерия Стьюдента. Возможности предложенного подхода рассмотрены на примере ряда соединений, обладающих практически идентичными масс-спектрами ЭИ, содержащими один и тот же набор значений m/z. Использование предложенного подхода может позволить избежать ложноположительной идентификации в случае полного совпадения времен удерживания аналитов. В заключительной части работы рассмотрены подходы к выделению «чистых» и неискаженных масс-спектров соединений, хроматографические профили которых разделены неполностью. Показано, что при наличии априорной информации о характеристичных значениях m/z коэлюируемых соединений «чистые» и неискаженные масс-спектры могут быть извлечены при использовании прокрустова анализа (даже в тех случаях, когда масс-спектры содержат большое число общих значений m/z, а концентрации веществ отличаются на два порядка).

 
Список источников диссертации и автореферата по химии, кандидата химических наук, Самохин, Андрей Сергеевич, Москва

1. Мильман Б.Л. Введение в химическую идентификацию. СПб.: ВВМ, 2008. 180 с.2. de Zeeuw R.A. Substance identification: the weak link in analytical toxicology//J. Chromatogr. B. 2004. Vol. 811, №1. P. 3-12.

2. Milman B.L. Identification of chemical compounds // Trends Anal. Chem. 2005. Vol. 24, №6. P. 493-508.

3. Hartstra J., Franke J.Р., de Zeeuw R.A. How to approach substance identification in qualitative bioanalysis // J. Chromatogr. B. 2000. Vol. 739, №1. P. 125-137.

4. Бродский E.C., Лукашенко И.M., Калинкевич Г.A., Савчук С.А. Идентификация нефтепродуктов в объектах окружающей среды с помощью газовой хроматографии и хромато-масс-спектрометрии // Журнал аналитической химии. 2002. Т. 57, №6. С. 592-596.

5. Бродский Е.С., Буткова О.П., Шелепчиков A.A., Фешин Д.Б. Идентификация источников разлива нефтепродуктов в почве и донных отложениях методом газовой хроматографии масс спектрометрии II Масс-спектрометрия. 2010. Т. 7, №2. С. 139-146.

6. Нехорошее C.B., Туров Ю.П., Нехорошее В.П., Головко А.К. Идентификация бензинов с углеводородными маркерами // Журнал аналитической химии. 2009. Т. 64, №10. С. 1035-1039.

7. Бродский Е.С. Системный подход к идентификации органических соединений в сложных смесях загрязнителей окружающей среды // Журнал аналитической химии. 2002. Т. 57, №6. С. 585-591.

8. Зенкевич И.Г. Сравнительная характеристика условий однозначности хроматографической идентификации органических соединений // Журнал аналитической химии. 2001. Т. 56, №9. С. 915-924.

9. Крылов AM. Хроматографический анализ в экологической экспертизе //Журнал аналитической химии. 1995. Т. 50, №3. С. 230-241.

10. Little J.L., Cleven C.D., Brown S.D. Identification of "known unknowns" utilizing accurate mass data and chemical abstracts service databases // J. Am. Soc. Mass Spectrom. 2011. Vol. 22, №2. P. 348-359.

11. Мильман Б.П., Конопелько Л.А. Идентификация органических соединений в методиках выполнения измерений II Заводская лаборатория. Диагностика материалов. 1999. Т. 65, №12. С. 58-59.

12. Kerber A., Laue R., Meringer М., Rucker С. Molecules in silico: potential versus known organic compounds // MATCH Commun. Math. Comput. Chem. 2005. Vol. 54, №2. P. 301-312.

13. Milman B.L. A procedure for decreasing uncertainty in the identification of chemical compounds based on their literature citation and cocitation. Two case studies //Anal. Chem. 2002. Vol. 74, №7. P. 1484-1492.

14. Milman B.L Literature-based generation of hypotheses on chemical composition using database co-occurrence of chemical compounds // J. Chem. Inf. Model. 2005. Vol. 45, №5. P. 1153-1158.

15. McLafferty F.W., Turecek F. Interpretation of Mass Spectra, 4th edition. Mill Valley: University Science Books, 1993. 371 p.

16. Gross J. Mass spectrometry: a textbook. Berlin: Springer-Verlag, 2002. 518 p.

17. Заикин В.Г., Варламов А.В., Микая А.И., Простаков Н.А. Основы масс-спектрометрии органических соединений. М.: МАИК Наука/Интерпериодика, 2001. 286 с.

18. Лебедев AT. Масс-спектрометрия в органической химии. М.: Бином. Лаборатория знаний, 2003. 493 с.

19. Philipov S., Berkov S. GC-MS investigation of tropane alkaloids in Datura stramonium HZ. Naturforsch. 2002. Vol. 57, №5-6. P. 559-561.

20. URL: http://webbook.nist.gov/ (дата обращения: 20.08.2012).

21. Зенкевич И.Г., Иоффе Б.В. Интерпретация масс-спектров органических соединений. Л.: «Химия», 1986. 176 с.

22. Kerber A., Meringer М., Rucker С. CASE via MS: ranking structure candidates by mass spectra // Croatica Chemica Acta. 2006. Vol. 79, №3. P. 449-464.

23. Schymanski E.L., Meringer M., Brack W. Matching structures to mass spectra using fragmentation patterns: are the results as good as they look? // Anal. Chem. 2009. Vol. 81, №9. P. 3608-3617.

24. Ревельский И.А., Гуляев И.В., Ревельский А.И., Чепелянский Д.А., Бочков П.О. Идентификация неизвестных соединений с использованием баз данных и компьютерного генерирования масс спектров // Масс-спектрометрия. 2010. Т. 7, №2. С. 118-123.

25. Мильман Б.Л., Русских Я.В., Некрасова Л.В., Жаковская З.А. Подход к масс спектрометрической идентификации цианобактериальных пептидов. Пример деметилмикроцистина LR // Масс-спектрометрия. 2011. Т. 8, №1. С. 5160.

26. Dromey R.G. Mass spectrum dictionary for library searching // Anal. Chem. 1979. Vol. 51, №2. P. 229-232.

27. Hertz H.S., Hites R.A., Biemann K. Identification of mass spectra by computer-searching a file of known spectra // Anal. Chem. 1971. Vol. 43, №6. P. 681-691.

28. NIST MS Search user guide. National Institute of Standards and Technology. Gaithersburg, 2008. 49 p.

29. Abramson F.P. Automated identification of mass spectra by the reverse search II Anal. Chem. 1975. Vol. 47, №1. P. 45^9.

30. Ausloos P., Clifton C.L., Lias S.G., Mikaya A.I., Stein S.E., Tchekhovskoi D.V., Sparkman O.D., Zaikin V., Zhu D. The critical evaluation of a comprehensive mass spectral library// J. Am. Soc. Mass Spectrom. 1999. Vol. 10, №4. P. 287-299.

31. McLafferty F.W., Stauffer D.A., Loh S.Y., Wesdemiotis C. Unknown identification using reference mass spectra. Quality evaluation of databases // J. Am. Soc. Mass Spectrom. 1999. Vol. 10, №12. P. 1229-1240.

32. McLafferty F.W., Stauffer D.B., Loh S.Y. Comparative evaluations of mass spectral data bases // J. Am. Soc. Mass Spectrom. 1991. Vol. 2, №5. P. 438440.

33. Stein S.E., Ausloos P., Lias S.G. Comparative evaluations of mass spectral databases // J. Am. Soc. Mass Spectrom. 1991. Vol. 2, №5. P. 441443.

34. Grotch S.L. Matching of mass spectra when peak height is encoded to one bit//Anal. Chem. 1970. Vol. 42, №11. P. 1214-1222.

35. Grotch S.L. Computer identification of mass spectra using highly compressed spectra codes //Anal. Chem. 1973. Vol. 45, №1. P. 2-6.

36. Knock B.A., Smith I.C., Wright D.E., Ridley R.G. Compound identification by computer matching of low resolution mass spectra // Anal. Chem. 1970. Vol.42, №13. P. 1516-1520.

37. Rasmussen G.T., Isenhour T.L. The evaluation of mass spectral search algorithms // J. Chem. Inf. Comput. Sci. 1979. Vol. 19, №3. P. 179-186.

38. Crawford L.R., Morrison J.D. Identification of an unknown compounds in a catalog //Anal. Chem. 1968. Vol. 40, №10. P. 1464-1469.

39. Neudert R., Bremser W., Wagner H. Multidimensional computer evaluation of mass spectra // Org. Mass Spectrom. 1987. Vol. 22, №6. P. 321-329.

40. Stein S.E., Scott D.R. Optimization and testing of mass spectral library search algorithms for compound identification // J. Am. Soc. Mass Spectrom. 1994. Vol. 5, №9. P. 859-866.

41. McLafferty F.W., Hertel R.H., Villwock R.D. Probability based matching of mass spectra. Rapid identification of specific compounds in mixtures // Org. Mass Spectrom. 1974. Vol. 9, №7. P. 690-702.

42. Pesyna G.M., McLafferty F.W., Venkataraghavan R., Dayringer H.E. Statistical occurrence of mass and abundance values in mass spectra // Anal. Chem. 1975. Vol.47, №7. P. 1161-1164.

43. Pesyna G.M., Venkataraghavan R., Dayringer H.E., McLafferty F.W. Probability based matching system using a large collection of reference mass spectra // Anal. Chem. 1976. Vol. 48, №9. P. 1362-1368.

44. Mun I.K., Bartholomew D.R., Stauffer D.B., McLafferty F.W. Weighted file ordering for fast matching of mass spectra against a comprehensive data base //Anal. Chem. 1981. Vol. 53, №12. P. 1938-1939.

45. McLafferty F.W., Stauffer D.B. An improved comprehensive data base for matching unknown mass spectra // J. Mass Spectrom. Ion Proc. 1984. Vol. 58. P. 139-149.

46. Atwater B.L., Stauffer D.B., McLafferty F.W., Peterson D.W. Reliability ranking and scaling improvements to the probability based matching system for unknown mass spectra // Anal. Chem. 1985. Vol. 57, №4. P. 899-903.

47. Stauffer D.B., McLafferty F.W., Ellis R.D., Peterson D.W. Adding forward searching capabilities to a reverse search algorithm for unknown mass spectra //Anal. Chem. 1985. Vol. 57, №3. P. 771-773.

48. Stauffer D.B., McLafferty F.W., Ellis R.D., Peterson D.W. Probability-based-matching algorithm with forward searching capabilities for matching unknown mass spectra of mixtures // Anal. Chem. 1985. Vol. 57, №6. P. 1056-1060.

49. Stein S.E. Estimating probabilities of correct identification from results of mass spectral library searches // J. Am. Soc. Mass Spectrom. 1994. Vol. 5, №4. P. 316-323.

50. McLafferty F.W., Zhang M.Y., Stauffer D.B., Loh S.Y. Comparison of algorithms and databases for matching unknown mass spectra // J. Am. Soc. Mass. Spectrom. 1998. Vol. 9, №1. P. 92-95.

51. Sparkman D. Informatics and mass spectral databases in the evaluation of environmental mass spectral data // Comprehensive environmental mass spectrometry Ed. by Lebedev A. Saint Albans: ILM Publications, 2012. P. 89121.

52. Likic V.A. Extraction of pure components from overlapped signals in gas chromatography-mass spectrometry (GC-MS) // BioData Min. 2009. Vol. 2, №6. P. 1-11.

53. OPCW Technical Document QDOC/LAB/WI/PT04 (Work instruction for the reporting of the results of the OPCW proficiency tests). 2012.

54. Sparkman D. Evaluating electron ionization mass spectral library search results//J. Am. Soc. Mass Spectrom. 1996. Vol. 7, №4. P. 313-318.

55. Wold S., Christie O.H.J. Extraction of mass spectral information by a combination of autocorrelation and principal components models //Anal. Chim. Acta. 1984. Vol. 165. P. 51-59.

56. Varmuza K., Werther W., Henneberg D., Weimann B. Computer-aided interpretation of mass spectra by a combination of library search with principal component analysis // Rapid. Comm. Mass Spectrom. 1990. Vol. 4, №5. P. 159-162.

57. Scsibrany H., Varmuza K. Common substructures in groups of compounds exhibiting similar mass spectra // Fresenius J. Anal. Chem. 1992. Vol. 344, №4-5. P. 220-222.

58. Varmuza K., Werther W. Mass spectral classifiers for supporting systematic structure elucidation // J. Chem. Inf. Comput. Sci. 1996. Vol. 36, №2. P. 323-333.

59. Werther W., Lohninger H., Stand P., Varmuza K. Classification of mass spectra: A comparison of yes/no classification methods for the recognition of simple structural properties // Chemom. Intell. Lab. Syst. 1994. Vol. 22, №1. P. 63-76.

60. D'Arcy P., Mallard G. AMDIS User guide. National Institute of Standards and Technology. Gaithersburg, 2004. 222 p.

61. Stein S.E. Chemical substructure identification by mass spectral library searching // J. Am. Soc. Mass Spectrom. 1995. Vol. 6, №8. P. 644-655.

62. Stein S.E. An integrated method for spectrum extraction and compound identification from gas chromatography/mass spectrometry data // J. Am. Soc. Mass Spectrom. 1999. Vol. 10, №8. P. 770-781.

63. Meyer M.R., Peters F.T., Maurer H.H. Automated mass spectral deconvolution and identification system for GC-MS screening for drugs, poisons, and metabolites in urine // Clin. Chem. 2010. Vol. 56, №4. P. 575584.

64. Zhang W., Wu P., Li C. Study of automated mass spectral deconvolution and identification system (AMDIS) in pesticide residue analysis // Rapid. Commun. Mass. Spectrom. 2006. Vol. 20, №10. P. 1563-1568.

65. Mai M., Koh P.K., Cheah P.Y., Chan E.C. Development and validation of a gas chromatography/mass spectrometry method for the metabolic profiling of human colon tissue // Rapid Commun. Mass Spectrom. 2009. Vol. 23, №4. P. 487-^94.

66. Крылов B.A., Чернова О.Ю., Созин А.Ю. Хромато-масс-спектрометрическая идентификация примесей в силане природного изотопного состава и обогащенном изотопом 28Si // Аналитика и контроль. 2011. Т. 15, №4. С. 421-428.

67. Крылов В.А., Чернова О.Ю., Созин А.Ю., Котков АЛ. Хромато-масс-спектрометрическая идентификация примесей в фосфине высокой чистоты //Аналитика и контроль. 2012. Т. 16, №2. С. 196-202.

68. Савчук С.А., Барсегян С.С., Барсегян И.Б., Колесов Г.М. Хроматографическое исследование экспертных и биологическихобразцов, содержащих дезоморфин // Журнал аналитической химии. 2008. Т. 63, №4. С. 396-405.

69. Берниковская Н.А., Темердашев З.А. Идентификация и хроматографическое определение фенольных соединений в тысячелистнике обыкновенном // Аналитика и контроль. 2012. Т. 16, №2. С. 188-195.

70. El Bazaoui A., Bellimam М.А., Soulaymani A. Nine new tropane alkaloids from Datura stramonium L. identified by GC/MS // Fitoterapia. 2011. Vol. 82, №2. P. 193-197.

71. Симонов E.A., Савчук C.A., Сорокин В.И., Кислун Ю.В., Клюев А.Е. Оксибутират, его прекурсоры и метаболиты // Наркология. 2002. №3. С. 12-19.

72. Muravnik L.E., Shavarda A.L. Pericarp peltate trichomes in pterocarya rhoifolia: histochemistry, ultrastructure, and chemical composition // Int. J. Plant Sci. 2011. Vol. 172, №2. P. 159-172.

73. Commission Decision 2002/657/EC of 12 August 2002 // Off. J. Eur. Commun. 2002. Vol. L221. P. 8-36.

74. Guidance for industry: mass spectrometry for confirmation of the identity of animal drug residues: final guidance. FDA. Washington, 2003.

75. WADA Technical Document TD2010IDCR. 2011.

76. Larsson M. Substance identification in anti-doping control by means of mass spectrometry. Data reduction and decision criteria // J. Anal. Sci. Meth. Instrum. 2011. Vol. 1, №2. P. 19-24.

77. Babushok V.I., Linstrom P.J., Reed J.J., Zenkevich I.G., Brown R.L., Mallard W.G., Stein S.E. Development of a database of gas chromatographic retention properties of organic compounds // J. Chromatogr. A. 2007. Vol. 1157, №1-2. P. 414—421.

78. Stein S.E., Babushok V.I., Brown R.L., Linstrom P.J. Estimation of Kovats retention indices using group contributions // J. Chem. Inf. Model. 2007. Vol. 47, №3. P. 975-980.

79. Zenkevich I.G., Makarov A.A., Schrader S., Moeder M. A new version of an additive scheme for the prediction of gas chromatographic retention indices of the 211 structural isomers of 4-nonylphenol // J. Chromatogr. A. 2009. Vol. 1216, №18. P. 4097-4106.

80. Зенкевич И.Г., Уколова Е.С. Об основных факторах, влияющих на межлабораторную воспроизводимость газохроматографических индексов удерживания //Аналитика и контроль. 2010. Т. 14, N24. С. 243-250.

81. Зенкевич И.Г. Новые возможности совместной интерпретации масс-спектрометрических и хроматографических данных при идентификации органических соединений // Масс-спектрометрия. 2004. Т. 1, №1. С. 4552.

82. Зенкевич И.Г., Ивлева Е.С. Зависимость газохроматографических индексов удерживания от соотношения характеризуемых и реперных компонентов //Журнал аналитической химии. 2011. Т. 66, №1. С. 47-55.

83. Зенкевич И.Г., Елисеенков Е.В., Касаточкин А.Н. Хроматографическая «составляющая» хроматомасс,спектрометрической идентификации продуктов хлорирования циклогексана // Масс-спектрометрия. 2009. Т. 6, №2. С. 137-148.

84. Sanz J., Soria А.С., Garcia-Vallejob M.C. Analysis of volatile components of Lavandula luisieri L. by direct thermal desorption-gas chromatography-mass spectrometry//J. Chromatogr. A. 2004. Vol. 1024, №1-2. P. 139-146.

85. Smith R. Understanding mass spectra: a basic approach. New York: Wiley, 2004. 372 p.

86. Venn R.F. Principles and practice of bioanalysis. London, New York: Taylor & Francis, 2000. 362 p.

87. BillerJ.E., Biemann K. Reconstructed mass spectra, a novel approach for the utilization of gas chromatograph/mass spectrometer data // Anal. Lett. 1974. Vol. 7, №7. P. 515-528.

88. Colby B.N. Spectral deconvolution for overlapping GC/MS components // J. Am. Soc. Mass Spectrom. 1992. Vol. 3, №5. P. 558-562.

89. Herron N.R., Donnelly J.R., Sovocool G.W. Software-based mass spectral enhancement to remove interferences from spectra of unknowns // J. Am. Soc. Mass Spectrom. 1996. Vol. 7, №6. P. 598-604.

90. Dromey R.G., Stefik M.J., Rindfleisch T.C., Duffield A.M. Extraction of mass spectra free of background and neighboring component contributions from gas chromatography/mass spectrometry data // Anal. Chem. 1976. Vol. 48, №9. P. 1368-1375.

91. Jolliffe I.T. Principal component analysis. Second edition. New York: Springer-Verlag, 2002. 502 p.

92. Jackson J.E. A user's guide to principal component. New York: John Willey, 1991. 567 p.

93. Эсбенсен К. Анализ многомерных данных: пер. с англ. С.В. Кучерявского; под ред. О.Е. Родионовой. Черноголовка: ИПХФ РАН, 2005. 160 с.

94. Manne R. On the resolution problem in hyphenated chromatography // Chemom. Intell. Lab. Syst. 1995. Vol. 27, №1. P. 89-94.

95. Sharaf M.A., Kowalski B.R. Extraction of individual mass spectra from gas chromatography/mass spectrometry data of unseparated mixtures // Anal. Chem. 1981. Vol. 53, №3. P. 518-522.

96. Sharaf M.A., Kowalski B.R. Quantitative resolution of fused chromatographic peaks in gas chromatography/mass spectrometry // Anal. Chem. 1982. Vol. 54, №8. P. 1291-1296.

97. Andrade J.M., Gomez-Carracedo M.P., Krzanowski W., Kubista M. Procrustes rotation in analytical chemistry, a tutorial // Chemom. Intell. Lab. Syst. 2004. Vol. 72, №2. P. 123-132.

98. Vandeginste В., Essers R., Bosman Т., Reijnen J., Kateman G. Three-component curve resolution in liquid chromatography with multiwavelength diode array detection //Anal. Chem. 1985. Vol. 57, №6. P. 971-985.

99. Kvalheim O.M., Liang Y.Z. Heuristic evolving latent projections: resolving two-way multicomponent data //Anal. Chem. 1992. Vol. 64, №8. P. 936-946.

100. Statheropoulos M., Smaragdis E., Tzamtzis N., Georgakopoulos C. Principal component analysis for resolving coeluting substances in gas chromatography/mass spectrometry doping control analysis // Anal. Chim. Acta. 1996. Vol. 331, №1-2. P. 53-61.

101. Windig W., Lippert J.L., Robbins M.J., Kresinske K.R., Snyder A.P. Interactive self-modeling multivariate analysis II Chemom. Intell. Lab. Syst. 1990. Vol. 9, №1. P. 7-30.

102. Snyder A.P., Windig W., Toth J.P. Interactive self-modeling multivariate analysis of thermolysis mass spectra I I Chemom. Intell. Lab. Syst. 1991. Vol. 11, №2. P. 149-160.

103. Statheropoulos M., Mikedi K. PCA-ContVarDia: an improvement of the PCA-VarDia technique for curve resolution in GC-MS and TG-MS analysis // Anal. Chim. Acta. 2001. Vol. 446, №1-2. P. 353-370.

104. Statheropoulos M., Mikedi K., Tzamtzis N., Pappa A. Application of factor analysis for resolving thermogravimetric-mass spectrometric analysis spectra //Anal. Chim. Acta. 2002. Vol. 461, №2. P. 215-227.

105. Богданов А.В., Чамян К.Р., Ревельский И.А. Использование автоматического поиска компонентов программой Mass Frontier в данных ГХ/МС анализа сложной смеси // Масс-спектрометрия. 2009. Т. 6, N22. С. 131-136.

106. URL: http://www.amdis.net/ (дата обращения: 20.08.2012).

107. Lee S., Choi H.K., Cho S.K., Kim Y.S. Metabolic analysis of guava (Psidium guajava L.) fruits at different ripening stages using different data-processing approaches // J. Chromatogr. B. 2010. Vol. 878, №29. P. 2983-8.

108. Исмагилов Д.Р. Использование программного обеспечения AMDIS в анализе летучих органических соединений в воздухе методом хроматомасс-спектрометрии // Масс-спектрометрия. 2008. Т. 5, №2. С. 139-146.

109. Lu Н., Dunn W.B., Shen Н., Kell D.B., Liang Y. Comparative evaluation of software for deconvolution of metabolomics data based on GC-TOF-MS // Trends Anal. Chem. 2008. Vol. 27, №3. P. 215-227.

110. The NIST Mass Spectrometry Data Program, Distributors' Meeting, PITTCON, 2002. URL: http://chemdata.nist.gov/mass-spc/pubs/pittcon-2002/ms-distributors-mtg-pittcon02.pdf (дата обращения: 20.08.2012).

111. McLafferty F.W., Stauffer D.B. Retrieval and interpretative computer programs for mass spectrometry // J. Chem. Inf. Comput. Sci. 1985. Vol. 25, №3. P. 245-252.

112. Eichelberger J.W., Harris L.E., Budde W.L. Reference compound to calibrate ion abundance measurements in gas chromatography mass spectrometry systems // Anal. Chem. 1975. Vol. 47, №7. P. 995-1000.

113. Morales-Rios M.S., Velasco L., Perez-Rojas N.A., Joseph-Nathan P. Electron ionization mass spectra of indolenines obtained using sector and ion trap mass spectrometers II Rapid Commm. Mass Spectrom. 2005. Vol. 19, №10. P. 1296-1304.

114. Самохин A.C., Ревельский AM., Ревельский И.А. Сопоставление масс-спектров электронной ионизации ряда соединений (ММ < 200 Да),зарегистрированных с помощью различных типов масс-спектрометров // Масс-спектрометрия. 2011. Т. 8, №2. С. 106-110.

115. Митин А.С., Фаерман В.И., Лопатин М.А. Создание библиотеки масс-спектров для расширения области применения хроматомасс-спектрометров с ионной ловушкой // Масс-спектрометрия. 2008. Т. 5, N22. С. 147-149.

116. URL: http://www.tau.ac.il/chemistry/amirav/smbms.shtml (дата обращения: 20.08.2012).

117. Dagan S, Mass spectrometry in supersonic molecular beams, PhD Thesis. Tel-Aviv University, 1996.

118. Самохин A.C., Ревельский И.А. Интенсивность пика молекулярного иона в масс-спектрах электронной ионизации // Масс-спектрометрия. 2012. Т. 9, №1. С. 58-60.

119. Leth Т. Chemometric analysis of mass spectra of cis and trans fatty acid picolinyl esters // Z. Lebensm.-Unters. Forsch. 1997. Vol. 205, №2. P. 111115.

120. Mjos S.A., Pettersen J. Determination of trans double bonds in polyunsaturated fatty acid methyl esters from their electron impact mass spectra // Eur. J. Lipid Sci. Technol. 2003. Vol. 105, №3^. P. 156-164.

121. Hejazi L., Ebrahimi D., Guilhaus M., Hibbert, D.B. Discrimination among geometrical isomers of a-linolenic acid methyl ester using low energy electron ionization mass spectrometry // J. Am. Soc. Mass Spectrom. 2009. Vol. 20, №7. P. 1272-1280.

122. Scrivens J.H., Jackson A.T., Jennings K.R., Jennings R.C.K., Everall N.J. High energy collision-induced dissociation (CID) product ion spectra of isomeric polyhydroxy sugars // Int. J. Mass Spectrom. 2003. Vol. 230, №2-3. P. 201-208.

123. Berman E.S.F., Kulp. K.S., Knize M.G., Wu L., Nelson E.J., Nelson D.O., Wu K.J. Distinguishing monosaccharide stereo- and structural isomers with TOF-SIMS and multivariate statistical analysis // Anal. Chem. 2006. Vol. 78, №18. P. 6497-6503.

124. Samokhin A., Revelsky I. Distinguishing by principal component analysis o-xylene, m-xylene, p-xylene and ethylbenzene using electron ionization mass spectrometry// Eur. J. Mass Spectrom. 2011. Vol. 17, №5. P. 477-480.

125. Grubb H.M., Meyerson S. Mass spectra of alkylbenzenes // Mass spectrometry of organic ions Ed. by McLafferty F.W. New York: Academic Press, 1963. P. 453-527.

126. Moraes L.A.B., Sabino A.A., Meurer E.C., Eberlin M.N. Absolute configuration assignment of ortho, meta, or para isomers by mass spectrometry// J. Am. Soc. Mass Spectrom. 2005. Vol. 16, №4. P. 431-436.

127. Samokhin A., Revelsky I. Reliable comparison of electron ionization mass spectra recorded under identical experimental conditions // Spectrosc. Lett. 2013. Vol.46, №2. P. 117-121.

128. Самохин A.C., Ревельский И.А. Надежное сопоставление масс-спектров, зарегистрированных в идентичных условиях, с помощью метода главных компонент // Аналитика и контроль. 2012. Т. 16, №3. С. 269-274.

129. Mjos S.A., Meier S., Boitsov S. Alkylphenol retention indices // J. Chromatogr. A. 2006. Vol. 1123, №1. P. 98-105.

130. Самохин A.C., Ревельский И.А. Применение метода главных компонент для выделения «чистых» масс-спектров в газохроматографическом масс-спектральном анализе // Масс-спектрометрия. 2010. Т. 7, №2. С. 132-138.