Особенности разработки и программной реализации методов распознавания образов в задачах автоматизации биофизических исследований тема автореферата и диссертации по физике, 01.04.01 ВАК РФ
Беридзе, Анна Дмитриевна
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
1997
ГОД ЗАЩИТЫ
|
|
01.04.01
КОД ВАК РФ
|
||
|
БЕРИДЗЕ АННА ДМИТРИЕВНА
9 ПОЛ
ОСОБЕННОСТИ РАЗРАБОТКИ И ПРОГРАММНОЙ РЕАЛИЗАЦИИ МЕТОДОВ РАСПОЗНАВАНИЯ ОБРАЗОВ
В ЗАДАЧАХ АВТОМАТИЗАЦИИ БИОФИЗИЧЕСКИХ ИССЛЕДОВАНИЙ
01.04.01 -Техника физического эксперимента, физика приборов, автоматизации физических исследований.
АВТОРЕФЕРАТ диссертации йа соискание ученой ■ степени кандидата физико-математических наук.
Москва 1997
Диссертация выполнена в дозиметрической лаборатории Московского Научно-исследовательского института диагностики и хирургии МЗ РФ. .
(директор • член-корр. РАМН, профессор В.П. Харчеико)
Научные рукооодитсли (консультанты): доктор физико-математических наук кандидат физико-математических наук
Г.Б.Гольфельд В.П.Гуслистый
Официальны^ оппоненты!
доктор физико-математических наук,
профессор Крапивин Владимир Федорович
доктор технических наук,
профессор Колин Константин Константинович
Ведущая организация - Московский Государственный Университет им. М.В.Ломоносова, фак-т Вычислительной математики и кибернетики
Защита состоится 1997 года вчасов на заседании диссертационного
(овета Д.002.74.03 в Институте Радиотехники и Электроники Российской Академии Наук по адресу: 103907, Москва, Центр ГСП-3, ул, Моховая, 11
С диссертацией можно ознакомиться в библиотеке Института Радиотехники и Электроники РАН.
Автореферат разослан "_"_
Ученый секретарь диссертационного совета
199 года.
(подпись).
Актуальность проблемы.
Мониторинг населения, проводимый в местах возникновения экологических катастроф, является не только и на столько биологической, сколько физической задачей. Действительно, современные экологические катастрофы характеризуются выбросом в атмосферу большого количества либо радиации, либо токсинов, влияние которых на человеческий организм представляет собой физическое или химическое воздействие. Характерным примером может служить катастрофа на Чернобыльской АЭС в 1986 г., во рремя которой жители местностей, над которыми прошло радиоактивное облако, и ликвидаторы подверглись облучению в дозах до 600 бэр. При этом для жителей многих населенных пунктов, подвергшихся воздействию радиоактивного облака, до сих пор неизвестны поглощенные дозы радиации. Определение этих доз является физической задачей. В то же время это необходимо как для проведения медицинской профилактики среди пострадавших, так и для определения результирующего влияния прошедшего облака на экологическое состояние местности.
Таким образом, при возникновении экологических катастроф необходимо решать физические задачи определения степени вредного воздействия, решение которых играет ведущую роль в дальнейших исследованиях биофизических систем.
Нельзя утверждать, что вышеперечисленные проблемы абсолютно не исследовались. В биоложи существует методика оценки вредного воздействия радиации ив людей путем оценки состояния их здоровья (например, цитогенетическая). Однако эта методика может определять только значительные отклонения состояния здоровья от кормы, например, последствия радиационного воздействия дозами более 50 Бэр. Между -гей, есть настоятельная необходимость повышения чувствительности оценки, так как и м?ныше радиационное воздействий оказызеат существенное злияние на состояние здоровья человека. А чем раньше обнаруживаются слабые отклонения в состоянии здоровья, тем реальнее успех лечения.
Кроме того, биологические методы исследования состоянии здоровья оказываются несостоятельными в тех случаях, когда решается задача проведения массовых обследований населения, так как эти методы сегодня реализуются вручную (вне реального масштаба времени).
Цель работы,
Целью настоящей работы является разработка эффективных и надежных средств автоматизации физических исследований организма человека. Такими исследованиями являются, например:
- мониторинг состояния биофизического объекта;
- выявление последствий экологических катастроф путем массового обследования населения пострадавшей местности;
- определение степени неблагоприятного внешнего воздействия (например, поглощенной дозы радиации), которому подвергся каждый житель загрязненной
местности;
- решение аналогичных физических задач, характеризующихся большими потоками данных и требующих работы в реальном масштабе времени.
Основные задами исследования.
Для достижения поставленной цели необходимо решение следующих теоретических задач:
- выбор и разработка метода, позволяющего оценить степень вредного воздействия, которому подвергся обследуемый человек;
- разработка способов оценки качества исходной информации и способов повышения качества выбранного метода, эффективность которого должна быть не ниже эффективности ныне существующих методов;
- реализация разработанных методов и способов! в виде алгоритмов и программ, удобных для пользователя - проблемного специалиста.
Научная новизна.
Для оценки степени воздействия неблагоприятных физических факторов на человека необходимо проведение мнопопара метрического анализа комплекса показателей, объективно отражающего состояние его здоровья. Использовать лишь один из показателей (или небольшое их число) для оценки слабого воздействия, как правило, не представляется возможным, так как в биологии все показатели распределяются по времени неравномерно, т.е. значения показателя в разное время у людей с разным состоянием здоровья могут быть одинаковы. Проводились попытки анализировать комплекс показателей при помощи построения нелинейных рефвссий. Однако
• з
полученные погрешности показали, что эти способы позволяют выявлять лишь сильное воздействие на организм (такое, например, как рентгеновское излучение начиная с 50 Бэр),
Альтернативным способом решения задачи оценки вредного воздействия на организм наблюдаемых физических факторов является представление данной задачи как задачи классификации людей по группам, связанным со степенью этого воздействия. Можно считать, что наиболее естественным математическим аппаратом для решения такой задачи являются методы распознавания образов (РО). Возможность реализации этих методов в вида компьютерных программ полностью отвечает поставленной задаче автоматизации биофизических исследований.
Практика показала, что среди всего многообразия методов РО в наибольшей степени соответствуют решаемой задача классификации методы РО, основанные на алгоритмах вычисления оценок (ABO). Преимущества этих методов перед нейросетевыми методами состоят в том, что в методах ABO разработчик имеет контроль над параметрами алгоритмов и может повысить эффективность алгоритмов при помощи настройки этих параметров. Нейросетевыв же методы на позволяют привнести в себя никаких эвристических знаний разработчика ни об алгоритме, ни о структуре исходных данных. Преимущества же методов AÜO перед стохастическими методами состоят в малом объеме обучающих выборок и в отсутствии Требований к выявлению функции плотности распределения для каждого из показателей. Действительно, для ABO 15-20 объектов на класс, как правило, бывает достаточно для того, чтобы обучить систему классификации объектов с эффективностью не менее, чем 75% правильно классифицированных тестоэых объектов. Это существенно в приложении к биофизическим исследованиям организма человека, где трудно получить однородные обучающие (то есть уже классифицированные экспертами) выборки большего объема, так как они формируются различными экспертами, е разное время и при разном уровне накопленных знаний. Среди стохастических мвтодоз только такие методы как, например, теория априорно-эмпирических функций, могут оперировать подобными малыми выборками, однако они требуют задания априорной функции плотности распределения для каждого показателя. Вид этих функций неизвестен и не может быть получен от экспертов.
Важно отметить, что методы РО, основанные на ABO, ставят в "равновесомое" положение как часто, так и редко встречающиеся события. Это невозможно при
использовании стохастических методов, но это естественно при оценке состояния здоровья человека.
Таким образом, на основании вышесказанного для автоматизации биофизических исследований человеческого организма были выбраны методы РО, основанные на ABO, и среди последних использованы методы, опирающиеся на динамический кластерный
анализ.
Научная новизна работы заключается в следующем:
• теоретически исследованы некоторые свойства и условия применения наиболее распространенных алгоритмов кластеризации (6] к поставленным задачам;
• разработаны методы предварительной оценки информативности используемых признаков {5J;
• использована функция распознавания [3], дающая возможность не просто классифицировать объект на качественном уровне, а определить численную оценку (степень) уверенности системы в принадлежности классифицируемого объекта конкретной группе.
Кроме того:
• получены некоторые практические и теоретические результаты относительно применимости различных функций распознавания к конкретным исходным данным;
» сделаны выводы о таксономии как о средстве оценю) качества обучающей выборки, и как о способе определения "разделимости" объектов выборки на классы;
• изучены свойства разработанных методов предварительной оценки информативности признаков.
Проведенный анализ отечественной и зарубежной литературы показал, то работы, посвященные разработке применения методов РО, основанных на ABO, к исследованию физического состояния человека, автору в настоящее время неизвестны.
Практическое знании?,
Практическая ценность разработанных методов, реализованных на персональном компьютере, работающих t реальном масштабе времени и имеющих дружественный визуальный интерфейс с пользователем, состоит в том, что описанные методы позволяют с высокой эффективностью автоматизировать решение следующих задач:
• выявление степени вредного воздействия на организм;
• оценка физического состояния организма;
• оценка эффекта лечения заболевания;
• мониторинг населения при экологических катастрофах;
• оценка экологической ситуации в районах таких катастроф;
• создание обучающих информационных систем.
На защиту выносятся:
• применение методов распознавания образов, основанных на алгоритмах вычисления оценок, в задачах автоматизации биофизических исследований;
• алгоритмы, реализующие методы распознавания образов, основанных на алгоритмах вычисления оценок,, позволяющие улучшить качество автоматизации биофизических исследований;
• результаты исследования свойств и эффективности алгоритмов распознавания образов, основанных на алгоритмах вычисления оценок, в задачах автоматизации биофизических исследований;
• программы, реализующие разработанные алгоритмы.
Апробация работы.
Результаты работы докладывались:
• на конференции "Медицинская фиэиха-95", Москва, Всероссийский Онкологический научный центр РАМН, 14-17 декабря 1895 г.;
• на конференции "Компьютерные методы в гематологии", Москва, Всероссийский Гематологический центр РАМН, 21-24 декабря 1996 г.;
• ма семинаре по оценке радиационного воздействия на человека в Московском НИИ диагностики и хирургии (МНИИДиХ МЗ РФ) (Москва, 1996);
• на семинаре по оценке иммунологического статуса ликвидаторов экологических аварий а радиологической лаборатории Российского НИИ клинической и экспериментальной иммунологии (РНИИКиЭИ) МЗ РФ (Москва, 1995);
Полнота публикаций по теме диссертаций.
По тема диссертации автором лично и в соавторстве опубликовано в центральных
изданиях "Проблемы окружающей среды и природных росурсов", "Экологическая
экспертиза* (ВИНИИТИ) и "Medical Physics and Biomedical Engineering* 8 научных работ.
Объем и структура работы.
Диссертация состоит из введения, четырех глав, заключения, списка литературы и приложения, изложенных на 140 страницах. Содержит 14 рисунков и. перечень литературы из 74 наименований цитированных источников, а также основных работ автора по теме диссертации. В совместных публикациях автору принадлежит реализация методов исследования и полученные результаты. Соавторы принимали участив в постановке задачи, проверке и обсуждении полученных практических результатов. Вклад соискателя а опубликованные по теме диссертации совместные работы является основным.
Содержание работы.
Во введении и в первой главе обоснована актуальность темы диссертационной работы, дана общая характеристика проблемы применения методов распознавания образов в задачах автоматизации биофизических исследований. Сформулированы цель и направление исследований. Показано, что важнейшими задачами биофизических исследований являются мониторинг населения и определение степени радиационного воздействия на окружающую среду. Поскольку оперативное решение этих задач важно для своевременного проведения мероприятий по устранению радиационной опасности или ее последствий, то автоматизация решения таких задач приобретает первоочередную важность.
В первой главе задачи мониторинга состояния здоровья населения при экологических катастрофах, установления поглощенных пациентами облучения при помощи массовых обследованиях Населения и другие формулируются как задачи классификации (разбиения пациентов на классы) по комплексу признаков отражающих влияние вредных факторов на состояние здоровья. Определен наиболее эффективный подход к решению таких задач, основанный на методах распознавания образов (РО). Описаны основные типы задач классификации.
Во второй глава изложены основные положения теории распознавания образов (РО). Отмечено, что типичная задача РО состоит в классификации некоторых объектов по группам, задаваемым эталонными объектами. Роль изучаемого физического объекта в методах РО играет объект исследования - математический аналог физического объекта. Объект исследования представляется своим формализованным описанием -вектором значений признаков, характеризующих физический объест. Значение признака
/
- это количественная характеристика, отражающая качественные различия исследуемых объектов. Например, такими признаками могут быть показатели лабораторного анализа крови пациента.
Группы, на которые разбиваются исследуемые объекты, называют классами -множествами объектов, а определенном смысле родственных по некоторому объединяющему их общему свойству.
Множеством эталонов, используемым для обучения распознаванию, является формируемая экспертами обучающая выборка (таблица). Последняя составляется экспертом из объектов исследования, дпя каждого из которых распознающей системе известна его принадлежность к конкретному классу. Множеством объектов, используемым дпя оценки эффективности методов классификации, является формируемая экспертом контрольная выборка. Последняя состоит из объектов исследования, для каждого из которых эксперту известно, какому классу принадлежит каждый объект, а распознающей системе - нот.
Окончательное решение, о принадлежности исследуемого объекта к какому-либо классу принимается с помощью решающего просила - функции, определяющей принадлежность данного объекта одному из классов.
Таким образом, в терминах приведенных выше, задача РО формулируется следующим образом: на основании информации, заключенной в обучающей выборке, установить принадлежность к тому или «ному классу любого объекта исследования, представленного своим формализованным описанием.
В работе показано, что в настоящее время выделяют три подхода к решению задачи распознавания: нойросетевой, сзроятностный и алгебраический. Кратко изложена суть указанных подходов. Обоснован выбор методов РО алгебраического типа, основанных на алгоритмах вычисления оценок (ABO) для решения задач биофизических исследований. Праетика показала, что а биофизике алгебраичасхий подход к решению задач классификации дзот достаточно хорош*« результаты. Отчасти это связано со следующим:
1) вероятностный подход автоматичаски придает больший вес часто встречающимся событиям, а алгебраический ставит в равные условия как частые, так и редкие события; ,
2) для получения качественных вероятностных характеристик признаков вероятностный (статистический) подход требует однородных массивов исходны* данных, объем
н
которых только в обучающей выборке имеет порядок квадрата числа признаков; в медицинской же практике накоплены значительные массивы исходных данных в виде историй болезней, но имеющиеся результаты нельзя считать однородными, так как диагнозы ставились разными специалистами, в разное время, и при разном уровне знаний, накопленных в данной области;
3) в алгебраическом подходе при формировании обучающей выборки от эксперта не требуется разъяснение того, как он принимает решение о принадлежности обучающих объектов к классам, достаточно одного только утверждения о такой принадлежности;
4) алгебраический подход обладает тем привлекательным свойством, что объем обучающей информации в этом подходе' относительно невелик (порядка 10-20 эталонов на каждый класс).
Среди методов, реализующих алгебраический подход, выделены наиболее известные (в хронологическом порядке):
а) "тестовые" алгоритмы;
б) алгоритмы типа "Кора";
в) алгоритмы голосования;
г) алгоритмы динамического кластерного анализа.
В работе кратко описаны основные особенности этих методов и обоснован выбор автором методов, опирающихся на динамический кластерный анализ (ДКА).
Далее рассматривается процесс решения задачи РО, представленный в виде выполнения следующих двух этапов:
а) обучение;
б) принятие решения.
Отмечено, что этап обучения является по сути настройкой распознающей системы на заданную предметную область и выполняется единожды, в то время как принятие решения может повторяться многократно (по отношению к каждому новому объекту исследования) без перенастройки системы.
Этап обучения представлена в виде даух подэтапов:
- формирование обучающей выборки;
- определение границ кластеров'обучающей выборке на основе ДКА.
Особое внимание обращено на процесс формирования обучающей выборки, которая концентрирует в себе интеллектуальный потенциал создавшего ее эксперта.
Этап принятия решений заключается в определении численных оценок, характеризующих степень уверенности, с которой распознающая система относит описание любого заданного объекта исследования к каждому из заданных классов. На основании анализа полученных оценок делается вывод о принадлежности объекта к конкретному классу (определение и анализ численных оценок - главное свойство алгоритмов вычисления оценок).
В третьей главе описаны .основные особенности методов динамического кластерного анализа. На основе этих методов созданы 4 алгоритма кластеризации, 6 алгоритмов распознавания, 9 алгоритмов таксономии, а также 2 алгоритма вычисления "весов" признаков для предварительной оценки их информативности. Приведены основные требования к исходным данным, к принятой системе признаков, к обучающей и к контрольной выборкам.
Описаны самые распространенные на данный момент методы кластеризации, и на основе некоторых из них (метода ближайшего соседа и метода Ворда), разработаны алгоритмы кластеризации, образующие кластеры-гиперсферы.
Далее предлагаются методы предварительной оценки исходных данных методами таксономии и "взвешивания" признаков.
Таксономия • это разбиение обучающих объектов на группы при отсутствии информации о структуре классов внутри обучающей выборки, но при наличии какой-то другой априорной информации; например, требуемом числе классов. При анализе обучающей выборки нельзя математическими методами разработать состав признаков, но можно оценить качество обучающей выборки, осуществив, например, разбиение обучающей выборки на нужное число классов, заданное экспертом, и численный анализ результатов разбиения. Таким образом можно помочь эксперту осознать классовую структуру выборки. Иными словами, таксономия выступает как средство сопоставления человеческих и "машинных" представлений о структуре выборки.
"Взвешивание" признаков также может оказаться полезным для предварительной оценки исходных данных, а именно:
- алгоритмы кластерного анализа таковы, что могут учитывать веса признаков, если их. удается определить;
- все методы РО позволяют провести косвенную оценку "весомости" используемых признаков.
ю
Автором предложены две оценки для вычисления весомости признаков: пороговый и бвелороговый различающие веса.
В зтой же главе рассматривается вопрос выбора решающих функций (функций вычисления оценок), который определяется набором требований, естественных для кластерной структуры исходных данных. В работе рассматриваются 2 набора таких требований: зависящие от радиуса кластера и не зависящие от него. Функции, не зависящие от радиуса кластера;
- функция, обратная расстоянию от объекта до центра кластера
- функция, обратная сумме квадратов расстояний от объекта до всех объектов кластера, умноженной на коэффициент Ссх/попразки на число объектов в кластере. Возможные еариаиты коэффициентов Со?/.
- Сое/=!/К, где К- число объектов а кластере
- Со<»/=с£, где М- число объектов в обучающей выборка
- Со?/-с£, где I) - число объектов 8 классе, к которому относится кластер Функции, зависящие от радиуса кластера (более жесткие):
- функция типа потенциальных;
- функция стандартного нормального распределения с центром кластера в качастое математического ожидания, и выборочной дисперсией в кластере в качества дисперсии.
Первая из этих функций имеет следующий вид:
- номер распознаваемого объекта;
- номер кластера;
- оценка принадлежности объекта»кластеру к;
- вззешанноа звклздово расстояние между объектом / м центром кластера*; *
- радиус кластера к,
- константа, определяющая максимально возможное значение .оценяиЕ^
Использование последних двух функций позволяет решать задачу объективной (по физическому состоянию пациента) оценки аффекта лечения. Пусть, непример,
где
I к
Ей
А>0 1
проведена классификация пациента до лечения и в какой-то момент в процессе лечения. Пусть в результате обеих классификаций пациент отнесен к одному и тому же классу. Если при этом оценки принадлежности к этому классу до и в процессе лечения различны, то тогда, а зависимости от направления изменения оценки, метод лечения можот быть признан пригодным или нет. Так делают врачи и сейчас, но вручную и при гораздо более заметных изменениях.
В работе также рассмотрены три типа алгоритмов таксономии: концентрические, с фиксированным радиусом и итеративные. Эти три типа алгоритмов отражают три варианта задания требований к таксономии. Требования, соответственно, таковы:
- задано желаемое число классов;
- задан радиус классов;
- задано желаемое число классов и условие равенства радиусов классов.
Кроме того созданы две функции "взвешивания" признаков, о которых говорилось вышэ. Эти функции имеют вид {приведены наиболее простой и наиболее сложный варианты):
Пороговый различающий пес признака р в двуклассной выборке -
где Öt, - значение признака номер р у объекта номер /, tpsr - "порог различимости" для признака номер р: т/М - верхние границы (номера объектов) для соответственно первого и
Беспороговый различающий вое набора признаков р,..р, (V{p,)) в ¿-классной выборке размером M объектов:
h/2p " 2L. h.),p
(1, ' (OÙ,-оJ.,)*eps'i
0, (Oi,P-Oj.Py<eps
второго классов.
! £
K(0,)*Kj
где
p(OhK QinJ p(Oi,Ot)t
ш>хО/- штО/ у 1
где К, - класс номер у,
ЛУО») - класс, которому принадлежит объект номер I, О, - объект номер' /,
- значение признака номер р у объекта номер В. третьей главе проведен также анализ разработанных алгоритмов. Были исследованы алгоритмы кластеризации и доказано выдвинутое автором предположение о совпадении результатов алгоритма ближайшгзго соседа с коррекцией на центр масс кластера и алгоритма Вордз. На этом основании числено определено преимущество использования алгоритма ближайшего соседа. Оно составило два порядка по операциям умножения и деления и один порядок по операциям сложения, вычитания и вычисления эвклидова расстояния.
Получены положительные результаты по оценке эффективности алгоритмов принятия решений при классификации контрольных объектов (на обучающих объектах алгоритмы не обучаются). Получены также сравнительные характеристики использования различных -алгоритмов принятия решений.
По алгоритмам таксономии получены следующие основные результаты. Ошибка при сравнении результатов таксономии с желаемым разбиением на классы колеблется от 25% до 33%. Многократное применение различных алгоритмов таксономии к различным комбинациям объектов является, как показывает опыт, неплохим средством оценки "классифицируемости" обучающих выборок. Очевидно, что высокий процент ошибок при таксономии (болез 60%) может служить свидетельством того, что добиться в дальнейшем высокого качества классификации не удастся (например, из-за неудачного выбранных признаков или обучающих объектов).
В алгоритмах", "взвешивания" признаков сочетается статистический характер рассматриваемых функций с имеющимися исходными данными. Получены следующие основные результаты.
1. Экспериментально получены и теоретически обоснованы свойства порогового различающего веса (монотонность, значимость для эффективности классификации, соотношение с точностью задания признака и др.) Для беспорогового различающего веса
характерны все те же свойства, что и для порогового, за исключением свойств, связанных с порогом точности, поскольку само понятие беспорогового различающего веса направлено на избавление от понятия порога.
2. Статистическая величина "корреляция" не подходит для оценки веса признаков, так как учитывает синхронность изменения признака внутри различных классов, в то время как для методов РО значение имеет их асинхронность вне классов, что не одно и то же.
В четвертой глава рассмотрены особенности программной реализации упомянутых выше алгоритмов. Приведены блок-схемы программ и соображения в защиту выбранных языков программирования высокого уровня. Они нижеследующие:
1. Автоматизированная система должна быть использована экспертом. Самой распространенной сейчас (например, а ОНЦ РАМН) вычислительной техникой являются ЭВМ класса IBM PC 388. Следовательно, система, основанная на разработанных алгоритмах, должна опираться на особенности этого класса компьютеров, а именно: однопроцессорность, невысокая производительность, небольшой объем оперативной памяти (по сравнением с супер-ЭВМ и вычислительными комплексами), использование операционной системы MS-DOS и др.
2. Алгоритмы распознавания, использующие методы кластерного анализа, на требуют непосредственной работы с оперативной памятью и другими устройствами для уменьшения временных затрат, поэтому основные требования к языку реализации инструментальной системы (предназначающейся для исследователя свойств алгоритмов) - простота и удобство отладки. Так как при отладке удобнее всего употреблять аппарат строгой типизации, то в иснтрументальной системе использован языке PASCAL. Кромо того, разработчик, как правило, не нуждается в изысканном интерфейсе, в связи с чем программу не нужно писать в среде Windows.
3. Существующая версия компилятора языка С++ для среды Windows позволяет создать для системы распознавания максимально дружелюбный интерфейс, что важно для использующего ее эксперта, так как дружественный интерфейс позволяет преодолеть возникающий у предметного специалиста барьер отчужденности от ЭВМ.
В этой же глава подробно описаны следующие случаи практического применения разработанных программ:
а) при классификации очень малого (5-в эталонов на класс) числа крыс, получивших однократное тотальное рентгеновское облучение с дозами 100, 250, 500 и 1000 бэр:
низкая эффективность (66% правильно классифицированных контрольных объектов) объясняется крайне малым числом обучающих объектов и признаков;
b) при классификации мышей с перевитой опухолью - раком шейки матки штамм BMP: при помощи таксономии опредепана наиболее вероятная граница разделения стадий развития опухоли и проведена классификация с эффективностью 92.5%;
c) при классификации по группам риска заболевания пациентов, получивших малые дозы непрерывного облучения - жителей гг. Злынка (накопленная доза 6.3 бэр), Клинцы (1.6 бэр): классификация проводилась также вместе с классом "норма" - жители Москвы - и ее эффективность составила от 87% до 93.5%,
d) при классификации по группам риска заболевания жителей поселков Красногорского района (накопленные дозы от 0.1 до 2 бэр) по классам 'менее 1 бэр" и "более 1 бэр* эффективность классификации составила 70%; классификация этих пациентов на классы "норма"-"патопогия (более 1 бэр)" составила 86.3% и позволила построить кривую "доза-эффект" в диапазоне 6.1-2 бэр;
e) при исследовании различия а результатах классификации людей до и после полученного ими однократного рентгеновского облучения в пределах 0.06-0.8 бэр по классам "норма'-'патолошя* как в пункте' d), которое показало, что и до и после облучения пациенты были отнесены к классу "норма'', но оценка их принадлежности к этому классу уменьшилась;
f) при исследовании влияния проведенного лечения на классификацию пациентов МНИИДиХ МЗ РФ по классам "норма*.- "патология", которое позволило соотнести мнение врачей и мнение классифицирующей системы об успешности лечения, совпавшее в 70%; эффективность классификации составила 94%.
В заключении сформулированы основные результаты и выводы по диссертационной работе.
В приложении приведены полученные при экспериментальных исследованиях зависимости, иллюстрирующие свойства разработанных алгоритмов.
Благодарности.
Автор хотел бы выразить ежою благодарность коллективу дозиметрической лаборатории МНИИДиХ и ев руководителю профессору Р.В.Ставицкому за оказанную при написании диссертации поддержку и за материалы, предоставленные для тестирования разработанных алгоритмов.
Основные результаты и выводы.
1. Отличия разработанной? математического аппарата от существующих методов.
• для рассматриваемых биофизических задач аппарат теории распознавания образов применяется впервые;
• разработанный аппарат учитывает особенности исходных данных рассматриваемых биофизических задач - эти особенности отражаются в параметрах алгоритмов;
• реализация созданного аппарата о виде программ для персонального компьютера с дружественным интерфейсом позволяет любому желающему использовать его везде, где есть компьютер, на занимая процессорное время целиком.
2. Преимущества ". использования разработанного математического аппарата.
Описанный в работа мате?латачзский аппарат позволяет.
» реализовать высокоэффективную упрощенную методику оценки повреждения организма, причем эффективность аппарата выше, чем у существующих биофизических методов, а диапазон исходных данных шире;
• выявлять и числено оценивать малое вредное внешнее воздействие на организм;
• оценить пригодность выбранных характеристик организма для проведения классификации, а также оценить значимость каждой из них для классификации;
» сделать предположении о разбиения объектов на классы, когда схема разбиения неясна даже эксперту,
» обойтись без значительных технических ресурсов: аппарат легко реализуется и работает в реальном времени на персональных компьютерах 1ВМ РС 3863Х и выше.
3. Задачи, для решения которых пригоден предложенный математически^ аппарат:
• оценивание состояния биофизической системы;
• выявление степени неблагоприятного воздействия на биофизическую систему;
• оценка результатов лечения заболевания;
« мониторинг населения и другие задачи массового характера;
• создание информационных обучающих систем.
Список работ, опубликованных по теме диссертации
1. Бвридзо АЛ Гопьф&гьд Г.Б., Гуслистый ВЛ. Нестатистические алгоритмы распознавания образов и особенности их применения в медицинской диагностике. -"Проблемы окружающей среды и природных ресурсов" .№>11,1996. М.. ВИНИИТИ.
2. Гопьфвльд Г.Б., Бвридзо АЛ Применение нестатистических алгоритмов распознавания образов в. медицине. - -Проблемы окружающей среды и природных ресурсов", Nsl 1,1996, M,. ВИНИИТИ.
3. Гопьфальв Г.Б.,Бвридэв АЛ Проблема классификации объектов о медицинской диагностике. - "Проблемы окружающей среды и природных ресурсов" , №11. 1996, М., ВИНИИТИ.
4. Бвридзв АЛ Применение нестатастичоских методов распознавания образов для оценки радиационного воздействия на человека малыми дозами, г "Экологическая экспертиза", №1. 1997. М.. ВИНИИТИ.
5. Гуслистый ВЛ., Бвридзэ АЛ- Методы определения значимости показателей крови для улучшения качества экологической экспертизы. - "Зкологичоская экспертиза", №1, 1S97, М..ВИНИИТИ. *
в. Cmaeuu/tuü Р.В., Гуслистый ВЛ., Бвридзв АЛ- Медицинская диагностика и динамический кластерный анализ: алгоритмы кластеризации, некоторые их свойства и возможности применения. - "Проблемы окружающей среды и природных ресурсов", №2. 1997, М., ВИНИИТИ.
7. Cmaeuuf(uü Р.В., Гуслистый ВЛ.. Боженко ВЛ. Бвридзв АЛ, Шишкин AM Использование нестати стических методов распознавания образов для оценки степени неблагоприятного воздействия в радиоэкологии. - "Проблемы окружающей среды и природных ресурсов", №4,1937. М„ ВИНИИТИ.
8. I.M.lebedenko, R.W.Stawitsky, LE.Sergeyov, W.P.Guslistyi, À.D.Bertdze, W.N.Rozental. Tha Estimation of the Effect of Therapy using Physical and Analytical Methods. - 'Medical Physics end Biomedical Engineering", №9, 1997, Warsaw.
TUmsooso » веча» " Формат 60Xf//(£ | Заказ -{Ц ~
Ус*, сеч. л. 4jO T*psx.$£~
Тяазграфш Россея&хомжадаога