МИНИСТЕРСТВО ОБЩЕГО И ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ.
МОСКОВСКИЙ ИНСТИТУТ РАДИОТЕХНИКИ ЭЛЕКТРОНИКИ И АВТОМАТИКИ
(технический университет).
ФАКУЛЬТЕТ: Кибернетики. КАФЕДРА: ИТС.
САМОСТОЯТЕЛЬНАЯ РАБОТА
ТЕМА: "Экспертные системы."
ДИСЦИПЛИНА: Синергетические системы.
Студент:
Группа: ИК-1-96.
Руководитель:
Москва 2001.
ЭКСПЕРТНЫЕ СИСТЕМЫ
Введение.
Экспертные системы (ЭС) - системы знаний Система - совокупность элементов объединенным самоорганизующим единством целей и функциональной целостности взаимодействующих элементов. ЭС это информационная технология в которой отражаются некоторые системные элементы настоящей системы. ЭС используются для решения проблем, обычно требующих вмешательства человеческого интеллекта, человека - эксперта в определенной предметной области. ЭС являются моделью интеллектуальной деятельности человека.
Так как ЭС больше связаны со Знаниями, рассмотрим способы представления знаний в машине и аналог представления знаний человеком в информационном мире.
Общие положения.
Компьютеры обычно оперируют алгоритмами и данными. Алгоритм определяет, как решать некий класс задач, а данные характеризуют параметры информации. Знания же человека состоят, скорее всего, из элементарных фрагментов. Поскольку этих фрагментов неизмеримо много, нужны оригинальные подходы к их обработке - "неалгоритмические". Что такое алгоритм? По Колмогорову, алгоритм определяется следующей последовательностью действий [2].
1. Алгоритм Г, применяемый ко всякому условию (начальному состоянию) А из некоторого множества состояний g(Г) - "области применения алгоритма", дает "решение".
2. Алгоритмический процесс расчленяется на отдельные шаги заранее ограниченной сложности; каждый шаг состоит в "непосредственной переработке" возникшего к тому шагу состояния S в состояние S*=WГ(S).
3. Процесс переработки А°=А в А'=WГ(А0), А' в А2 =WГ(А1) и т. д. продолжается до тех пор, пока не произойдет безрезультатная остановка (если оператор Qr не определен для получившегося состояния), либо не появится сигнал о получении решения. Не исключается возможность неограниченного продолжения процесса.
4. Непосредственная переработка в S*=WГ(S) производится лишь на основании информации о виде заранее ограниченной "активной части" состояния S и затрагивает лишь эту активную часть.
Примечание: WГ задается конечным набором правил, имеющих вид Ui®Wi. где (Ui®S) Ui , заменяют на Wi .
Более внимательное рассмотрение показывает, что знания человека не всегда можно представить алгоритмом. Появились более свободные его толкования. Эти вычисления стали более или менее "обозримыми", запараллеленными. Так, в 1942 г. появилось понятие продукции Поста. Продукция - правило вывода, порождающее правило. Это правило оказалось очень полезным для понимания систем, воспринимающие знания экспертов, и далее делающие рассуждения, по качеству не уступающие работе консилиума знатоков своего дела. ЭС должна обладать способностью: получения знаний от экспертов, организации знаний, представления знаний, вывода экспертных рекомендаций, объяснения выводов.
Ньюэлл ввел понятие неформализованных задач [3,4], которые отвечают следующим условиям: они не заданы только в числовой форме; цели их решения не выражены в терминах функции; нет алгоритма решения задачи; есть алгоритм, но нет ресурсов. Особенности таких задач выражаются в:
ошибочности, неоднозначности, неполноте и противоречивости исходных данных; большой размерности; динамичности и символьном представлении данных.
Пост исходил из идеи, что правила вывода не обязаны иметь, что-либо общее с логикой рассуждений. До 1942 г. используемые для представления знаний канонические исчисления представлялись необычайно сложными. С этой идеи началась теория дедуктивного вывода. Дедуктивная система подразумевает наличие некоторого количества исходных объектов и некоторого количества правил построения новых объектов из исходных и уже построенных.
Фундаментальный результат Поста в том, что можно обходиться одними лишь однопосылочными правилами (например Gp®pG', где р - переменная, a G и G' - слова в алфавите исчисления). Он доказал теорему: для любого канонического исчисления К=(А, Р,c,p) можно построить эквивалентное относительно А каноническое исчисление К', имеющее одну аксиому и только однопосылочные правила вывода.
Каноническое исчисление - это четверка вида (А, Р,c,p), где А, Р - не пересекающиеся алфавиты (А - исчисление, Р- переменные), c - список аксиом (слов, предложений, высказываний), p - список правил вывода, состоящих из посылок и заключения.
Для определения подходящей ЭС надо решить два основных вопроса:
определить типы сложности проблемной области и возможностей эвристического решения проблемы. Следует иметь в виду нарастание сложности решаемых проблем в следующем порядке:
· данные и знания достоверны и фиксированы (точный поиск, монотонный вывод, единственная линия вывода);
· недостоверность данных или знаний (поиск подтверждений из многих источников, вероятностные модели, нечеткие модели);
· данные изменяются во времени (статично-переключающиеся методы, временная логика, системная динамика);
· нет оценок для отдельных решений (фиксированный порядок абстрактных шагов);
· нет фиксированной последовательности подпроблем (абстрактное поисковое пространство);
· подпроблемы взаимодействуют между собой (ограниченная защита, минимизация передач);
· требуется эффективная догадка (эвристические методы, оценка доверии для получения наилучшего вывода);
· единственная линия вывода слишком неустойчива (множественность линий вывода);
· единственный источник знаний слишком недостоверен (гетерогенные модели, расширенный поиск);
· метод представления знаний неэффективен (обращение структур данных, компиляция знаний, экономия знаний).
Вся организация ЭС направлена на разрешение противоречия между "очевидностью и хитроумностью". "Очевидность" (очевидные, известные знания) ассоциируется с процессом инженерии знаний - экстракцией знаний экспертов и интеграцией знаний в соответствующую архитектуру. "Хитроумность" (новая, ранее не известная информация, содержащая новые знания) ассоциируется со способами использования экстрагированных знаний для решения проблем, не всегда похожих на те, которые служили в качестве основы процесса экстракции. Т. е. существует проблема взаимного перехода Информации в Знание и Знания в Информацию для обеспечения равновесия системы на содержательном уровне.
Условно различают четыре класса методов представления знаний в ЭС:
семантические сети, логические подходы, фреймы, продукции.
Понятие семантических сетей возникло в конце 60-х годов. Общим для этого подхода является использование графов. Узлы в них представляют понятия ("накладная", "расписка", "автомобиль" и пр.), а дуги - отношения между ними ("совпадает", "является", "принадлежит" и пр.).
Логические подходы строятся на базе исчисления предикатов, использования кванторов существования и всеобщности. Предикатом Р(c1,...., cn) называется функция Р:Мn®В, где М - произвольное множество, а В - множество булевых переменных, то есть это двузначная функция от n переменных, принимающая значения "истина" или "ложь". Например, чтобы сделать вывод о том, что Ваня обладает именем, необходимо объявить: а) все люди обладают именами, б) Ваня является человеком. На логическом языке это будет выглядеть следующим образом: a) "c человек (c) Þ обладает именем (c); б) человек (Ваня); в) обладает именем (Ваня).
Фреймы занимают промежуточное положение по сложности и гибкости представления знаний между семантическими сетями и исчислением предикатов. Фрейм можно определить как логическое описание фрагмента знаний, ассоциируемого со стереотипными ситуациями. Каждый элемент фрейма называется "слотом". Он может указывать на другой фрейм. Например, фрейм комнаты может состоять из элементов комнаты (потолок, стена, пол, окно и пр.). О продукциях уже было рассказано ранее. Примеры работы ЭС можно найти в литературе по экспертным системам, например [8,9].
Системообразующие факторы.
Как отмечалось выше ЭС используются для решения проблем, обычно требующих вмешательства человеческого интеллекта, человека - эксперта в определенной предметной области. ЭС являются моделью интеллектуальной деятельности человека.
Точнее моделью человека-эксперта, как системы настоящей, самоорганизующейся, целеустремленной, функционально целостной.. В общем случае целостность системы любой природы и сложности обеспечивают четыре элемента Вещество Энергия Знание и Информация. Эти элементы поддерживают систему в равновесном состоянии, переходя в случаи необходимости из одной субстанции в другую. ЭС целостна в смысле наличия данных четыре составляющих, в большей мере Знания, Вещества и Информации и в меньшей мере Энергии, однако механизмы перехода между субстанциями до конца не отлажены, поэтому равновесное состояние не достигается, существует не адекватность ЭС как модели (человека - эксперта) и человека как субъекта. Подробнее структура ЭС будет рассмотрена ниже. Структура любой системы однозначно определяет ее свойства. Главное свойство любой системы это взаимодействие на уровне субъект - объект. Взаимодействие является вечной сущностью природы. Целью разработки и построения ЭС (т. е. объекта (модели) человека - эксперта) является создание действительной системы работающей и дающей те же результаты, что и реальный объект - человек - эксперт при взаимодействии с другим человеком - субъектом. Системообразующие факторы более подробно рассмотрены ниже.
Составные блоки экспертных систем представлены на рис. 1, а структура на рис. 2. Структура системы однозначно определяет ее свойства. Основные идеи, которые кладутся в основу конструирования ЭС, состоят в следующем [5]:
ЗНАНИЯ = факты + доверия + эвристики;
УСПЕХ = нахождение хорошего ответа при доступных ресурсах;
путь к эффективности лежит через: использование корректных и ясных знаний, смелое исключение слепых и непонятных ходов, увеличение производительности компьютера, кооперативность источников знаний;
источники усложнения проблем - это огромные массивы знаний, динамически изменяющиеся данные под воздействием окружающей среды и новой поступающей информацией, большое число вероятностных и возможных оценок, сложные процедуры вывода.


Рассмотрим компоненты структуры целостной системы Вещество, Знания Информация применительно к структуре ЭС. Компонента Энергия слабо отражается в структуре ЭС, что еще раз указывает на то, что ЭС «не совсем» система.
Компонента Вещество - форма - отражена в структуре в виде собственно компьютера - технического средства воплощения ЭС. Вещество это собственно то из чего сделаны элементы ЭВМ. Сразу видно, данный компонент не может участвовать в процессе самоорганизации всей системы в силу своей неизменяемости. Раз и навсегда установленные искусственные технические элементы в архитектуре ЭВМ не способны самопроизвольно меняться для самоорганизации и развития в отличии, от живых организмов (в частности человека). Не возможна самоадаптация к изменяющимся внешним условиям.
Компонента Знания как содержание системы в ЭС представлены в виде Базы Знаний (БЗ). Способы представления знаний в ЭС описаны выше. Знания представляемые в ЭС организованы подобно знаниям человека, однако очевидно, что даже современные методы не обеспечивают гибкости знаний, как в реальной живой системе. БЗ с механизмами вывода собственно моделируют искусственный интеллект человека - эксперта в определенной предметной области. Но у машины нет ни сознания ни подсознания. Самоорганизация знаний как составной части интеллекта, а тем более самого интеллекта, в ЭС если и существует, то на самом примитивном уровне.
Компонента Информация - важная компонента системы. ЭС собственно и предназначена для работы с информацией. Информация тесно связана со Знанием. Главной проблемой ЭС как системы является проблема перехода информации в знание, т. е. выявление и приобретение знаний из новой ранее не известной информации. Информация регистрируется сенсорами. На сегодняшний день проблемой перехода информации в знания в основном занимаются люди - эксперты, когнитологи, разработчики ЭС, не сама система. Это является показателем того, что сама ЭС не самоорганизующаяся, и мало взаимодействующая с внешним миром система.
Различают термины "выявление знаний" и "приобретение знаний". Выявление знаний - выделение в сообщениях, полученных от некоторого источника информации, фрагментов модели действительности. Приобретение знаний - более общий термин, включающий две фазы: выявление знаний из источника и перенос выявленных знаний в компьютер. Удобно обобщить сказанное, кратко описав этапы разработки ЭС [5] (рис. 3).

Идентификация. Задачи этого этапа состоят в: определении участников процесса проектирования и их роли (количество, формы взаимодействия и др.), идентификации проблемы, определении ресурсов и цели. Идентификация проблемы заключается в неформальном описании проблемы, выборе ключевых слов и понятий, отношений, входных данных, видов решения; знаний, релевантных проблеме.
Концептуализация. Она состоит в экспликации ключевых понятий, описаний и характеристик. Определяется: тип доступных данных, выводимые данные, подпроблемы, стратегии и гипотезы, виды взаимосвязей между объектами, типы отношений (иерархия, причина-следствие, часть-целое и т. д.), типы ограничений на решение, состав знаний для решения..
Формализация. Здесь приступают к описанию имеющейся картины на формализованном языке. Определяют состав и способы представления декларативных и процедурных знаний. Описывается процесс решения проблемы. Он зависит от структуры пространства поиска; модели проблемы;
свойств данных. Оцениваются возможности выбранного инструментария. Структура пространства поиска понимается через определение связей понятий друг с другом при образовании гипотез. Начинает формироваться модель проблемы.
Выполнение. Создается один или несколько прототипов ЭС. Осуществляется программирование прототипа или выбор из имеющихся. Одновременно начинается приобретение знаний. Здесь обычно не рассматриваются сложные вопросы: общение на естественном языке, размытые рассуждения и др. Создается средство для сбора замечаний пользователей. Знания начинают структурироваться, выделяются обобщенные и абстрактные знания, разбиваются громоздкие правила, заменяются несколько похожих правил вывода одним. Для следующего прототипа уже решаются задачи анализа функционирования системы при расширении базы знаний, исследования возможности решения более широкого круга задач, уточнения границ проблемной области, анализа мнений пользователей о недостатках системы, опробования реализации ввода-вывода данных на ограниченном естественном языке. Начинается извлечение знаний, включающее в себя: наблюдение работы эксперта, анкетирование, беседа с экспертом, сбор косвенных сведений, поиск объяснений поведения эксперта. Осуществляется структурирование знаний, нахождение абстрактных понятий.
Тестирование. Оценивается выбранный способ построения системы. Обычно тестирование идет покомпонентно. Сначала, например, проверяется операция ввода-вывода, затем работа правил вывода, оценивается управляющая стратегия, проверяется механизм объяснения результатов вывода. Ищутся ошибки построения системы: правила вывода не так взаимосвязаны, появляются бессмысленные выводы, неправильный порядок рассмотрения данных.
Опытная эксплуатация. ЭС проверяется в работе с конкретным пользователем. Оценивается полезность системы - ее способность удовлетворять в диалоге потребностям пользователей, выявлять и устранять причины неудач. По результатам опытной эксплуатации принимается решение о переводе системы на другой язык программирования.
Возможна модификация системы. При этом переформулируются элементарные понятия и требования пользователя, переконструируются представления и усовершенствуется прототип. Усовершенствование прототипа заключается в дополнительной отладке правил вывода. Изменения, как показано на схеме, могут затронуть самые начальные этапы.
Резюме.
Человек мыслит логично - такая парадигма не теряет своей актуальности уже долгое время. Вместе с тем - алгоритмическое, формализованное представление процесса мышления - это слишком просто, что тоже понятно. У человека в голове хаос мыслей - это совсем не целенаправленно, неконструктивно. Золотая середина этих крайностей: человек мыслит логическими фрагментами, продукциями, фреймами - это предположение легло в основу создания большого класса систем - экспертных систем. Однако ЭС не есть система в строгом смысле понятия система, скорее это определенная информационная технология. Отличие данной информационной технологии от системы в том, что она функционально не целостна, слабы механизмы поддержания равновесия системы, не развиты процедуры самоорганизации целеустремленности и взаимодействия с окружающим миром. Существующие ЭС, как модели человека - эксперта в определенной предметной области, узко направлены и слабо адекватны реальным системам живой природы, в частности человеку и его интеллекту.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Н Интеллектуальные информационные технологии - М.: МИРЭА.,-2000.-94с.
2. Колмогоров информации и теория алгоритмов - М.: Наука. - 1987.-304 с.
3. Мальцев и рекурсивные функции. - М.: Наука. Гл. ред. физ.-мат.-1986. - 368 с.
4. Теория формальных систем. Пер. с англ./ Под ред. . - М.: Наука. Гл. ред. физ.-мат. лит. -1981. - 208 с.
5. Encyclopedia of artificial intelligence/ Stuart C. Shapiro, editor-in-chief.-2nd ed. "A Wiley-Interscience publication." John Wiley&Sons, Inc. NY/ Chichester/ Brisbane/ Toronto/ Singapore. - 1688 p.
6. Осипов знаний интеллектуальными системами: Основы теории и технологии. - М.: Наука. Физматлит, 1997.-112с.
7. Трахтенгерц поддержка принятия решений: научно-практическое издание. Серия "Информатизация России на пороге XXI века". М.:СИНТЕГ, 1998 . - 376 с.
8. Попов системы: Решение неформализованных задач в диалоге с ЭВМ. - М.: Наука. Гл. ред. физ. мат. лит., 1987. - 288 с.
9. , , Шапот и динамические экспертные системы: Учебн. пособие. - М.: Финансы и статистика, 1996.


