Создание экспертных систем

СОДЕРЖАНИЕ: Формы представления знаний. Семантические сети. Правило продукции. Фреймы. Автоматическая генерация знаний. Тестирование экспертных систем.

Экспертные системы

Компьютериз ация общ ества - одн о из основн ых н аправлен ий н аучн о-технического прогресса - вызвала сущ ествен ные изменения в технол огии раз работки и использования програм мных средств.

Эти изменения были подготовл ены всем развитием теории и практики искусственного интеллекта (ИИ), наиболее существенным рез ультатом которого явился переход к так называемой новой информационной технол огии и создание “экспертных си стем (ЭС).

Первые ЭС- медицинские mycin и dendral для приложений по химии появились в середине 70-х годов в рамках исследовательских программ по искусственному интеллекту. Уже первые ЭС оказались полезными. Медицинская система mycin успешно вписалась в клиническую практику, помогая в выборе лекарств больным с бактериемией, менингитом, циститом.

Идеологию ЭС можно выразить формулой: знание + вывод=система. ЭС предполагает взаимодействие блоков. Главные из них – база знаний и механизм вывода.

Суть происшедших технологических изменений закл ючается в появлении нового класса инструментальных средств ИИ, который стал основой создания конечных программных продуктов на основе принципиально другой технологии, с новыми качественными возможностями соз даваемых продуктов, эти изм енения существенно повышают интелл ект программ, новые средства з аменили целую технол огическую цепочку, в которой между коне чным пол ьзователем и ЭВМ находил ось нескол ько посредн иков.

Эти изменения стал и возможными благодаря двум основным факторам : выдел ению в алгоритме программы н екоторой ун иверсал ьной части (логи ческого вывода ) и отделению ее от части, з ависящей от предметной области (базы зн аний); повышению уровн я взаимодействия пользовател я и компьютерной программы, т.е. появлению интел лектуального интерфейса в программах ИИ.

Обычные программы имеют фиксированную последовательность шагов, точно определяемых программистом, и путем обработки числовой информации ищут оптимальное решение, в то время как программы ИИ, подобно человеку, пользуются для нахождения удовлетворительного решения методом проб и ошибок. При этом производится преимущественно символьная обработка содержимого базы знаний. Различия эти, разумеется, не абсолютны, а лишь наиболее характерны для обоих типов программ. Различие в структуре и частоте мод ификаций влияет на различия технологий разработки обычных программ и программ ИИ. Все различия, приведенные д ля программ ИИ, в целом характерны и для экспертных систем.

Изменение в структуре и повыш ение вследствие этого общего интелле кта компьютерных программ является ключевым для определения экспертных систем, и это естественно, так как, для того чтобы стало возмож ным повысить интеллект программ, необходимо усл ож нить их организацию и структуру. Таким образом, можно попытаться дать определение экспертной системы.

Экспертная система - это компьютерная программа, которая моделирует рассуждения человека-эксперта в некоторой определенной области и использует для этого баз у знаний, содержащую факты и правила об этой облас ти, и некоторую процедуру логического вывода.

Для того чтобы пользователь мог эффективно взаимодействовать с экспертной системой, ее интерфейс должен выполнять две основные функции: давать советы и объяснения пользователю и управлять приобретением знаний. Взаимодействие эксперта, пользователя и структурных частей с истемы можно представить в виде базовой структуры экспертной системы.

У экспертной с исте мы долж но быть два режима работы: режим приобретения знаний и режим решения задач. В режи ме приобретения знаний эксперт общается с экспертной системой при посредничестве инженера знаний, в режиме решения задач в общении с экспертной системой участвует пользователь, которого интересует результат и способ его получения. Экспертная система в отличие от решения задач по алгоритму не исключает пользователя из решения, а, наоборот, сохраняет за ним инициативу. В то ж е время ЭС не является просто пассивным ис точником полезной информации подобно книжному справочн ику или базе данных. В нужные моменты ЭС подсказ ывает необходимое направление решения задачи, развивает цепочки умозаключений, объясняет свои действия.

Искусс тве нны й интеллект д авно стал источником новых технологических приемов, решений, которые широко вошли в практику программирования, так, в работах по искусственному интеллекту берут свое начало такие ид еи, как разд еление времени, обработка списков, редактирование и отладка программ в диалоговом режиме, эвристическое программирование, графический интерфейс, использование полиэкранного дисплея и манипулятора типа мышь и др.

С точки зрения решения основной задачи экспертных систем: кодирования знаний о предметной области и их использования для решения проблем в этой области наиболее существен опыт исследователей искусственного интеллекта в решении задач представления знаний и распознавания образ ов.

Объем знаний, необходимых для любого значительного приложения экспертных систем, обычно очень велик и поэтому для выборки, обновления и поддержания таких больших объемов знаний экспертным системам необходимы хорошие модели представления знаний. Кроме того, удачная модель представления может значительно облегчить построение логического вывода. в экспертных системах наиболее часто используется представление знаний в виде продукционных правил, фреймов. Используются также семантические сети, предложения Пролога и комбинированные представления. Каждая из этих моделей имеет свои преимущества и недостатки, например, семантическая сеть хранит связанную информацию вместе, но в ней затруднено построение выводов из этой информации. С другой стороны. Пролог имеет готовый механизм для построения логических выводов, но не хранит связанную информацию вместе. Большие базы знаний хранятся обычно на дисках и только необход имая в данный момент часть - в оперативной памяти. Создание эффективных баз знаний для хранения правил, фреймов и т.д. является актуальной з адачей.

В целом представление знаний является наиболее важной проблемой при построении экспертных систем и более подробно она будет рассмотрена ниже.

Традиционно процесс распознавания разделяется на два этапа: обучение и собственно распознавание. Первый этап инд уктивный, второй - дедуктивный.

На первом этапе обрабатываются данные многочисленных наблюдений над отдельными пред ставителями исследуемого класса объектов и на основе полученных результатов строится некоторое решающее правило.

Второй этап предполагает применение описанного при вила для распознавания интересующих нас, но непосредственно не измеряемых свойств других объектов данного класса.

На этапе обучения выявляются некоторые закономерности, присущие исследуемому классу, и совокупность этих закономерностей служит далее моделью предметной области, которая в формализованном вид е составляет основу базы знаний, на основе модели решаются задачи распознавания свойств конкретных объектов, очевидна связь обучения и решения задач с описанными ранее режимами работы ЭС. Описанная схема распознавания в той или иной мере характерна для многих задач, решаемых экспертными системами.

Экспертные системы ориентированы на решение широкого круга задач в неформализованных областях, решение задачи распознавания образов в таких областях предполагает составление описани й объек тов и правил, определяющих по этим описаниям принадлежность объектов к тем или иным классам. Процедуры применения таких правил к каким-либо объектам в экспертных системах подчиняются различным стратегиям. Наиболее часто применяются стратегии прямого или обратного вывода. Используются также комбинированные стратегии, стратегии на основе так называемой доски объявлений. Прямой вывод - это вывод, направляемый целями (правилами) к данным. Обратн ый вывод - это вывод, направляемый данными к целям. В сложных экспертных системах (например, понимания речи) ни один из источников знаний системы не может гарантировать единственности и правильности получаемых им рез ультатов, для того чтобы ошибка одного источника знания не влияла роковым образом на работу других, источники знания должны рассматриваться как независимые. Однако, так как все источники знания решают общую задачу, от них требуется взаимодействие. Чтобы удовлетворить эти требования, был предложен механизм доски объявлений.

На доске объявлений записываются промежуточные гипотезы и результаты работы ЭС в виде плана, заявок, решений.

План описывает способ, которым ЭС будет искать решение задачи. Текущий план включает такие элементы, как цели, состояние задач.

Заявки содержат информацию о потенциальных действиях, ожидающих выполнени я, которые обычно соответствуют правилам из базы знаний.

Решения представляют гипотезы и решения, выдвинутые в качестве возможных кандидатов, вместе с зависимостями, связывающими одно решение с другим.

Интерпретатор базы знаний определяет, какую заявку следует обработать следующ ей, и выполняет заявку путем применения соответствующего правила из базы знаний. В общем случае интерпретатор выявляет выполнимость условий применения правила, связывает переменные в этих условиях на доске объявлений, а затем осуществляет те изменения на доске, которые предписываются этим правилом. Например, план может рекомендовать сначала обработать все данные некоторого уровня, затем сформулировать перспективные гипотезы, уточняя и развивая каждую из них до тех пор, пока не останется одна, после чего все время будет уделено этой единственной гипотезе до получения окончательного решения.

Таким образом, экспертная система - это компьютерная программа с некоторыми отличиями в структуре и характеристиках по сравнению с традиционными программами.

Наличие базы знаний и относительно универсального интерпретатора делает принципиально возможным создание новых экспертных си стем для новых приложений путем разработки новой базы знаний без изменения интерпретатора. Процесс разработки экспертной системы, таким образом, можно свести (при наличии готового интерпретатора) к процессу разработки базы знаний. Такая технология получила название технологии пустых оболочек, когда однажды разработанная экспертная система использ уется в качестве оболочки для новых знаний, как правило, различные приложения существенно различаются, и поэтому для ее реализации необходимо иметь большой набор оболочек с различными моделями представления знаний и различными механизмами логического вывода.

Для разработки ЭС используются те же языки и системы программирования, что и для обычных программ, но наличие таких специфических для ИИ структурных частей, как логический вывод, естественно-языковый интерфейс, делает предпочтительным использование для разработки ЭС таких языков ИИ, как Липс , Пролог и специальных средств поддержки разработки.

Особенно перспективной для экспертных систем оказалась реализац ия языка Пролог. Основная идея логического программирования состоит в отделении логики программы от управления ходом вычислений, что делает процесс соз дания программы более проз рачным.

Целью поддержки разработки является облегчение творческого и инте ллектуального пути от идеи к ее описанию в доступной ЭВМ форме, специфика средств, яз ыков программирования и пользовательских интерфейсов оказываю т существенное влияние на технологию создания ЭС: разработчику приходя тся тратить больше времени на перевод идеи на язык ЭВМ, чем на доводку самой идеи. Поддержка разработки должна освободить пользователя от как можно большего числа деталей и позволить ему сосредоточиться на идее.

Эволюция средств разработки ЭС может быть разбита на четыре этапа. Для этой эволюции характерны две тенденции: увеличение степени охвата этапов жизненного цикла ЭС; движение от использования дискретных средств ко все более интегрированным целостным системам.

Существуют различные средства поддержки разработки программ. Трансляторы яз ыков программирования и отладчики для контроля за состоянием программ во время выполнения были в числе первых таких средств. Отладчики наряду с экранными редакторами и в настоящее время остаются наиболее часто используемыми средствами. К другим популярным средствам относятся программы красивой печати, поддержка управления конфигурацией, программа перекрестных программных ссылок и трассировщик выполнения.

Перечисленные средства являю тся дискретными и независимыми. Программист мог работать только с одним средством. Например, во время отлад ки надо было воспользоваться отладчиком для определения ошибки, затем окончить отладку, чтобы вызвать редактор для исправления ошибки. После этого надо было компилировать программу и вызывать отладчик для дальнейшей отладки (цикл редактирования - компилирования - прогона). Программист вынужден был вводить дополнительные команды и терять время на запуск и окончание работы системных средств. Прерывание процесса отладки на редактирование, повторную компиляцию и повторный запуск программы серьезно затруднял процесс обдумывания задачи программистом.

Следующим шагом в раз витии средств разработки был интегрированный набор средств, названный инструментальным ящиком, каждое средство проектировалось с учетом остальных, поэтому система обеспечивала возможность об ращения к другим средствам.

Например, такие системы, как Turbo-Prolog, Interlisp-D, позволяют программисту запустить программу сразу после ввода ее в систему. В ответ на ошибку системой вызывается отладчик, чтобы дать возможность программи сту изучить причину сбоя. Программист может затем отредактировать программу и продолжить ее выполнение. этот подход сокращает время на и справление мелких ошибок в программе для экспериментального программирования (метод проб и ошибок), обычно применяемого специалистами по искусственному интеллекту.

Проектирование больших программных средств является сложной проблемой . разбиение жизненного цикла на несколько этапов (анали з требований, спецификации, проектирование, реализация, тестирование и отладка, работа и сопровождение) направлено на уменьшение сложности проектировани я путем изолирования и упорядочени я важных задач в процессе разработки.

Interlisp-D, Turbo Prolog поддерживают только этапы реализации и отладки. Исследования показывают, что наибольший вклад в стоимость жизненного ци кла дает этап сопровождения. Не менее важное значение и меют средства этапа требований и спецификаций, потому что любую ошибку в специ фикациях очень трудно и дорого исправлять на позднейши х этапах жизненного цикла. Таким образом, анализ жизненного цикла важен для любой части программного обеспечения, которая предназначена для использования кон ечными пользователями на заметном интервале времени.

Успех методов искусственного интеллекта в различных областях мотивировал их применение в разработке программного обеспечения. Показательными системами являются проект Помощник программиста в Массачусетском технологическом институте, проект Пси в Станфордском университете, в этих проектах осуществляется попытка моделировать знания, которыми пользуется программист для понимания, проектирования, реализации и сопров ождения программы. Эти знания могут быть использованы экспертными система ми для частичной автоматизации процесса разработки программ.

В заключение отметим некоторые особенности этапов жизненного цикла э кспертных систем.

Тестирование экспертных систем отличается от тестирования обычн ых систем.

Во-первых, экспертные системы часто обладают недетерминированным по ведением, потому что стратегия разрешения конфликтов может зависеть от па раметров времени выполнени я. Это делает пове дени е невоспроизводи мым, и , следовательно, более трудным для отладки.

Во-вторых, для правил в отличие от процед ур в трад иционном программном обеспечении нет ни каких точных отношен ий ввода-вывода. это зат рудняет примене ние д ля тестирования анализа ввода-вывода.

В-третьих, число способов, которыми могут быть активизированы правила, слишком велико, чтобы пользоваться средствами покрытия ветвей и путей.

Макетирование является единственным эффективным способом тестирования экспертной системы.

Сопровождение и модификация - важная часть разработки экспертных систем. Правила базы знаний эволюционируют с накоплением опыта их применения, и, следовательно, модифицируются чаще, чем алгоритмы. Правила могут также зависеть от времени, поэ тому их достоверность может также из меняться со временем.

С разработкой и использованием экспертных систем тесно связаны такие понятия, как знания и базы знаний. Особая роль знаний в экспертных системах обусловлено, прежде всего, областью их применения, экспертные системы предназначены для решения трудноформализуемых задач или задач, не имеющих алгоритмического решения в уз коспециализированных предметных областях деятельности человека, экспертные системы поз воляют аккумулировать, воспроизводить и применять знания, которые сами по себе обладают огромной ценностью.

Источниками знаний для конкретной ЭС могут быть учебники, спавочники, материалы конкретных исследований в проблемной области и т.п. сами разработчики могут иметь теоретические знания и практический опыт в данной области. Но классическим источником знаний является эксперт- профессионал в данной предметной области. Таким образом приобретение знаний требует учёта человеческого фактора. Для успешного решения этой проблемы необходимы совместные усилия математиков, программистов, психологов.

На настоящий момент нет готовых систем, позволяющих исключить человека из цепочки, причастной к формированию БЗ, однако имеются теоретические исследования и исследовательские разработки, наличие которых позволяет выделить три класса способов приобретения знаний:

Традиционный диалог эксперта с инженером по знаниям, в котором все знания предоставляются экспертом.

Автоматическая генерация знаний, которая позволяет часть правил получать автоматически.

Построение индивидуальной модели исследования предметной области конкретным экспертом, позволяющей организовать целенаправленный процесс исследования этой области на основе индивидуальных представлений данного эксперта.

При разработке ЭС необходимо начинать работу с создания “бумажной” её модели. Эта модель формируется в процессе общения с экспертом. При этом выделяются основные понятия, которыми оперирует эксперт, формируется тезаурус системы. После этого на нескольких несложных примерах подробно анализируется метод, которым эксперт решает такого рода задачи. Таким образом разрабатывается алгоритм задачи.

В базе знаний в некотором закодированном виде хранятся формализованные знания эксперта. На современном этапе развития ЭС используется несколько форм представления знаний. Выделим из них четыре основные:

1.“Тройка” объект- атрибут- значение, например: дом- цвет- зелёный; пациент- температура- высокая. Эта форма представления знаний определяет “объект”, обладающий некоторыми атрибутами (свойствами), которые могут принимать значения из известного набора.

2.Правила продукций в виде: Если пациент болен гриппом И стадия заболевания начальная, ТО температура высокая с вероятностью = 0.95 И головная боль есть с вероятностью = 0.8.

Правило продукции состоит из двух частей: посылки (ЕСЛИ) и заключения (ТО), каждая из которых состоит из конъюнкции утверждений более низкого уровня детализации.

3.Фрейм. Представляет собой именованную таблицу с некоторым количеством слотов- ячеек, имевших свои имена и получающих в процессе работы машины вывода некоторые значения. В качестве значений могут присутствовать константы, ссылки на фреймы более высокого или более низкого уровня, а также некоторые вычислительные процедуры.

4.Семантическая сеть. Это ориентированный граф, вершины которого соответствуют объектам (событиям), а дуги описывают отношения между вершинами.

Первая из указанных форм представления знаний (“тройка”) является наиболее ранней формой, своего рода переходной, от представления данных к представлению знаний. Наилучшая область применения “тройки”- диагностические ЭС в предметной области с большим количеством легкокластеризуемых объектов, в каждом классе которых имеется большое количество общих атрибутов. Примером такой области может служить диагностика сложных технических систем.

Представление знаний с помощью правил продукции – самая распространённая форма реализации БЗ. С помощью продукций можно описать практически любую систему знаний. На них основаны все ранние ЭС, такие, как MYCIN, а также подавляющее большинство современных ЭС в различных предметных областях. В соответствии с этой формой реализации БЗ сделано большинство систем - “оболочек” и многие инструментальные среды. В целом продукционная форма представления знаний является естественной и удобной для формализации знаний, полученных у эксперта.

Фрейм- структуры в определённой степени стали развитием метода электронных таблиц в области обработки знаний. Это вторая по частоте встречаемости в конкретных реализациях ЭС форма представления знаний. Фрейм –структуры наиболее разумно применять в предметной области с чётко выраженной иерархической структурой.

Семантические сети изначально возникли как модель долговременной человеческой памяти в психологии. Большой интерес к работе с семантическими сетями проявляют разработчики систем взаимодействия на естественных языках.

На современном этапе работ в области ЭС нередко используется смешанная форма представления знаний. Такие ЭС называются гибридными.

Скачать архив с текстом документа