Эволюция систем приобретения знаний



ТЕХНОЛОГИЯ ПРИОБРЕТЕНИЯ ЗНАНИЙ

 

Теоретические аспекты извлечения знаний

Приобретением знаний называется выявление знаний из источников и преобразование их в нужную форму, а также перенос в базу знаний ИнС.

Источниками знаний могут быть:

а) книги, архивные документы, содержимое других баз знаний и т.п., т.е. некоторые объективизированные знания, приведенные к форме, которая делает их доступными для потребителя;

б) экспертные знания, которые имеются у специалистов, но не зафиксированы во внешних по отношению к ним хранилищах (экспертные знания являются субъективными),

в) эмпирические знания (также субъективный вид знаний), которые получаются путем наблюдения за окружающей средой (если у ИнС есть средства наблюдения)(рис.1).

Рисунок 1 – Схема приобретения знаний

Ввод в БЗ объективизированных знаний не представляет особой проблемы, выявление и ввод субъективных и особенно экспертных знаний достаточно трудны. Чтобы разработать методологию приобретения субъективных знаний, получаемых от эксперта, надо четко различать две формы репрезентации (представления) знаний.

Одна форма связана с тем, как и в каких моделях хранятся эти знания у человека – эксперта. При этом эксперт не всегда осознает полностью, как репрезентированы у него знания. Другая форма связана с тем, как инженер по знаниям (когнитолог), проектирующий ИС, собирается их описывать и представлять. От степени согласованности этих двух форм репрезентации между собой зависит эффективность инженера по знаниям. В когнитивной психологии изучаются формы репрезентации знаний – когнитивные структуры знаний, характерные для человека. Примерами могут служить:

- представление класса понятий через его элементы (например, понятие «птица» репрезентируется рядом «чайка, воробей, скворец,...»)

птица = <чайка, воробей, скворец,...>;

- представление понятий класса с помощью базового прототипа, отражающего наиболее типичные свойства объектов класса (например, понятие «птица» репрезентируется прототипом «нечто с крыльями, клювом, летает,...»)

птица = <нечто с крыльями, с клювом, летает,...>;

- представление с помощью признаков (для понятия «птица», например, наличие крыльев, клюва, двух лап, перьев, ...)

птица = <крылья, клюв, две лапы, перья,...>.

Кроме понятий репрезентируются и отношения между ними. Как правило, отношения между понятиями определяются процедурным способом, а отношения между составляющими понятий (определяющими структуру понятия) – декларативным способом. Наличие двух видов описаний заставляет в моделях представления знаний одновременно иметь обе компоненты, например семантическую сеть и продукционную систему, как это представлено в когнитивной модели рис. 2

Рисунок 2 – Представление когнитивной модели

Проблема приобретения знаний изучается в рамках инженерии знаний. Схема приобретения знаний может быть представлена следующим образом:

Носитель информации à Посредник à Модель знания

Приобретением знаний называют процесс получения знаний от эксперта или каких-либо других источников и передача их в ИнС.

Для преодоления терминологических различий и достижения общности описания этих сложных процессов воспользуемся предположениями о трех стратегиях получения знаний при разработке ИнС, суть которых представлена на рис. 3.

 

Рисунок 3 – Три стратеги получения знаний при разработке ИнС

2.Методы извлечения знаний

Многообразие задач, ситуаций и источников знаний обусловило появление большого количества методов извлечения, приобретения и формирования знаний. Одна из возможных классификаций методов извлечения знаний приведена на рис. 4, на первом уровне которой выделены два больших класса. Первый класс образуют коммуникативные методы, которые ориентированы на непосредственный контакт инженера по знаниям с экспертом (источником знаний), второй класс — текстологические методы, основанные на приобретении знаний из документов и специальной литературы.

Рис. 4. Классификация методов извлечения знаний

Коммуникативные методы. Они разделяются на пассивные и активные. В пассивных методах ведущую роль играет эксперт, в активных — инженер по знаниям. При решении конкретных задач, как правило, используются как пассивные, так и активные методы. Активные методы делятся на индивидуальные и групповые. В групповых методах знания получают от множества экспертов, в индивидуальных — от единственного эксперта. Индивидуальные методы получили более широкое применение на практике по сравнению с групповыми.

Пассивные коммуникативные методы включают наблюдение, анализ протоколов «мыслей вслух», процедуры извлечения знаний из лекций.

Метод наблюдения является одним из наиболее применяемых на начальных этапах разработки экспертных систем. Его суть заключается в фиксировании всех действий эксперта, его реплик и объяснений. При этом аналитик не вмешивается в работу эксперта, а только наблюдает за процессом решения реальных задач либо за решением проблем, имитирующих реальные задачи. Наблюдения за процессом решения реальных задач позволяют инженеру по знаниям глубже понять предметную область. Однако эксперт в этом случае испытывает большое психологическое напряжение, понимая, что осуществляет не только свою профессиональную деятельность, но и демонстрирует ее инженеру по знаниям. Наблюдение за имитацией процесса снимает это напряжение, но приводит к снижению полноты и качества извлекаемых данных. Наблюдения за имитацией незаменимы в тех случаях, когда наблюдения за реальным процессом невозможны из-за специфики изучаемой предметной области,

Метод анализа протоколов «мыслей вслух» отличается от метода наблюдения тем, что эксперт не только комментирует свои действия, но и объясняет цепочку своих рассуждений, приводящих к решению. Основной проблемой, возникающей при использовании этого метода, является принципиальная сложность для любого человека словесного описания собственных мыслей и действий. Повысить полноту и качество извлекаемых знаний можно за счет многократного уточняющего протоколирования рассуждений эксперта.

Метод извлечения знаний из лекций предполагает, что эксперт передает свой опыт инженеру по знаниям в форме лекций. При этом инженер по знаниям может заранее сформулировать темы лекций. Если этого не удается сделать, то когнитолог конспектирует лекции и задает вопросы. Качество информации, предоставленной экспертом в ходе лекции, определяется четкостью сформулированной темы, а также способностями лектора в структурировании и изложении своих знаний и рассуждений.

Активные индивидуальные методы включают методы анкетирования, интервьюирования, свободного диалога и игры с экспертом.

Преимуществом методов анкетирования является то, что анкета или вопросник составляются инженером по знаниям заранее и используются для опроса экспертов. Составление анкеты следует проводить с учетом рекомендаций, выработанных в социологии и психологии.

Метод интервьюирования отличается от метода анкетирования тем, что позволяет аналитику опускать ряд вопросов в зависимости от ситуации, вставлять новые вопросы в анкету, изменять темы и разнообразить ситуацию общения.

При использовании метода интервьюирования следует иметь в виду, что его эффективность во многом определяется языком вопросов (понятностью, лаконичностью, терминологией); порядком вопросов (логическая последовательность); уместностью вопросов (этичностью и вежливостью).

Прежде чем готовить вопросы, аналитик должен овладеть ключевым набором знаний исследуемой предметной области, поскольку любой вопрос имеет смысл только в контексте.

Метод свободного диалога позволяет извлекать знания в форме беседы с экспертом, поэтому здесь не предусматривается использование жесткого вопросника или плана. В то же время подготовка к свободному диалогу должна проводиться по специальной методике, в которую входит общая, специальная, конкретная и психологическая подготовка. Общая подготовка направлена на повышение научной эрудиции, овладение общей культурой, знакомство с системной методологией. Специальная подготовка сводится к овладению теорией и навыками интервьюирования. Конкретная подготовка предполагает изучение предметной области, подготовку ситуации общения, знакомство с экспертом, тестирование эксперта. Психологическая подготовка включает знакомство с теорией общения и с когнитивной психологией.

Игры с экспертом существенно отличаются от приведенных выше индивидуальных активных методов извлечения знаний и рассматриваются в классе групповых активных методов, где особое место принадлежит ролевым и экспертным методам.

Активные групповые методы включают «мозговой штурм», дискуссии за круглым столом и ролевые игры. Групповые методы позволяют творчески интегрировать знания множества экспертов.

Метод «мозгового штурма» - один из наиболее известных и широко применяемых методов генерирования новых идей путем творческого сотрудничества группы специалистов. Являясь в некотором смысле единым мозгом, группа пытается штурмом преодолеть трудности, мешающие разрешить рассматриваемую проблему. В процессе такого штурма участники выдвигают и развивают собственные идеи, стимулируя появление новых и комбинируя их.

Метод «мозгового штурма» эффективен при решении не слишком сложных задач общего организационного характера, когда проблема хорошо знакома всем участникам заседания и по рассматриваемому вопросу имеется достаточная информация. Существует ряд модификаций этого метода.

Метод дискуссии за круглым столом предполагает равноправное обсуждение экспертами поставленной проблемы. Отличительной особенностью метода дискуссии является коллективное рассмотрение предметной области с разных точек зрения и исследование спорных гипотез.

Экспертные игры предназначены для извлечения знаний и базируются на деловых, диагностических и компьютерных играх.

По числу участников игры подразделяют на индивидуальные (игры с экспертом) и групповые (ролевые игры в группе). По применению специального оборудования — игры с тренажерами и игры без реквизита. Особый класс представляют собой компьютерные игры.

В играх с экспертом инженер по знаниям берет на себя чью-нибудь роль в моделируемой ситуации. Ролевые игры в группе предусматривают участие в игре нескольких специалистов. Участники игры наделяются определенными ролями, а собственно игра проводится по составленному когнитологом сценарию. В целях повышения эффективности ролевых игр в них необходимо вводить элементы состязательности.

Игры с применением тренажеров позволяют зафиксировать трудно уловимые знания, которые возникают в реальных ситуациях и могут быть потеряны при выходе из них.

Компьютерные экспертные игры в настоящее время используются в основном в целях обучения. Они полезны для «разминки» экспертов перед сеансом извлечения знаний.

Текстологические методы включают методы извлечения знаний, основанные на изучении текстов учебников, специальной литературы и документов. Текстология — это наука, целью которой является практическое прочтение текстов, изучение и интерпретация литературных источников, а также рассмотрение семиотических, психолингвистических и других аспектов извлечения знаний из текстов. Схема извлечения знаний из специальных текстов приведена на рис. 6, где М1 — смысл, заложенный автором и основанный на его собственной модели мира; М2 — смысл, который постигает инженер по знаниям; I — интерпретация текста, изложенного словесно; Т — словесное изложение знаний; V — результат вербализации.

Рис. 6. Схема извлечения знаний из текста

Научный текст Т, который формируется автором на основе модели M1, включает в себя пять компонентов, погруженных в языковую среду L; , где  - первичный материал наблюдений;  — система научных понятий;  — субъективный взгляд автора;  — дополнительная информация, не касающаяся научного знания (общие места);  — заимствования. На процесс понимания (интерпретации) I и на модель М2 влияют следующие компоненты: М2 = , где  - экстракт компонентов, почерпнутый из текста Т;  — предварительные знания аналитика о предметной области;  — общенаучная эрудиция инженера по знаниям;  — личный опыт аналитика.

Автор книги, являющийся в данном случае экспертом, на основании собственной модели мира М1 пишет книгу, представляя свои знания в виде текста. Затем инженер по знаниям на основании своей модели знаний М2 и информации, почерпнутой из текста Т, интерпретирует знания эксперта. Схема процесса извлечения знаний из текста показывает, что смысл М1, заложенный автором книги, отличается от смысла М2, который постигает читатель (инженер по знаниям). Эти различия определяются тем, насколько развиты факторы ,  и  у конкретного аналитика (читателя).

Особую сложность представляет извлечение знаний из специальной литературы и методик, поскольку в них очень высока степень концентрации специальных знаний.

3. Выявление «скрытых» структур знаний

Знания, полученные от эксперта в прямом диалоге, имеют поверхностный характер и не отражают сложных механизмов мышления специалиста. Альберт Эйнштейн говорил: «Слова, написанные или произнесенные, не играют, видимо, ни малейшей роли в механизме моего мышления». Известный психолог Л.С. Выготский научно обосновал, что мышление и речь имеют разные корни. В настоящее время известно, что язык выступает в качестве материального носителя результатов мышления на предварительной и завершающей его стадиях.

Скрытые (имплицитные) знания служат основой интуитивного мышления. Интуиция позволяет человеку быстро принимать правильные решения в сложных ситуациях при недостаточной информации. При этом полагают, что человек может неявно использовать ряд посылок в своих рассуждениях, а также обходиться без применения строгих правил логического вывода.

Выдающийся когнитолог М. Хайдеггер предложил новый подход в теории познания, выдвинув гипотезу о том, что человек не может иметь объективных знаний об окружающей действительности, ибо она структурируется человеком в зависимости от его целей, конкретных обстоятельств, ценностей и т.п.. По мнению Хайдеггера, дискретные модели окружающего мира, претендующие на объективность, имеют небольшое значение в жизни человека. Главную роль в его деятельности играют имплицитные знания, навыки и живой опыт, которые существуют в невербальной, а следовательно, не в дискретной форме. Идеи Хайдеггера послужили основой коннекционистской (connect — связывать, англ.) теории познания, положенной в основу моделей нейронных сетей. Коннекционистская модель не является дискретной, она не строится в явном виде, а появляется в результате обучения на примерах. Нейронные сети успешно применяются для имитации бессознательных знаний.

Как и следовало ожидать, решение одних проблем породило другие. Избавление от дискретности сопровождалось существенным снижением возможности структурного представления знаний. Поэтому перспективы развития теории познания и ее прикладной ветви — методологии приобретения знаний интеллектуальными системами связаны с интеграцией обоих подходов. Хорошей аналогией являются дифференциальные уравнения, являющиеся непрерывными моделями реальных процессов, для решения которых используются дискретные методы.

4.Проблемы структурирования знаний

В настоящее время для структурирования знаний используются структурный и объектный подходы. Структурный подход основан на идее алгоритмической декомпозиции, где каждый модуль системы выполняет один из важных этапов общего процесса.

В настоящее время развивается объектно-структурный подход к структурированию знаний на основе обобщения существующих подходов. Основная идея объектно-структурного подхода связана с проведением последовательного объектно-структурного анализа информации о рассматриваемой предметной области. В процессе объектно-структурного анализа происходят выделение и структуризация понятий с применением разнообразных методов анализа знаний.

На стадии структурирования знаний предметной области необходимо решить следующие задачи: составление словаря используемых терминов; выявление понятий и их атрибутов; выявление связей и определение отношений между понятиями; детализация и обобщение понятий; построение обобщенной структуры знаний предметной области.

Первым шагом структурирования знаний является определение входных и выходных данных, которые в дальнейшем будут детализироваться и уточняться. На основании этих данных, а также по результатам анализа протоколов сеансов извлечения знаний составляется набор ключевых слов (терминов), в процессе обработки которого выявляются объекты, понятия и их атрибуты. Под понятием подразумевается обобщение предметов некоторого класса по специфическим признакам. Формирование понятий — серьезная проблема. Для выявления понятий используются традиционные методы распознавания образов и классификации, а также нетрадиционные методы, базирующиеся на методологии инженерии знаний. Наиболее распространенными методиками выявления объектов и понятий являются:

  • методика формирования перечня понятий;
  • интервьюирование специалистов;
  • составление списка элементарных действий;
  • составление оглавления учебника.

Практическое использование этих методик показало, что наиболее результативными из них являются методики интервьюирования и составления оглавления учебника.

Последовательность структурирования знаний зависит от особенностей конкретной области и от наработанных для рассматриваемой категории знаний предметно-ориентированных методов структурирования.

Эволюция систем приобретения знаний

Первое поколение таких систем появилось в середине 80-х – это так называемые системы приобретения знаний (СПЗ) (TEIRESIAS [Davis, 1982], SIMER+MIR [Осипов, 1988], АРИАДНА [Моргоев, 1988]). Это средства наполнения так называемых «пустых» ЭС, то есть систем, из БЗ которых изъяты знания (например, EMYCIN – EMPTY MYCIN, опустошенная медицинская ЭС MYCIN со специальной диалоговой системой заполнения базы знаний TEIRESIAS).

Однако опыт создания и внедрения СПЗ продемонстрировал несовершенство такого подхода.

Основные недостатки СПЗ I поколения:

- Слабая проработка методов извлечения и структурирования знаний.

- Жесткость модели представления знаний, встроенной в СПЗ и связанной с привязкой к программной реализации.

- Ограничения на предметную область.

Второе поколение СПЗ появилось в конце 80-х и было ориентировано на более широкий модельный подход [Gaines, 1989; Борисов, Федоров, Архипов, 1991] с акцентом на предварительном детальном анализе предметной области. Так, в Европе широкое применение получила методология KADS (Knowledge Acquisition and Documentation Structuring) [Wielinga et al., 1989], в основе которой лежит понятие интерпретационной модели, позволяющей процессы извлечения, структурирования и формализации знаний рассматривать как «интерпретацию» лингвистических знаний в другие представления и структуры.


Дата добавления: 2018-08-06; просмотров: 341; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!