Информационно-поисковые системы технологического назначения (ИПС-ТН).
Структура ИПС.
Информационно-поисковая система представляет собой функциональную систему, предназначенную для хранения и поиска информации. Хранение информации возможно только в том случае, если она зафиксирована на каком-либо материальном носителе, т.е. документе, предназначенном для чтения людьми или ввода в ЭВМ (книга, бланк, чертеж, магнитный диск и т.п.). Поэтому ИПС должна иметь запоминающее устройство (ЗУ) в котором располагаются документы (тексты, записи) организуемые в массивах (фондах, файлах, собраниях). Поиск информации - это процесс отыскания в ЗУ ИПС таких документов (текстов, записей), которые соответствуют поступившему запросу. Следовательно, операции хранения и поиска неразрывно связаны. Именно поэтому они осуществляются в рамках единой информационной системы.
Элементами реальной ИПС являются:
- массив документов, выступающих в качестве объекта поиска;
- информационно-поисковый язык (ИПЯ) - искусственный язык, предназначенный для описания содержания и формы документов и (или) запросов для последующего осуществления поиска;
- правила (алгоритмы, методы) индексирования, следуя которым производится описание средствами ИПЯ документов и запросов (перевод их с естественного языка на ИПЯ). В результате индексирования документа получается поисковый образ документа, а индексирования запроса - поисковое предписание;
- правила поиска документов, соответствующих запросу, которые задаются в виде критерия соответствия (критерия выдачи);
|
|
- технические средства, с помощью которых реализуется ИПС, т.е. осуществляется хранение и поиск информации;
- обслуживающий персонал - индексаторы и технические работники, обеспечивающие обработку и ввод в систему документов, а также операторы ИПС:
Информационный запрос не включается в состав ИПС и рассматривается как сигнал, поступающий из внешней среды к оператору.
От состава и тематики документов зависят ИПЯ, правила индексирования и поиска. Выбор ИПЯ обуславливает способ организации ЗУ и пригодные для реализации ИПС технические разработки. ИПЯ и технические элементы ИПС предъявляют определенные требования к квалификации обслуживающего персонала. Учет системных взаимосвязей необходим для разработки реальных ИПС.
В процессе анализа ИПС часто рассматривают отдельно материальные составляющие (массивы документов, технические средства, персонал) и семантические средства (ИПЯ, методы индексирования и поиска). Совокупность ИПЯ, методов индексирования и поиска принято в теории ИПС называть абстрактной ИПС.
С помощью семантических средств ИПС осуществляются смысловые операции обработки документов и запросов и отбор документов, подлежащих выдаче. Последовательность этих операций представляется формулой:
|
|
Li Si Sd Ld ;
где Li - текст запроса на естественном языке;
Si - представление запроса на ИПЯ (поисковое предписание);
Ld- текст документа на естественном языке;
Sd - представление документа на ИПЯ (поисковый образ документа);
- -индексирование;
- сопоставление в соответствии с заданным критерием выдачи.
Из формулы видно, что семантические информационно-поисковые операции сводятся к моделированию смысла текста, что требуется для перевода с естественного языка на ИПЯ (операция индексирования) и к сравнению смысла текстов на ИПЯ с тем, чтобы установить их соответствие.
Дата добавления: 2018-02-15; просмотров: 645; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!