Доступ удаленных пользователей к хранилищу документов в режиме on-line.



Вариант 1 - пользователь напрямую подсоединяется к центральной офисной сети и получает доступ к хранилищу документов.

Вариант 2 - пользователь, через Internet подсоединяется к WWW-серверу и таким образом получает доступ к хранилищу документов. Более общий случай, чем вариант 1, так как пользователь имеет доступ к системе управления документами не только через прямое подсоединение, но и через любого Internet-provider'а в любом городе (используемые при таком доступе протоколы должны опираться на поддержку механизмов выписки/возврата документов DMS).

В режиме off-line.

Internet до сих пор в России не является широко распространенной услугой и поэтому организация доступа таким образом иногда становится проблематичным. Единственно отлаженным на сегодняшний день службой доставки сообщений является электронная почта. Поэтому было бы логичным использовать электронную почту для отработки механизмов заказа-доставки документов. Формально процедура получения документов выглядит следующим образом. Пользователь заполняет форму запроса к хранилищу документа и ему возвращается по электронной почте список документов, которые соответствуют запросу (при этом, если необходимо - скажем, документ отправлен на редактирование - производится блокировка отправленных документов по месту основного хранения). Выбирая документ из списка, пользователь по электронной почте отправляет запрос в центр и так же по почте получает заказанный документ. Такая схема может применяться не только для организации доступа единичных пользователей, но и как отличная схема для продажи информации из хранилища.

Взаимодействие нескольких хранилищ и одновременный доступ пользователей к информации, расположенной в разных архивах. Такого рода взаимодействие может быть построено на двух основных принципах

Взаимное тиражирование хранилищ. Технология, которая позволяет каждому пользователю в любом локальном офисе иметь доступ к информации со всех офисов. Но то, что прекрасно работает для офисной информации, с точки зрения объема хранения, не всегда будет работать для хранилищ документов серьезных размеров. Представьте себе 10 хранилищ по 100 Гигабайт, каждое. Для того, чтобы обеспечить доступ ко всем хранилищам вы должны сделать в каждом офисе, копии остальных. Это означает увеличение размеров хранения до 1 Терабайта - довольно дорогое удовольствие.

Технология распределенного доступа. Система регистрирует несколько хранилищ и как бы создает одно - глобальное информационное пространство. Пользователь делает один запрос к глобальному хранилищу и система сама делит запросы по реальным хранилищам, собирает с них ответы и выдает консолидированный результат пользователю. Для того, чтобы обеспечить быстрый доступ собственно к документу по запросу пользователя, он подгружается по глобальной сети в систему хранения локального офиса, далее он может видоизменяться пользователем и далее возвращаться на в свое месторасположение по глобальной сети. Для того, чтобы не нарушалась целостность хранения, применяется система блокирования документов.

Система массового ввода документов

Для организации обработки большого количества бумажных документов и перевода их в электронную форму предназначена система массового ввода документов. Слово массовый говорит о том, что данная система масштабируема и способна работать как с одним бумажным документом в день, так и с 100 тысячами бумажных документов в день. Данная подсистема присутствует практически в любой задаче, дело лишь в количестве обрабатываемых документов.

В технологии обработки документов выделяют две основные группы

Просто документы

Формы

Процесс обработки документов состоит из следующих элементов

Сканирование документа

Обработка изображения документа

Является очень важной часть процесса обработки бумажных документов. Очевидно, что качество изображений документов после прохождения через сканер оставляет желать лучшего. Кроме того, любой документ (особенно формы) содержит множество дополнительной информации, облегчающей заполнение, но абсолютно ненужной, а часто мешающей при обработке изображения. Также эти функции применяются для уменьшения размера сохраняемого изображения. Для обработки изображения документов используются следующие специализированные функции

Очищение изображения - применяется для снятия с изображения отдельных элементов, как то отдельно стоящие точки, пятна и т.п.

Снятие фона и выделений- очень часто документы имеют общий фон с цветом отличным от белого (ценные бумаги, например). Для их обработки необходимо удалять фон.

Выравнивание изображения - для последующей обработки изображения и качества распознавания очень важно, чтобы документ попадал в строго вертикальном положении в процедуру распознавания. Данная функция позволяет выполнять процедуру выравнивания изображения (или по-другому - устранения перекосов в изображении).

Снятие элементов форм - для того, чтобы эффективно обрабатывать форму, необходимо удалять с изображения элементы форм. Как то линии, разграфки, таблицы и тому подобное.

Определение идентификатора форм - очень часто приходится вводить в систему самые разнообразные формы, отличные как по содержанию, так и по структуре. Для того, чтобы система могла работать с множественными формами, она должна определять что за форма поступила на обработку и загружать соответствующее, заранее настроенное и подготовленное описание формы.

Восстановление букв и символов - очень часто случается, что в заполненной форме буква оказывается пересеченной элементом формы (например линией). Для последующего успешного распознавания символа необходимо удалить линию, таким образом, что буква при таком удалении не пострадала.

Кроме того к предварительной обработке изображения также относятся следующие функции

Вращение изображения на произвольный угол

Масштабирование изображения

Регулирование уровня серого

Компрессия и декомпресиия изображений

Рис. 5.4.3. Схема.


Дата добавления: 2019-01-14; просмотров: 162; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!