Подсистема производства контента



Nbsp;

Хранение распределенных данных

Практическая работа ( магистранты 2 года обучения, ИКМО-02-17)

 

Тема: Изучение инфраструктуры портальной системы управления данными контента  и информационных процессов, влияющих на ее функционирование

Цель: построение архитектуры программной системы, обеспечивающей управление web-контентом в составе интеграционной платформы

 

Управление контентом –коллективный процесс, участники которого имеют определенные роли:

– авторы создают и редактируют контент;

– редакторы контролируют стиль и подачу информации, а также занимаются переводом и локализацией;

– выпускающие редакторы отвечают за публикацию контента;

– администраторы управляют назначением прав доступа к контенту участников процесса и осуществляют другую поддержку;

– пользователи или потребители получают опубликованный контент.

Системы управления контентом и являются теми средствами, с помощью которых автоматизируется процесс управления контентом. Поскольку управление контентом состоит в обеспечении его жизненного цикла, системы управления контентом должны иметь адекватные средства для поддержки всех его стадий и обеспечения ролевого принципа коллективной работы.

Несмотря на то, что программное обеспечение для управления информацией строится на общих принципах, оно разделяется на ряд категорий, в соответствии с видами информации и спецификой их обработки. Различают:

– Document Management (DM) – управление документами;

– Web Content Management (WCM) – управление web-контентом;

– Knowledge Management (KM) – управление знаниями (сохранение и распространение в формализованном виде знаний от одних сотрудников предприятия другим);

– Digital Assets Management (DAM) – управление цифровыми активами (графической, мультимедийной информацией, файлами);

Все перечисленное может быть собрано в состав комплекса CMS – многопользовательской системы, взаимодействие с которой осуществляет несколько групп пользователей (авторы контента, потребители контента, администраторы), использующих различный функционал системы и создающих принципиально различную нагрузку на систему, существует проблема создания адекватной тестовой нагрузки.

CMS входит в состав гетерогенной системы, включающей компоненты, построенные с использованием различных программных платформ, а также унаследованные компоненты, механизмы работы компонентов с программными ресурсами могут отличаться. Также отличаются и средства предупреждения, диагностики и обработки ошибок, что приводит к различному поведению компонентов системы в случае возникновения утечек ресурсов и программных отказов. Это создает предпосылки к возникновению ошибок управления ресурсами, вызванных совместной работой компонентов.

Разработка CMS, как и любого другого программного продукта высокого уровня сложности, требует существенных усилий на отладку и тестирование. Большое значение в процессе разработки играют правильная постановка задачи, анализ требований к подлежащему реализации функционалу, сценариям и условиям использования, возможностям программных и технических платформ, ожидаемым нагрузкам. Во многом требования определяют рациональный выбор программных платформ и паттернов проектирования, позволяющих снизить трудозатраты. Не менее важной является организация итогового тестирования продукта, позволяющего выявить часть программных ошибок и определить работоспособность продукта при расчетных нагрузках.

Компании уровня Google обладают значительными накопленными шаблонами нагрузок, которыми пользуются при тестировании внутренних разработок, однако такие возможности не доступны рядовым разработчикам.

Сложность организации нагрузки связана с тем, что крайне трудно предположить поведение будущих пользователей. Хотя число пользователей и поддается оценке, основная трудность состоит в определении их ожидаемой активности, т.е. частоты обращений к системе, смене уровней активности, различии уровней активности и характере перехода от одного уровня активности к другому.

Естественно, предлагаемые модели должны согласовываться с опытными данными, полученными при работе программного решения. Для этого рассматриваемая в настоящей работе CMS была оснащена средствами сбора характеризующих пользовательскую активность данных. В данном случае наличие собственного решения дало преимущество за счет возможности сбора внутренних компонентов и сбора всей интересующей информации.

CMS предоставляет доступ не только к собственному хранилищу, но и к внешним источникам информации, данные о состоянии и характеристики быстродействия которых системе не известны, и могут меняться в широких пределах. В частности, обращение к информационным источникам приводит к необходимости межпроцессного взаимодействия, в отличие от большинства других задач, работающих с объектами в памяти процесса web-сервера, что само по себе меняет величины быстродействия на порядки.

Так, например, у реляционных информационных источников, реализуемых, как правило, на основе сервера баз данных, можно наблюдать сложное поведение времени выполнения запроса в зависимости от внутреннего состояния,

 

Фундаментальными принципами CMS считаются:

1. использование для хранения контента специализированного хранилища;

2.  поддержку коллективной работы пользователей, размещающих контент в этом хранилище.

В общем случае, архитектура системы управления контентом включает следующие подсистемы: хранилище контента, подсистему безопасности, подсистему производства контента и подсистему представления (рис. 1). В случае каркаса системы управления контентом эти же компоненты входят в состав ядра.

Функциональность систем CMS перечислена в [107, 108]. Далее эта функциональность будет рассмотрена применительно к рассматриваемым подсистемам.

 

Рис. 1  Подсистема производства контента

 

Подсистема производства контента

Подсистема производства контента является основным механизмом для коллективной работы пользователей по созданию и модификации контента. Данная подсистема используется авторами, редакторами и администраторами контента.

Основная функциональность, реализуемая подсистемой производства контента:

Создание контента – помещение нового контента в систему, включая его индексирование, категоризацию, описание с помощью метаданных и назначение прав доступа.

WYSIWYG редактирование – использование для подготовки текста средств редактирования, позволяющих непосредственно наблюдать применяемое к тексту форматирование.

Преобразование контента – конвертирование различных типов контента во внутреннее представление системы (например, преобразование документов Word в HTML).

Извлечение контента – загрузка и преобразование данных и их информационной структуры, созданных в других системах.

Управление метаданными и таксономией – создание системы меток, используемых для категоризации контента, а также разработка правил категоризации.

Связывание контента – формирование и отслеживание целостности ссылок между элементами контента.

Документооборот – реализация необходимых бизнес-процессов по обработке контента (например, документ после его создания автором должен быть проверен редактором и одобрен главным редактором).

Планирование публикаций – возможность управления начальной датой и сроком публикации контента.

Интернационализация – обеспечение многонационального производства контента, включая многоязыковую поддержку и возможность учета специфики культур.

Размещение контента – процесс перевода подготовленного к публикации контента из среды разработки в среду доставки контента конечным пользователям.

Архивирование контента – поддержка правил хранения контента с истекшим сроком публикации. Большое количество устаревшего контента может существенно снижать производительность CMS, поэтому требуются специальные меры по разделению актуального и устаревшего контента.

Системные отчеты – обеспечение журналирования действий пользователей, истории модификации контента, протоколирование сбоев системы и т.д.

Подсистема производства контента может быть реализована как приложение с архитектурой «клиент-сервер» и как web-приложение. Первый вариант требует разработки и установки на рабочие места отдельного клиентского приложения, однако обеспечивает большую защищенность всей инфраструктуры подготовки данных и упрощает построение пользовательского интерфейса.

Большое значение при построении подсистемы имеет способ внутреннего представления (моделирования) контента в CMS. Используется два подхода к моделированию контента. При первом каждый тип контента моделируется как единый элемент (документ) с определенным набором атрибутов. При втором контент моделируется как контейнер, содержащий набор более простых информационных элементов (разделов, абзацев, ссылок, рисунков) . Второй подход лежит в основе компонентного управления контентом (Component Content Management, CCM).

Есть возможность  повторного использования контента и, в частности, многоканальной публикации (один и тот же тип контента может использоваться для отображения в различных контекстах на web-сайте, для показа на мобильных и беспроводных устройствах, для синдикации и для создания печатной продукции типа брошюр или каталогов).

Для представления контента широкое применение получил язык XML (Extensible Markup Language), что связано с его удобством для представления и автоматизированной обработки структурированных данных. Ряд XML-схем для представления контента был стандартизирован  и получил широкое распространение.

Перспективным способом построения подсистемы производства контента является использование сервис-ориентированной архитектуры (SOA). Основной принцип этой архитектуры – обеспечение доступности всей внутренней программной архитектуры приложения через внешние интерфейсы (RPC, DCOM, web-сервисы), что позволяет организовать доступ одних приложений к данным и функциям других. Сервис-ориентированная архитектура опирается на такие стандарты как:

– Universal description, discovery and integration (UDDI);

– Web Services Description Language (WSDL);

– Simple Object Access Protocol (SOAP).

При этом походе подсистема производства контента и CMS в целом могут предоставлять функциональность другим прикладным системам организации, за счет чего расширяются возможности по управлению контентом.

В процессе эволюции систем управления контентом был выработан ряд протоколов и стандартов, применяемых при построении подсистемы производства контента:

– Web-based Distributed Authoring and Versioning (WebDAV) – протокол для поддержки коллективного редактирования и управления файлами на удаленных серверах. Протокол поддерживается многими приложениями (например, Microsoft Word), что позволяет интегрировать эти приложения с CMS, обладающими поддержкой протокола WebDAV, и использовать для создания и редактирования контента;

– Dublin Core– набор стандартов для описания web-ресурсов с помощью метаданных;

– Open Document Management API (ODMA)  – стандарт для взаимодействия клиентов с системами управления документами (DMS);

– Docbook  – XML схема для структурированного представления книг и статей технической направленности. В настоящее время практически вытеснен стандартом DITA;

– Darwin information typing architecture (DITA)– стандарт для структурированного представления контента с помощью основанного на XML языка, описывающий структуру, идентификацию, представление метаданных и ссылок, правила форматирования различных видов информации. Данный стандарт используется при реализации компонентного управления контентом.

 


Дата добавления: 2019-01-14; просмотров: 482; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!