Структура контента, неструктурированная информация и проблемы ее использования в бизнес-целях

Стр 1 из 2Следующая ⇒

Федеральное государственное образовательное бюджетное

Учреждение высшего образования

«ФИНАНСОВЫЙ УНИВЕРСИТЕТ

ПРИ ПРАВИТЕЛЬСТВЕ РОССИЙСКОЙ ФЕДЕРАЦИИ»

Смоленский филиал

Кафедра «Математика, информатика и общегуманитарные науки»

Контрольная работа

На тему: Управление корпоративным контентом

Студент группы: СМЛС17-1Б-БИ02

Семенков И.Г.

Преподаватель:

Морозов А.А.

Смоленск 2021

Содержание

Введение 3

1.0 Структура контента, неструктурированная информация и проблемы ее использования в бизнес-целях 7

1.1 Структурированные данные 8

1.2 Неструктурированные данные 9

1.3 Ключевые различия между структурированными и неструктурированными данными 12

1.4 Проблемы использования неструктурированная информация в бизнес-

целях 13

2.0 Задачи и функции контент-менеджера предприятия 15

2.1 Контент-менеджер: обязанности 16

2.2 Критерии оценки работы контент-менеджера 17

Список использованной литературы 19

Введение

Современные компании перешли на полную компьютеризацию и уже никого не удивляет тот факт, что 100% документов создаётся в электронном формате. Однако и сейчас большая их часть печатается на бумажных носителях. Причиной этому является нужда согласования, подписи. Представьте какое удобство настанет с момента внедрения электронной системы документооборота. Такое решение безусловно должно приниматься руководителем. Но как показывает практика коренные изменения в устоявшемся бизнес режиме происходят только после возникновения нескольких сигналов. Руководство и ведущие специалисты приходят к выводу, что для решения многих проблем связанных с бумажными документами компании потребуется использование специальной системы для управления документами. ЕСМ система позволяет контролировать и управлять информацией на всех этапах её жизнедеятельности.

Для понимания и осознанного выбора в сторону электронного документооборота необходимо понимать её внутреннее устройство. Какие этапы проходит информация? Как она согласуется на разных уровнях? Какие процедуры можно с ней делать? И ряд других не менее важных вопросов. Enterprise Content Management (ECM) — управление корпоративным содержанием, управление корпоративными информационными ресурсами. Под термином ECM подразумеваются технологии, используемые для сбора, управления, накопления, хранения и доставки информации всем пользователям организации

Система ECM ориентируется на работу с неструктурированной информацией в любом виде, включая офисные текстовые и табличные электронные документы, документы в формате PDF, а также рисунки, чертежи, графики, презентации, сканированные изображения, сообщения электронной почты, web-страницы, видео, аудиофайлы. Flash-анимация, словом всё многообразие контента, необходимого для эффективного ведения бизнеса. Основная задача системы ECM — это поддержание полного жизненного цикла информации, от ее создания или получения извне до уничтожения, когда она теряет свою ценность.

Отличие функциональности ECM-систем от систем электронного документооборота - возможность работать не только с документами, которые сегодня являются лишь малой частью корпоративного контента, но и с любыми другими видами данных: сообщениями электронной почты, графическими изображениями, фотографиями, аудио и видео файлами, web-страницами, файловыми системами, оцифрованными материалами.

Помимо инструментов для сбора, управления, накопления, хранения и доставки информации, ECM-системы обладают средствами потоковой загрузки контента, управления web-сайтами, правами доступа, безопасного корпоративного поиска. Следует отметить, что возможности разграничения прав доступа к данным позволяют ECM-системам соответствовать одному из наиболее важных требований безопасности использования контента в госструктурах, зачастую содержащего персональную или секретную информацию.

Условно к ECM относятся системы, поддерживающие хотя бы 3 из 6 функций:

1. Управление документами (выписка/возврат, контроль версий, безопасность, группировка документов и т. д.);

2. Ввод в систему и управление полученными образами бумажных документов;

3. Совместная работа над общими документами и поддержка проектных работ;

4. Управление электронным архивом, автоматизация правил и нормативов хранения, гарантирование соответствия записей законодательству и регулирующим правилам;

5. Workflow для поддержки бизнес-процессов, маршрутизации контента, назначения рабочих задач и состояний, трассировка маршрутов и контроль исполнения;

6. Автоматизации публикаций, управление динамическим контентом (например, WEB или интранет) и взаимодействием пользователей для этих задач.

Таким образом, ECM-система интегрирует все контентно- и процессно-ориентированные технологии внутри предприятия, обеспечивает единую инфраструктуру для управления документооборотом, минимизирует необходимость развертывания и поддержки множества технологий для реализации различных бизнес-задач. Такой инфраструктурный подход делает корпоративное содержимое доступным для практически всех бизнес-приложений организации. Однако, в ряде случаев ECM-система может не иметь решающих преимуществ в использовании перед «чистым» электронным архивом или workflow системой. Выбор СЭД должен определяться стоящими перед организацией задачами, ее структурой, готовностью ИТ-решений и многими другими факторами.

Базовое понятие ECM-системы – управление документами (document management), что подразумевает управление жизненным циклом документа от его создания до передачи исполненного документа на хранение или уничтожение. При этом управление жизненным циклом применимо для любого информационного объекта.

Для работы с информационными объектами создаются библиотеки, которые могут различаться назначением хранящихся в них документов, например библиотеки финансово-бухгалтерских документов, библиотеки конструкторской документации, клиентских досье и т. д. Для классификации таких документов используется более сложная система хранения, нежели привычная российским службам ДОУ номенклатура Но составление структуры хранения все равно будет ложиться на плечи сотрудников службы ДОУ, поэтому им нужно осваивать основы теории классификации.

Сотрудники служб ДОУ должны будут определить права доступа к документам (например, на чтение без права редактирования, на редактирование без права на уничтожение, на редактирование с правом удаления и пр.).

Сотрудникам служб ДОУ предстоит освоить основы информационной безопасности, разобраться в сущности электронно-цифровой подписи (ЭЦП), правилах ее применения, понять, в каких случаях необходимо ее использовать, а в каких – можно обойтись без нее.

Структура контента, неструктурированная информация и проблемы ее использования в бизнес-целях

Данные существуют во множестве различных форм и размеров, но большинство из них могут быть представлены в виде структурированных и неструктурированных данных.

· Структурированные данные представляют собой высокоорганизованную, фактическую и точную информацию. Обычно он представлен в форме букв и цифр, которые хорошо вписываются в строки и столбцы таблиц. Структурированные данные обычно существуют в таблицах, подобных файлам Excel и электронным таблицам Google Docs.

· Неструктурированные данные не имеют заранее определенной структуры и представлены во всем разнообразии форм. Примеры неструктурированных данных варьируются от изображений и текстовых файлов, таких как документы PDF, до видео и аудио файлов, и это лишь некоторые из них.

Структурированные данные часто называют количественными данными, что означает, что их объективный и заранее определенный характер позволяет нам легко подсчитывать, измерять и выражать данные в числах. Неструктурированные данные также называются качественными данными в том смысле, что они имеют субъективный и интерпретирующий характер. Эти данные можно разделить на категории в зависимости от их характеристик и свойств.

1.1 Структурированные данные

Структурированные данные – это хорошо организованные и точно отформатированные данные. Эти данные существуют в формате реляционных баз данных ( СУБД ), то есть информация хранится в таблицах со связанными строками и столбцами. Таким образом структурированные данные аккуратно упорядочиваются и записываются, поэтому их можно легко найти и обработать. Пока данные вписываются в структуру СУБД, мы можем легко искать конкретную информацию и выделять отношения между ее частями. Такие данные можно использовать только по прямому назначению. Кроме того, для структурированных данных обычно не требуется много места для хранения.

В аналитических целях можно использовать хранилища данных . DW – это центральные хранилища данных, используемые компаниями для анализа данных и составления отчетов.

Для работы с реляционными базами данных и хранилищами используется специальный язык программирования SQL, который означает язык структурированных запросов и был разработан IBM еще в 1970-х годах.

Примеры структурированных данных. Структурированные данные знакомы большинству из нас. Файлы Google Sheets и Microsoft Office Excel – это первое, что приходит на ум, когда речь идет о примерах структурированных данных. Эти данные могут содержать как текст, так и числа, такие как имена сотрудников, контакты, почтовые индексы, адреса, номера кредитных карт (таблица 1).

Таблица 1- пример структурированных данных

Типичный пример структурированных данных: электронная таблица Excel, содержащая информацию о покупателях и покупках.

Практически каждый имел дело с бронированием билета через одну из систем бронирования авиабилетов или снятием наличных в банкомате. Во время этих операций мы обычно не думаем о том, с какими приложениями имеем дело и какие типы данных они обрабатывают. Однако это системы, которые обычно также используют структурированные данные и реляционные базы данных.

1.2 Неструктурированные данные

Имеет смысл, что если определение структурированных данных подразумевает аккуратную организацию компонентов предопределенным образом, определение неструктурированных данных будет противоположным. Части таких данных не структурированы заранее определенным образом, то есть данные хранятся в своих собственных форматах.

Проблема с неструктурированными данными в том, что традиционные методы и инструменты не могут быть использованы для их анализа и обработки. Один из способов управления неструктурированными данными – выбор нереляционных баз данных, также известных как NoSQL .

Если есть необходимость хранить данные в исходных исходных форматах для дальнейшего анализа, лучше всего подойдут репозитории хранения, называемые озерами данных . Озеро данных – это хранилище или система, предназначенная для хранения огромных объемов данных в естественном / необработанном формате.

Принимая во внимание все разнообразие форматов файлов неструктурированных данных, неудивительно, что они составляют более 80 процентов всех данных. При этом компании, игнорирующие неструктурированные данные, остаются далеко позади, поскольку не получают достаточно ценной информации.

Примеры неструктурированных данных. Существует широкий спектр форм, которые составляют неструктурированные данные, такие как электронная почта, текстовые файлы, сообщения в социальных сетях, видео, изображения, аудио, данные датчиков и так далее (таблица 2).

Таблица 2- пример неструктурированных данных

Сообщение туристического агентства в Facebook: пример неструктурированных данных.

В качестве примера мы можем взять сообщения в социальных сетях туристического агентства или все публикации, если на то пошло. Каждый пост содержит некоторые показатели, такие как репосты или хэштеги, которые можно количественно определить и структурировать. Однако сами посты относятся к категории неструктурированных данных. Мы пытаемся сказать, что для анализа сообщений и сбора полезной информации потребуется некоторое время, усилия, знания и специальные программные инструменты. Если агентство публикует новые туристические туры и хочет узнать реакцию аудитории (комментарии), им нужно будет изучить публикацию в ее собственном формате (просмотреть публикацию в приложении социальных сетей или использовать передовые методы, такие как анализ настроений)

1.3 Ключевые различия между структурированными и неструктурированными данными

Рассмотрим еще несколько важных различий между структурированными и неструктурированными данными;

· По формату данных:

Структурированные данные обычно представлены в виде текста и чисел. Его форматы стандартизированы и удобочитаемы. Наиболее распространены CSV и XML. В модели данных формат данных был определен заранее.

В отличие от структурированных данных, неструктурированные форматы данных представлены в избытке различных форм и размеров. Неструктурированные данные не имеют заранее определенной модели данных и хранятся в своих собственных форматах (так называемых «исходных» форматах). Это могут быть аудио (WAV, MP3, OGG и т. Д.) Или видеофайлы (MP4, WMV и т. Д.), PDF-документы, изображения (JPEG, PNG и т. Д.), Электронные письма, сообщения в социальных сетях, данные датчиков и т. д .

· По модели данных:

Структурированные данные менее гибкие, так как они основаны на строгой организации модели данных. Такие данные зависят от схемы. Схема базы данных обозначает конфигурацию столбцов (также называемых полями) и типы данных, которые должны храниться в этих столбцах. Такая зависимость является как преимуществом, так и недостатком. Хотя информацию здесь можно легко найти и обработать, все записи должны соответствовать очень строгим требованиям схемы.

С другой стороны, неструктурированные данные обеспечивают большую гибкость и масштабируемость. Отсутствие заранее определенной цели неструктурированных данных делает их очень гибкими, поскольку информация может храниться в различных форматах файлов. Однако эти данные субъективны и с ними труднее работать.

· Легкость поиска, анализа и обработки:

Одно из основных различий между структурированными и неструктурированными данными заключается в том, насколько легко их можно подвергнуть анализу. Структурированные данные в целом легко искать и обрабатывать, независимо от того, обрабатывает ли это человек или выполняет программные алгоритмы.

Неструктурированные данные, напротив, гораздо сложнее искать и анализировать. После обнаружения такие данные должны быть внимательно обработаны, чтобы понять их ценность и применимость. Этот процесс сложен, поскольку неструктурированные данные не могут поместиться в фиксированные поля реляционных баз данных, пока они не будут собраны и обработаны.

С исторической точки зрения, поскольку структурированные данные существуют дольше, логично, что для них существует отличный выбор зрелых аналитических инструментов. В то же время те, кто работает с неструктурированными данными, могут столкнуться с меньшим выбором инструментов аналитики, поскольку большинство из них все еще разрабатываются. Использование традиционных инструментов интеллектуального анализа данных обычно разбивается о неорганизованную внутреннюю структуру этого типа данных.

1.4 Проблемы использования неструктурированная информация в бизнес-

целях

Подводя итоги, стоит сказать, что настоящей борьбы между неструктурированными и структурированными данными нет. Оба типа данных имеют большое значение для предприятий различных сфер и масштабов. Выбор источника данных может зависеть от структуры данных. Но чаще всего мы не выбираем один тип по сравнению с другим, а ищем возможности программного обеспечения для обработки всех данных.

В прошлом у компаний не было реального способа анализа неструктурированных данных, поэтому от них отказались, а основное внимание было уделено данным, которые можно было легко подсчитать. В настоящее время компании могут использовать искусственный интеллект, возможности машинного обучения и расширенную аналитику для выполнения за них сложного анализа неструктурированных данных. Например, такие корпорации, как Google, добились огромных успехов в технологии распознавания изображений, создав алгоритмы ИИ, которые могут автоматически определять, что или кто находится на фотографии.

По правде говоря, эти границы между структурированными и неструктурированными данными немного размыты, потому что в наши дни большинство наборов данных частично структурированы. Даже если мы возьмем неструктурированные данные, такие как фотография, они все равно будут содержать компоненты структурированных данных, такие как размер изображения, разрешение, дата создания изображения и т. д. Эта информация может быть организована в табличном формате реляционных баз данных.

Теперь, когда пояснены характеристики и различия между неструктурированными и структурированными данными, возможно принять обоснованное решение о том, следует ли инвестировать в технологии, чтобы воспользоваться преимуществами неструктурированных данных. Лучшим сценарием для корпораций является использование обоих типов данных, повышая эффективность бизнес-аналитики.

Дата добавления: 2021-07-19; просмотров: 547; Мы поможем в написании вашей работы!

Поделиться с друзьями:

12 Следующая ⇒

Мы поможем в написании ваших работ!