Требования к развитию Подсистемы сбора информации из источников СМИ и социальных медиа
Требования к функции «Сбор контента из сервисов для мгновенного обмена сообщениями»
Подсистема сбора информации из источников СМИ и социальных медиа должна позволять собирать и отображать в АРМ Аналитика открытые и общедоступные данные из источников-мессенджеров (сервисов для мгновенного обмена сообщениями), в частности, из источника Telegram.
К таким данным относятся:
- информация о канале распространения сообщения;
- информация об авторе сообщения;
- информация о тексте сообщения;
- информация о метриках сообщения: количество просмотров.
Для получения данных Система должна использовать существующие API источников либо иные инструменты сбора.
Данные метрики должны храниться в Системе и отображаться пользователю АРМ Аналитика для каждого сообщения из Интернет-СМИ или для главного сообщения кластера, если отчёт, сформированный пользователем, имеет признак группировки сообщений.
Требования к функции «Сбор метрик информационных сообщений из СМИ»
Подсистема сбора информации из источников СМИ и социальных медиа должна позволять собирать и отображать в АРМ Аналитика информацию о метриках информационных сообщений, размещённых в Интернет-СМИ. В зависимости от особенностей конкретного источника, к метрикам сообщений могут относиться:
- количество комментариев;
- количество отметок «Нравится»;
- количество репостов в социальных сетях.
|
|
Метрики представляют собой количественные показатели, расположенные на веб-страницах с исходными информационными сообщениями.
Данные метрики должны храниться в Системе и отображаться пользователю АРМ Аналитика для каждого сообщения из Интернет-СМИ или для главного сообщения кластера, если отчёт, сформированный пользователем, имеет признак группировки сообщений.
Требования к функции «Сбор метрики «Количество просмотров»
Подсистема сбора информации из источников СМИ и социальных медиа должна позволять собирать и отображать в АРМ Аналитика информацию о количестве просмотров информационного сообщения для тех источников, где предусмотрена публикация таких сведений.
Данная метрика представляет собой количественный показатель, расположенный на веб-странице с исходным информационным сообщением.
Данная метрика должна храниться в Системе и отображаться пользователю АРМ Аналитика для каждого сообщения или для главного сообщения кластера, если отчёт, сформированный пользователем, имеет признак группировки сообщений.
Требования к развитию Подсистемы первичной обработки информации
Требования к функции «Определение цитирования информационного объекта»
|
|
Функция определения цитирования информационного объекта должна быть реализована в виде модуля, предназначенного для выявления фрагментов публикаций в различных информационных источниках, в которых содержатся отсылки к прямой или косвенной речи сущностей, являющихся информационными объектами Системы.
Для выявления таких фрагментов должен быть создан список характеризующих выражений, каждое из которых может применяться ко всем или к части информационных объектов. Характеризующие выражения должны отражать различные языковые способы передачи в тексте сообщений прямой или косвенной речи.
В качестве критериев применимости каждого характеризующего выражения к объекту должны выступать:
- применимость к объекту типа «Персона»;
- применимость к объекту типа «Организация»;
- использование характеризующего выражения перед упоминанием объекта в тексте публикации;
- использование характеризующего выражения после упоминания объекта в тексте публикации
- максимальное расстояние от характеризующего выражения до первого символа объекта;
- максимальное расстояние от последнего символа объекта до характеризующего выражения.
Требования к функции «Выявление информационных трендов»
|
|
Функция выявления информационных трендов должна быть реализована в виде модуля, предназначенного для определения качественных и количественных характеристик распространения информационного повода в источниках СМИ и социальных медиа.
Для определения таких характеристик в качестве объекта исследования используется группа информационных сообщений, объединенных между собой по признаку сходства. Для каждой такой группы выявляются зависимости и параметры, позволяющие отнести процесс распространения информационного повода к категории «тренд» согласно сформированным критериям тренда.
В качестве параметров, характеризующих информационный тренд, должны быть определены и выступать:
- дата начала тренда;
- длительность тренда;
- периодический (ежедневный/еженедельный/ежемесячный) прирост количества информационных сообщений в тренде;
- периодический (ежедневный/еженедельный/ежемесячный) прирост метрик информационных сообщений в тренде;
- периодический (ежедневный/еженедельный/ежемесячный) прирост аудитории сообщений в тренде;
- период наибольшего развития тренда;
- дата начала угасания тренда.
Дата добавления: 2018-06-27; просмотров: 392; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!