Нагрузка узла (betweeness certrality)



ВВЕДЕНИЕ

Актуальность.Популярность социальных сетей, равно как и возможности информационного воздействия через них на массы людей, стремительно возрастают. Так, например, число пользователей одной из наиболее популярных во всем мире социальных сетей Facebookпревысило 1, 71 миллиард человек. Согласно корпоративной отчетности компании за второй квартал 2016 года число людей, которые заходят в Facebookхотя бы один раз в месяц, составило 1, 712 миллиарда к 30 июня текущего года. При этом порядка 1,1 миллиарда человек заходят в Facebookкаждый день [1]. Несмотря на то, что онлайновые социальные сети привлекли к себе огромное количество пользователей, их число продолжает расти. Показательной является динамика количества активных пользователей наиболее популярной в нашей стране социальной сети ВКонтакте: в начале 2014 года среднее число посетителей в день составляло более 58 миллионов, в начале 2015 года – более 68 миллионов, а в 2016 году – порядка 78 миллионов пользователей ежедневно. Зарегистрировано на сайте ВКонтакте более 380 миллионов пользователей, из которых более 80 миллионов заходят на сайт каждый день [2].

В отличие от традиционной Web-технологии, основу которой составляет контент, в онлайновых социальных сетях пользователи выступают в качестве первостепенных объектов. Пользователи присоединяются к сети, публикуют их собственный контент и создают связи с другими пользователями. Эта базовая структура связей типа пользователь-пользователь облегчает онлайн-взаимодействие, поиск других пользователей со схожими интересами, а также размещение контента, который был ранее сгенерирован [3].

 Одним из основных предназначений социальных сетей является распространение контента. В онлайновых социальных сетях может распространяться контент различного характера, в том числе деструктивный: призывающий к разжиганию межнациональной и межконфессиональной розни, экстремизму, сепаратизму и др. Согласно п. 43 Стратегии национальной безопасности Российской Федерации, утвержденной Указом Президента РФ от 31 декабря 2015 года №683 «О стратегии национальной безопасности Российской Федерации» одной из основных угроз государственной и общественной безопасности является деятельность, связанная с использованием информационных и коммуникационных технологий для распространения и пропаганды идеологии фашизма, экстремизма, терроризма и сепаратизма, нанесения ущерба гражданскому миру, политической и социальной стабильности в обществе. Еще одной угрозой, которая рассматривается в Стратегии национальной безопасности является инспирирование «цветных революций» [4].

Неслучайно в новой редакции Доктрины информационной безопасности Российской Федерации, утвержденной Указом Президента РФ № 646 от декабря 2016 года, среди основных угроз информационной безопасности отмечается расширение масштабов использования специальными службами отдельных государств средств оказания информационно-психологического воздействия, направленного на дестабилизацию внутриполитической и социальной ситуации в различных регионах мира и приводящего к подрыву суверенитета и нарушению территориальной целостности других государств. Отмечается наращивание информационного воздействия на население России, в первую очередь на молодежь, в целях размывания традиционных российских духовно-нравственных ценностей. При этом в современном мире наилучшей средой для проведения информационно-психологических атак являются онлайновые социальные сети [5].

 Современный характер «цветных революций» в большинстве своем проявляется в применении цифровых технологий, относящихся сегодня к организационному оружию и влекущих за собой мобилизацию общественного протеста, используемого для «высокотехнологичного сноса» политической элиты. Как правило, начальная фаза современных «цветных революций» - «twitter-революция», для осуществления которой, в первую очередь, необходимо иметь достаточное количество активных продвинутых пользователей в социальных сетях Twitter, Facebook, Вконтакте.Для осуществления наращивания социальной базы, которая формирует психологическую среду для реализации информационной составляющей «цветной twitter-революции» простому обывателю достаточно иметь доступ в сеть Интернет и подходящий гаджет. Анализ событий, произошедших в последние годы на территории постсоветского пространства, Ближнего Востока и Азии, показывает, что цифровые технологии «цветных революций» в настоящее время популярны, эффективны и с широким охватом применяются для смены действующего режима власти. Современная власть, стремящаяся сохранить суверенность, должна иметь в своем распоряжении набор инструментов, ограничивающих (сводящих к минимуму) эффективность манипулятивного воздействия «мягкой силы». Государствам необходимо разработать и применять те сетевые структуры, которые могут эффективно противодействовать проявлению манипуляций в цифровом пространстве, работать в том же операционном поле, что и их противники [6].

Таким образом, онлайновые социальные сети, обладающие чрезвычайной популярностью, являются одним из основных инструментов информационно-психологического воздействия на значительную часть население, в большей части на молодежь. Необходимость противодействия угрозам информационной безопасности, которые могут быть реализованы через онлайновые социальные сети, подтверждена Стратегией национальной безопасности и Доктриной информационной безопасности Российской Федерации, что указывает на значительную актуальность исследования эпидемических информационных процессов в онлайновых социальных сетях, которые являются взвешенными неоднородными сетями.

Традиционно при описании эпидемических процессов традиционно используются аналоговые модели, основанные на дифференциальных уравнениях. Однако, их анализ указывает на несовершенство этих моделей и наличие целого ряда существенных противоречий:

1. Упомянутая выше аналоговая модель используется для описания эпидемического процесса, который по своей природе является дискретным: количество элементов в системе, как и число зараженных или не зараженных вершин являются дискретными параметрами. В связи с этим логичным является построение моделейс дискретными по своим значениям переменными.

2. При моделировании различных процессов, в том числе эпидемических, важной является возможность остановки эксперимента в необходимый момент времени и осуществления коррекции защиты по ходу процесса. Аналоговая модель принципиально не позволяет вносить такие изменения в параметры системы. Дискретная модель предусматривает такую возможность, благодаря чему можно провести более глубокий анализ информационной эпидемии, задавая новые условия на требуемом шаге эксперимента.

3. Особенностью информационной диффузии в онлайновых социальных сетях является репостинг - многократное размещение записи оригинального поста на собственной странице с указанием автора. Дело в том, что благодаря репостам участники социальной сети могут неоднократно подвергаться воздействию одного и того же контента. Дискретная модель позволяет учесть это явление и более адекватно предсказать результаты распространения того или иного контента.

4. Информационные атаки зачастую бывают распределенными. Так, при инфицировании онлайновой социальной сети, вполне возможна инъекция деструктивного контента в несколько сетевых элементов одновременно. Дискретная модель, в отличие от аналоговой, позволяет одновременно описывать возникновение эпидемии с несколькими очагами заражения, в том числе в различных слоях сети, что позволяет проследить динамику информационного эпидемического процесса в зависимости от степеней вершин, которые были инфицированы в гетерогенной сети. 

5. В онлайновых социальных сетях, как и во всем современном мире, действует закон конкуренции. В связи с этим вопрос противоборства контентов является актуальным при моделировании эпидемического информационного процесса. В аналоговых моделях этот фактор учесть не представляется возможным, в то время как дискретная модель открывает перспективы описания процессов противоборства различных контентов одновременно.

Таким образом, дискретная модель эпидемического процесса имеет ряд преимуществ перед аналоговой. Указанные достоинства заключается не только в более адекватном описании процесса с помощью дискретной модели, но и в более широких ее возможностях с точки зрения анализа и прогнозирования результатов, на всевозможных его стадиях и вариантах.

Степень разработанности темы исследования.Тема исследования социальных сетей является достаточно популярной, свидетельством чему является ряд научно-исследовательских работ [7-9]. Помимо общего исследования социальных сетей, особое внимание уделяется изучению их метрик [10-13], с помощью которых возможно проведение структурного анализа социальных сетей.

В настоящий момент представлены работы [14-16] касаемо эпидемических процессов в социальных сетях, в которых традиционно используются аналоговые модели. В работе[17]проводится моделирование эпидемического процесса заражения пользователей безмасштабной сети с учетом её топологии. В другой работе [18] представлена усовершенствованная модель SIR, в которой зараженное состояние делится на положительно и отрицательно инфицированное, в зависимости от отношения пользователя к контенту.

Не меньшее внимание уделено информационным рискам в социальных сетях, чему посвящен ряд отечественных работ [19,20]. Наряду с информационными рисками социальных сетей, также изучается их эпистойкость [21]. Зарубежные труды [22,23] посвящены стратегиям иммунизации, благодаря которым представляется возможным контролировать динамику эпидемических процессов.

Одной из важных особенностей социальных сетей с точки зрения эпидемического процесса является наличие сообществ, изучению которых посвящен ряд работ [24-26], в которых в том числе рассматриваются вопросы их автоматического выявления.

Изложенное дает основание утверждать, что проблема повышения защищенности информационных процессов в онлайновых социальных сетях при распространении в них деструктивных контентов представляется чрезвычайно актуальной, а связанные с этим вопросы создания методического обеспечения дискретного вероятностного моделирования возникающих в данном случае эпидемических процессов, его алгоритмизации и реализации в виде программного инструментария автоматизации прогнозных расчетов, включая комплексный с его помощью риск-анализ наиболее популярных социальных сетей, имеют значительную не только научную, но и практическую ценность.

Работа выполнена в соответствии с одним из основных направлений ФГБОУ ВПО «Воронежский государственный технический университет» «Управление информационными рисками и обеспечение безопасности инфокоммуникационных технологий» на базе Воронежского научно-образовательного центра управления информационными рисками.

Объектом исследованияявляются неоднородные взвешенные онлайновые социальные сети в условиях диффузии контента при протекании в них эпидемических процессов.

Предметом исследованияявляются модели дискретных эпидемических процессов, протекающих в неоднородных взвешенных онлайновых социальных сетях.

Цель исследования:состоит в алгоритмизации и моделировании дискретных эпидемических процессов, протекающих в неоднородных взвешенных социальных сетях, посредством программной реализации алгоритмов и практического моделирования неоднородных взвешенных социальных сетей.

Для достижения поставленной цели представляется необходимым решить следующие задачи:

1) провести анализ типов онлайновых социальных сетей, особенностей циркулирующего в социальных сетях контента, а также его влияние на пользователей сети;

2) построить дискретную вероятностную модель информационной диффузии в онлайновых социальных сетях;

3) провести алгоритмизацию дискретных микро- и макромоделей эпидемического процесса по полученным от партнеров по комплексной работе матрицам входных данных сети, включая несколько тематик контента;

4) в разработанном программном комплексе реализовать возможность моделирования диффузии с несколькими очагами заражения, в том числе в различных слоях сети, а также возможность коррекции хода эпидемии, путем введения новых параметров во время процесса.

5) разработать модель эпидемии для проведения противоборства нескольких видов контента;

6) в разработанном программном комплексе реализовать наглядное представление получения риска и шанса реализации диффузии контента на основе удельного трафика вершин.

Новизна результатов:

1) алгоритмизированная дискретная модель эпидемического процесса, в отличие от традиционно используемой аналоговой модели предоставляет возможность остановить эксперимент в необходимый момент времени и провести коррекцию по ходу процесса;

2) алгоритмизированная дискретная микромодель эпидемического процесса учитывает такую особенность информационной диффузии в социальных сетях, как репостинг, благодаря чему более адекватно отражаются процессы, протекающие в социальных сетях при эпидемии;

3) алгоритмизированная дискретная микромодель эпидемического процесса отличается от аналогов тем, что позволяет одновременно описывать возникновение эпидемии с несколькими очагами заражения, в том числе в различных слоях сети;

4) алгоритмизированная дискретная микромодель вирусования вершин двумя контентами, в отличие от аналогов учитывает не только сетевые состояний и переходы приведённой выше микромодели вирусования одним контентом, но и является нововведением в данной области, позволяющим оценить параметры и особенности циркуляции в сети двух типов контента;

5) разработан автоматизированный программный инструментарий, включающий в себя современные алгоритмы оценки и управления рисками, реализующий практическое компьютерное моделирование эпидемического процесса в социальных сетях.

Практическая ценность работы заключается в том, что:

–  алгоритмизированная и запрограммированная дискретная микромодель, предусматривающая возможность остановки эксперимента в необходимый момент времени, что позволяет провести более глубокий анализ информационной эпидемии, задавая новые условия на требуемом шаге эксперимента;

–  алгоритмизированная и запрограммированная микромодель эпидемического процесса в социальных сетяхучитывает такую особенность информационной диффузии в социальных сетях, как репостинг, благодаря чему более адекватно отражаются процессы, протекающие в социальных сетях при эпидемии;

–  алгоритмизированная и запрограммированная дискретная микромодель эпидемического процесса позволяет одновременно описывать возникновение эпидемии с несколькими очагами заражения, в том числе в различных слоях сети, что открывает значительные возможности для анализа информационной диффузии в социальных сетях;

–  алгоритмизированная и запрограммированная микромодель вирусования вершин двумя контентами, учитывающая не только сетевые состояний и переходы приведённой выше микромодели вирусования одним контентом, но и являющаяся нововведением в данной области, позволяющим оценить параметры и особенности циркуляции в сети двух противоборствующих контентов;

–  создан автоматизированный программный инструментарий, реализующий разработанные и предложенные алгоритмы и практическое компьютерное моделирование эпидемий в социальных сетях, включающий в себя современные алгоритмы оценки и управления рисками, реализующий практическое компьютерное моделирование эпидемического процесса в социальных сетях.

Методы исследования. В исследовании используются методы системного анализа, теории вероятностей и математической статистики, математического и системного анализа, методы программного моделирования, методы теории графов и рисков.

1 Социальные сети как среда для информативных эпидемий

1.1 Термины и определения

 

1.1.1 Определение основных понятий, необходимых для исследования социальных сетей

 

 Полноценное участие в социальной сети требует от пользователя регистрации, хотя некоторые сети позволяют просматривать общедоступные данные без этого. Пользователи могут добровольно предоставлять свои персональные данные (например, дата рождения, место жительства, интересы и т.д.), которые отражаются в пользовательском профиле [27].

Социальная сеть состоит из пользователей и связей между ними. Некоторые сайты позволяют связаться с другим пользователем, без согласия последнего, в то время как другие сайты следуют двухфазной процедуре, что позволяет получить связь только в том случае, когда обе стороны соглашаются. Некоторые онлайновые социальные сети, например, такие как Flickr, являются сетями с направленными связями (то есть связь от A к B не обозначает наличия обратной линии связи), в то время как большинство социальных сетей имеют двусторонние связи [27].

Пользователи вступают в контакт друг с другом по многим причинам: знакомство в реальном мире, бизнес-контакт, знакомство в виртуальном мире, наличие схожих интересов и т.д. Некоторые пользователи даже рассматривают вопрос приобретения большого числа связей как самоцель. По сравнению с обычными ссылками в сети, ссылки (связи) в социальной сети объединяют функциональность как гиперссылок, так и закладок. Связи пользователя, наряду с его профилем, обычно видны тем, кто посещает его учетную запись. Таким образом, пользователи могут перемещаться по социальной сети, следуя от пользователя к пользователю, просматривая информацию профилей и весь содержащийся контент. [28].   

 

 

Большинство сайтов позволяют пользователям создавать специальные группы по интересам. В этом случае пользователи могут отправлять сообщения группам и загружать контент в группу. Определенные группы модерируются, и допуск к группе контролируется модератором, в то время как другие группы открыты любому пользователю социальной сети. Зачастую сайты в настоящий момент требуют явного задания групп пользователей: пользователи вручную создают группы, при необходимости назначают администраторов, и в свою очередь объявляют, челнами каких групп они являются. Некоторые социальные сети, например, Facebook, создают несколько предварительно заполненных групп на основе доменов адресов электронной почты пользователей, но большинство групп не попадают под эту категорию. Первоначально группы в социальных сетях предназначены либо для контроля политик доступа, либо для предоставления форума с целью обмена и совместного использования контента. Примером первого типа сетей является социальная сеть Facebook, которая по умолчанию позволяет просматривать профили друг друга лишь тем пользователям, которые находятся в одном географическом местоположении или организации. Примерами последних являются фото-группы в Flickr и сообщества в Orkut [29]. 

После того, как пользователь зарегистрирован в социальной сети, у него появляется возможность загружать контент в свой профиль или группу. Многие из сайтов позволяют отмечать контент как общедоступный (видимый другими пользователям) и частный (отображающийся лишь для ограниченного круга лиц – «друзей»). Некоторые онлайновые социальные сети [30] позволяют загружать контент неограниченных размеров, а другие [31] ограничивают объем загружаемой информации. Весь контент, загруженный пользователем, хранится в его профиле, что позволяет другим пользователям знакомиться с новой информацией. Как правило, содержание индексируется, и, если оно находится в открытом доступе, то его можно найти через текстовый поиск. Примером может служить фотографии в Flickr, которые можно найти с помощью функции поиска на основе тэгов и комментариев [27].

Пользователи могут создавать списки избранного контента, которые зачастую являются общедоступными, вместе со страницей профиля пользователя. Эти списки ссылаются на контент, добавленный другими пользователями. Кроме того, большинство сайтов позволяют пользователям комментировать контент, в результате комментарии становятся частью самого контента [32].

Многие социальные сети содержат списки контента, в которых размещены наиболее популярные элементы (с точки зрения количества мнений, замечаний или оценок), недавно загруженные в социальную сеть. Пользователи могут просматривать эти списки, чтобы найти новый популярный контент. Ярким примером является топ-100 на YouTube, где популярность основана на количестве просмотров, комментариев и оставленных положительных оценок, которые получила видеозапись [27].         

Обзорная характеристика социальных сетей, приведенная выше, позволяет сформулировать понятийный аппарат, необходимый для дальнейшего исследования данных сетей. В этой связи уместно выделить их субъекты, объекты, ресурсы, а также действия в сети, определения которых представлены ниже.

 

1.1.2 Субъекты социальных сетей

Авторизованный пользователь – участник социальной сети, прошедший процесс авторизации [27,33].

Неавторизованный пользователь – участник социальной сети, который не авторизован [27,33].

Активный пользователь – участник социальной сети, осуществляющий активные действия применительно к контенту [27].

Пассивный пользователь – участник социальной сети, осуществляющий ознакомление с контентом без проведения активных действий [27].

Модератор – пользователь, имеющий более широкие права по сравнению с рядовыми участниками социальной сети [33].

Редактор – пользователь, который осуществляет наполнение ресурса контентом [33].

Администратор – участник сети, создавший группу или публичную страницу и управляющий ролями пользователей [33].

Автор – пользователь, который сгенерировал контент [34,35].

Подписчик – участник социальной сети, потребляющий контент [34,35].

 

1.1.3 Ресурсы социальных сетей

 

Профиль – персональная страница пользователя социальной сети, на которой содержится информация о ее владельце [27,34,36].

Блог – личная страница пользователя социальной сети для авторских записей, на которой размещается текстовый контент [34].

Канал – страница пользователя в социальной сети для обмена медиа-контентом, которая содержит авторский контент [34].

Паблик – сообщество социальной сети, в которое могут вступить все зарегистрированные в ней пользователи [34].

Группа – сообщество социальной сети, доступ в которое имеется у ограниченного числа пользователей [34,36].

Блокнот – личный ресурс пользователя, содержащий текстовый контент [34].

Форум – ресурс социальной сети для открытого обмена текстовым контентом [36].

Тема – ресурс социальной сети для открытого обмена контентом на заданную тематику [34].

Событие – ресурс, в котором публикуется информация о предстоящем мероприятии [36].

Интерактивная карта - географическая карта местности, на которой в соответствующих координатах расположены ссылки, пройдя по которым можно получить доступ к контенту, содержащему описание объекта [34].

 Стена – расположенные в хронологическом порядке записи, содержащие контент [27,35].

Новостная лента – ресурс, на котором в хронологическом порядке представлен сгенерированный окружением данного пользователя контент [27,35].

Магазин – ресурс для ведения коммерческой деятельности в рамках социальной сети [37].

 

1.1.4 Объекты в социальных сетях

Контент – информационно значимое наполнение ресурса социальной сети [34].

Деструктивный контент – информация, воплощающая в своем содержании негативную оценку конкретного лица, социальной группы, связей и отношений с ними, в том числе через обесценивание характеристик, призывы к уничтожению [38]. 

Сообщение – контент, направленный от одного пользователя другому приватно [35].

Пост – это публичная запись, опубликованная пользователем [35].

Репост – это копия записи оригинального поста, опубликованная на собственной странице с указанием автора [35].

Комментарий – запись пользователя, отражающая его мнение/отношение к ранее сгенерированному контенту [27,35].

Чекин - публичное сообщение о том, что пользователь находится в определенной географической точке [34].

Отзыв – мнение пользователя о приобретенном товаре или предоставленной услуге [27,35].

Закладка – ссылка на интересующую пользователя информацию [35].

Лайк – специальный счетчик, который отражает значимость объекта для оценивающего субъекта [35].

Дизлайк – счетчик негативного отношения субъекта к оцениваемому объекту [35].

Хэштег – это слово или фраза с префиксом#, которые отражают смысловую нагрузку помеченного контента и позволяют осуществлять его поиск [34,35].

Трафик – количество информации, передаваемое через сеть в заданный промежуток времени [35].

 

1.1.5 Действия в социальных сетях

 

Регистрация пользователя – процедура регистрации пользователя социальной сети, в результате которой создается новая учетная запись [34].

Публикация – размещение контента на общедоступном ресурсе [35].

Ознакомление – просмотр ранее сгенерированного в сети контента [27].

Распространение – передача контента в социальной сети между пользователями [27].

Сохранение – передача контента в личный ресурс для его хранения [27].

Комментирование – создание комментария [27,35].

Оценивание – установление значимости объекта для оценивающего субъекта [35].

Редактирование – внесение изменений в опубликованный контент [33].

Подписка – однонаправленный контакт для получения обновляемого контента с определенного ресурса на регулярной основе [34,35].

Рекомендация – предложение пользователю ознакомиться с потенциально значимым для него контентом [27].

Обсуждение – обмен контентом между пользователями на заданную тематику [35].

Добавление тега - прикрепление тега к определенному объекту [27].

В связи с необходимостью анализа диффузии деструктивного контента уместно также представить понятия, относящиеся к общей теории сетей и возникающих в них эпидемиологических процессов, включая описание теории сетей с помощью теории графов:

Граф – это совокупность конечного непустого множества V, содержащего p вершин, и заданного множества Х, содержащего q неупорядоченных пар различных вершин из V [14].

Вершина – элемент p непустого множества V графа G [39].

Ребро – каждая пара  вершин в множестве Х графа G [39]. 

Степень вершины – общее количество связей вершины [39].

Ориентированный граф – граф, состоящий из конечного непустого множества V вершин и заданного набора Х упорядоченных пар различных вершин [39].

Регулярный граф – граф, все вершины которого имеют одинаковую степень [40].

Нерегулярный граф – граф G с n вершинами, которые имеют различную степень, за исключением одной пары [40].  

Смежные вершины – вершины u и v, соединенные ребром x; вершина u и ребро x инцидентны, так же как v и х [39].

Матрица смежности – таблица, где как столбцы, так и строки соответствуют вершинам графа. В каждой ячейке этой матрицы записывается число, определяющее наличие связи от вершины-строки к вершине-столбцу [39]. 

Матрица инцидентности – таблица, где строки соответствуют вершинам графа, а столбцы соответствуют ребрам. В ячейку матрицы на пересечении строки i со столбцом j записывается: 1 в случае, если связь j выходит из вершины i, -1 если связь входит в вершину и 0 во всех остальных случаях [39].

Сеть – это совокупность вершин, соединенных через ребра [39].

Взвешенный сеть – сеть, каждому ребру которой поставлено в соответствие некоторое значение (вес ребра) [39].

Ненаправленная сеть – сеть, состоящая из ненаправленных ребер [39].

Направленная сеть – сеть, состоящая из направленных ребер [39].

Информационная диффузия – процесс распространения информации о некотором событии, идее или факте в сети [41].

Выше представлены основные понятия социальных сетей, а также теории сетей, которые будут использоваться в работе. Опираясь на сделанные определения, перейдем к анализу многообразия социальных сетей.

 

 

1.2 Разновидности социальных информационных сетей

 

1.2.1 Структурно - функциональные особенности сетевых структур и социальных сетей

 

Различают следующие типы сетей:

­ решетчатые и ячеистые сети, представляющие собой цифровую модель поверхности, состоящей из точечной сети. Такие точки являются строго локализованными вершинами с заданным способом вычисления значений уровней между узлами сети, при этом, отличие решетчатых сетей от ячеистых состоит в том, что в первых уровнивычисляются по значениям высот в соседних точках, а во второй вершины являются центрами ячеек с определенным значением.Такие сети являются однородными на индивидуальном уровне и очень сгруппированы из-за локализованного характера соединений[42];

­ сети «тесного мира» были полученыМилграмом (Milgram) и смоделированы Воттсом и Строгацом (Watts и Strogatz) для описания топологических характеристик социальных отношений и сообществ[43-45];

­ случайные сети характеризуются случайным распределением связей, отсутствием кластеризации и коротким путём длины (в то время как решетки имеют длинное расстояние пути из-за высокой кластеризации). Простейшим примером такой сети является модельЭрдеша – Реньи (Erdös-Rényi): случайные графы с [46];

­ безмасштабные сети обеспечивают высокий уровень гетерогенности и могут быть смоделированы в соответствии с алгоритмом Барабаши – Альберта (Barabási-Albert). Общей характеристий таких сетей является [46].

Особный интерес представляют сети больших размерностей, а именно случайныесети,сети «тесного мира» и безмасштабные.

Анализ больших сетей начался с социологического исследования Милграма, который сделал утверждение: каждого человека на земном шаре можно связать с любым другим человеком цепочкой из шести знакомых[43]. Эксперимент заключался в следующем: Он разослал 296 писем с одинаковым содержанием случайно выбранным людям в двух разных городах Америки. В этих письмах сообщалось, что данное письмо должно достигнуть определенного человека в Бостоне, с которым эти 296 человек не были знакомы, и адрес этого человека им не был известен. При этом, эти люди должны пересылать письма только тем своим знакомым, которые, по их мнению, могут им помочь достигнуть нужного конечного адресата. В эксперименте Милграма из 296 писем, 69 достигли цели, что составляет 29% от общего числа. Этот эксперимент считается первым эмпирическим доказательством «явления тесного мира» (“small world phenomenon”) [43].

36 лет спустя эксперимент бы проведен в большем масштабе с использованием электронной почты. Было выбрано 24163 добровольца, которые послали электронные письма своим знакомым. Конечными получателями были 18 человек из 13 стран. Завершенными оказались только 384 цепочки, что указывает на то, что социальные сети на глобальном уровне довольно сильно разрежены [47].

Свойства сетей «Тесного мира» решили изучить Стивен Строгац (Steven Strogatz) и его аспирант Д. Вoттс (Duncan Watts) из Корнельского университета в Итаке (штат Нью-Йорк). Компьютерное моделирование различных типов сетей показало, что этим свойством обладают сети с высокой степенью кластеризации и малой средней длиной пути между узлами.Воттс и Строгатц выделили специальный класс сложных сетей, которые обладают этим эффектом и назвали их сетями «тесного мира».Следует учитывать, что свойством тесного мира обладают несравненно более широкий класс сетей, чем сети Воттса-Строгатца – практически все реальные сети. Формально, сети со свойством «тесного мира» имеют бесконечную размерность. Реальные сетевые структуры, как правило, имеют и высокий коэффициент кластеризации [44-46].

В 1999 году физик из университета Нотр Дам (США) Л. Барабаши (Laszlo Barabasi) вместе со своей аспиранткой Р. Альберт (Reka Albert) решили исследовать закон распределения узлов некоторых реальных сетей по числу связей. Вместо распределения числа связей по закону Пуассона, который имеет строгий максимум около среднего значения, для многих реальных сетей, например, таких как метаболические сети и белковые взаимодействия в клетках, структура авиационных сообщений в США, структура Интернета и его виртуального двойника World Wide Web и т. д., такого среднего значения не существует, а соответствующее вероятностное распределение подчиняется свойственному всем критическим состояниям степенному закону. Таким образом, во многих реальных сетях небольшое число узлов содержит очень большое число связей, а огромное число узлов содержит лишь несколько связей. Такие сети получили название безмасштабных сетей (scale free networks)[46].

Барабаши и Альберт предложили простую и элегантную модель возникновения и эволюции безмасштабных сетей. Они показали, что для возникновения безмасштабных сетей необходимы два условия [48]:

1. Рост. Начиная с небольшого числа m0 узлов, на каждом временном шаге добавляется один новый узел с m(m≤m0) связями, которые соединяют этот новый узел с различными уже существующими узлами.

2. Предпочтительное присоединение (Preferencial attachment). Когда выбираются узлы, к которым присоединяется новый узел, предполагается, что вероятность П с которой новой узел будет соединяться с уже существующим узлом i, зависит от числа связей,которыми этот узел уже связан с другими узлами.

Эта модель представляет собой случайный динамический граф,выращиваемый из небольшого графа, путем неограниченно повторяемых шагов добавления к графу новой вершины с m ребрами. Свободные концы ребер каждой новой вершины присоединяются преимущественно к вершинам, богатыми связями, т.к. вероятность pi соединения ребра с i-тойвершиной графа пропорциональна ее степени связности ki: [49].

Следует отметить, что практически все онлайн социальные информационные сети относятся к безмасштабным[50].

Случайную сеть можно определить как множество, в котором каждая определенная сеть имеет определенную вероятность реализации,то есть свой собственный статистический вес. Из этогоопределения следует, что данная случайная сеть представляет собой сеть с даннойопределенной вероятностью, другая случайная сеть есть сеть с другой вероятностью и т.д [46].

Простейшими случайными сетями являются так называемые классические случайные графы (модель Эрдеша-Реньи) в статистическом ансамбле которых всевозможные графы с числом узлов N и числом связей L имеют одинаковый статистический вес реализации. То есть для таких сетей вероятность существования связимежду любыми двумя узлами одинакова [46].

 

1.2.2 Структура сложных сетей

Нагрузка узла (betweeness certrality)

 

Для многих социальных сетей, необходимо определить относительную важность входящих в нее узлов. Например, загруженность одного узла в сети узлов (между двумя акторами имеется связь, если у них есть общий признак, к примеру обучение в одной школе, университете и прочее) определяется как суммарное число кратчайших путей между всеми остальными акторами (узлами), которые проходят через актора (узел) i: , где число кратчайших путей из узла s в узел t через узел i и  – общее число кратчайших путей между всеми парами s и t. Эту величину можно считать индикатором наиболее влиятельных и важных персон в социальной сети. Эта величина также важна в изучении транспортных потоков и обычно называется нагрузкой (загруженностью) узла (или связи), поскольку характеризуют долю проходящих через узел кратчайших путей и узлы с высоким значением B являются наиболее загруженными. В отличие от степени узла, понятие важности узла отражает свойства взвешенности сети[46].

 


Дата добавления: 2018-04-04; просмотров: 427; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!