Надежность, отказоустойчивость и безопасность корпоративных компьютерных сетей



 

Важнейшей характеристикой вычислительной сети является надежность - способность правильно функционировать в течение продолжительного периода времени. Это свойство имеет три составляющих: собственно надежность, готовность и удобство обслуживания.

Повышение надежности заключается в предотвращении неисправностей, отказов и сбоев за счет применения электронных схем и компонентов с высокой степенью интеграции, снижения уровня помех, облегченных режимов работы схем, обеспечения тепловых режимов их работы, а также за счет совершенствования методов сборки аппаратуры. Надежность измеряется интенсивностью отказов и средним временем наработки на отказ. Надежность сетей как распределенных систем во многом определяется надежностью кабельных систем и коммутационной аппаратуры - разъемов, кроссовых панелей, коммутационных шкафов и т.п., обеспечивающих собственно электрическую или оптическую связность отдельных узлов между собой.

Повышение готовности предполагает подавление в определенных пределах влияния отказов и сбоев на работу системы с помощью средств контроля и коррекции ошибок, а также средств автоматического восстановления циркуляции информации в сети после обнаружения неисправности. Повышение готовности представляет собой борьбу за снижение времени простоя системы.

Критерием оценки готовности является коэффициент готовности, который равен доле времени пребывания системы в работоспособном состоянии и может интерпретироваться как вероятность нахождения системы в работоспособном состоянии. Коэффициент готовности вычисляется как отношение среднего времени наработки на отказ к сумме этой же величины и среднего времени восстановления. Системы с высокой готовностью называют также отказоустойчивыми.

Основным способом повышения готовности является избыточность, на основе которой реализуются различные варианты отказоустойчивых архитектур. Вычислительные сети включают большое количество элементов различных типов, и для обеспечения отказоустойчивости необходима избыточность по каждому из ключевых элементов сети. Если рассматривать сеть только как транспортную систему, то избыточность должна существовать для всех магистральных маршрутов сети, то есть маршрутов, являющихся общими для большого количества клиентов сети. Такими маршрутами обычно являются маршруты к корпоративным серверам - серверам баз данных, Web-серверам, почтовым серверам и т.п. Поэтому для организации отказоустойчивой работы все элементы сети, через которые проходят такие маршруты, должны быть зарезервированы: должны иметься резервные кабельные связи, которыми можно воспользоваться при отказе одного из основных кабелей, все коммуникационные устройства на магистральных путях должны либо сами быть реализованы по отказоустойчивой схеме с резервированием всех основных своих компонентов, либо для каждого коммуникационного устройства должно иметься резервное аналогичное устройство.

Переход с основной связи на резервную или с основного устройства на резервное может происходить как в автоматическом режиме, так и вручную, при участии администратора. Очевидно, что автоматический переход повышает коэффициент готовности системы, так как время простоя сети в этом случае будет существенно меньше, чем при вмешательстве человека. Для выполнения автоматических процедур реконфигурации необходимо иметь в сети интеллектуальные коммуникационные устройства, а также централизованную систему управления, помогающую устройствам распознавать отказы в сети и адекватно на них реагировать.

Высокую степень готовности сети можно обеспечить в том случае, когда процедуры тестирования работоспособности элементов сети и перехода на резервные элементы встроены в коммуникационные протоколы. Примером такого типа протоколов может служить протокол FDDI, в котором постоянно тестируются физические связи между узлами и концентраторами сети, а в случае их отказа выполняется автоматическая реконфигурация связей за счет вторичного резервного кольца. Существуют и специальные протоколы, поддерживающие отказоустойчивость сети, например, протокол Spanning Tree, выполняющий автоматический переход на резервные связи в сети, построенной на основе мостов и коммутаторов.

Существуют различные градации отказоустойчивых компьютерных систем, к которым относятся и вычислительные сети. Приведем несколько общепринятых определений:

- высокая готовность (high availability) - характеризует системы, выполненные по обычной компьютерной технологии, использующие избыточные аппаратные и программные средства и допускающие время восстановления в интервале от 2 до 20 минут;

- устойчивость к отказам (fault tolerance) - характеристика таких систем, которые имеют в горячем резерве избыточную аппаратуру для всех функциональных блоков, включая процессоры, источники питания, подсистемы ввода/вывода, подсистемы дисковой памяти, причем время восстановления при отказе не превышает одной секунды;

- непрерывная готовность (continuous availability) - это свойство систем, которые также обеспечивают время восстановления в пределах одной секунды, но в отличие от систем устойчивых к отказам, системы непрерывной готовности устраняют не только простои, возникшие в результате отказов, но и плановые простои, связанные с модернизацией или обслуживанием системы. Все эти работы проводятся в режиме online. Дополнительным требованием к системам непрерывной готовности является отсутствие деградации, то есть система должна поддерживать постоянный уровень функциональных возможностей и производительности независимо от возникновения отказов.[2]

Основными для теории надежности являются проблемы надежностного анализа и синтеза. Первая состоит в вычислении количественных показателей надежности существующей или проектируемой системы с целью определения соответствия ее предъявляемым требованиям. Целью надежностного синтеза является обеспечение требуемого уровня надежности системы.

Для оценки надежности сложных систем применяется следующий набор характеристик:

- Готовность или коэффициент готовности (availability) - означает долю времени, в течение которого система может быть использована. Готовность может быть улучшена путем введения избыточности в структуру системы. Чтобы сеть можно было отнести к высоконадежной, она должна как минимум обладать высокой готовностью, необходимо обеспечить сохранность данных и защиту их от искажений, должна поддерживаться согласованность (непротиворечивость) данных (например, если для повышения надежности на нескольких файловых серверах хранится несколько копий данных, то нужно постоянно обеспечивать их идентичность).

- Безопасность (security) - способность системы защитить данные от несанкционированного доступа.

- Отказоустойчивость (fault tolerance). В сетях под отказоустойчивостью понимается способность системы скрыть от пользователя отказ отдельных ее элементов. В отказоустойчивой системе отказ одного из ее элементов приводит к некоторому снижению качества ее работы (деградации), а не к полному останову. В целом система будет продолжать выполнять свои функции;

- Вероятность доставки пакета узлу назначения без искажений.

Наряду с этой характеристикой могут использоваться и другие показатели:

- вероятность потери пакета (по любой из причин - из-за переполнения буфера маршрутизатора, из-за несовпадения контрольной суммы, из-за отсутствия работоспособного пути к узлу назначения и т. д.);

- вероятность искажения отдельного бита передаваемых данных;

- отношение потерянных пакетов к доставленным.[10]

Основой надежности всех корпоративных сетей, является надежность сетей связи (СС), но обеспечение высокой надежности не является самоцелью, а представляет собой средство достижения максимальной эффективности сети. Уровень надежности, при котором достигается максимум показателя эффективности СС, является оптимальным для нее. Этот уровень определяется многими факторами, к числу которых относятся: назначение СС, ее структура, размер убытков, вызванных потерей заявки на обслуживание, используемые алгоритмы управления, уровень надежности элементов СС, их стоимость, условия эксплуатации и т.д. Оптимальный уровень надежности СС определяется на этапе системного проектирования системы более высокого порядка, в которую СС входит в качестве подсистемы.

Задача обеспечения требуемой надежности может решаться как при синтезе СС, так и в ходе управления уже существующей СС. В первом случае она сводится к определению варианта назначения типов элементов из заданного множества, обеспечивающего требуемый уровень надежности при минимальной стоимости. Решение ее применительно ко всей СС сразу для реальных сетей оказывается невозможным из-за большой размерности задачи. Поэтому ее вначале решают для подсети, связывающей пару абонентов с высшим приоритетом. Затем с учетом сделанных назначений типов элементов решают эту же задачу для следующей по приоритетности тяготеющей пары и т. д., пока требования по надежности связи не будут удовлетворены для всех заданных тяготеющих пар.

Обеспечение требуемого уровня надежности на этапе управления существующей СС вначале решается с целью использования для этого внутренних ресурсов сети, без введения структурной избыточности, и сводится к формированию множества маршрутов для каждой тяготеющей пары, обеспечивающего требуемый уровень надежности.

Формирование множества маршрутов осуществляется итеративно, причем на каждом шаге для сформированного к началу этого шага множества рассчитывается вероятность успешной реализации сеанса. Если эта вероятность не меньше требуемой, процесс завершается.

Формирование начального множества маршрутов может осуществляться двумя способами. Первый заключается в том, что пользователь включает в него маршруты, отобранные им на основании некоторого критерия, например, исходя из прежнего опыта их использования. Второй способ применяется, когда пользователь не имеет возможности самостоятельно сформировать это множество. В этом случае отбирается некоторое количество (обычно не более десяти) наиболее надежных маршрутов, из которых пользователь выбирает по своему усмотрению некоторое подмножество. Если показатель надежности сформированной таким образом подсети меньше требуемого, из оставшегося множества выбираются наиболее надежные маршруты (возможно, один), оценивается обеспечиваемая при этом вероятность связности и т.д.

 

 


Дата добавления: 2019-08-31; просмотров: 1337; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!