Cистемы хранения данных
Для того чтобы повысить эффективность управления и свести к минимуму расходы, предприятия и организации стремятся оптимизировать существующие бизнес-процессы. Наиболее важным активом при этом становится информация, доступность и актуальность которой является ключевым фактором успеха в конкурентной среде. Такая ситуация стимулирует широкомасштабное развитие технологий хранения данных.
Современная система хранения данных обеспечивает надежное хранение информационных ресурсов и обеспечивает доступ к ним. В состав системы входят дисковые массивы, инфраструктура доступа к ним и программные комплексы управления хранением данных.
Сетевое хранение данных
На инфраструктуру доступа к устройствам хранения данных возлагается ответственность за доступность информации для приложений и конечных пользователей, поэтому эта составляющая систем хранения данных развивается наиболее динамично. Вместо традиционного прямого подключения дисковых массивов к серверам (DAS – Direct Attached Storage) появились и нашли широкое применение технологии, основанные на использовании сети в качестве инфраструктуры доступа к данным. Технология SAN (Storage Area Network) использует выделенную сеть на основе протокола Fibre Channel и производит обмен данными на уровне блоков. Устройства NAS (Network Attached Storage), являющиеся, по существу, специализированными файл-серверами, в качестве транспорта задействует существующие IP-сети и оперирует на уровне файлов. Наилучшим вариантом представляется одновременное использование SAN и NAS, при котором способ доступа к данным определяется исходя из конкретных требований.
Основными преимуществами сетевого хранения данных являются:
- высокая масштабируемость. По мере роста объемов данных масштабируемость решения приобретает все большее значение, снижая стоимость хранения данных в целом;
- высокая производительность. Применение Fibre Channel SAN (Gigabit Ethernet для NAS) обеспечивает высокие скорости обмена данными;
- высокая доступность и надежность. Благодаря сетевой архитектуре становится возможным резервирование компонентов системы хранения и устранения единых точек отказа;
- эффективное выполнение процедур миграции данных (резервного копирования, репликации данных и т.п.); сокращение нагрузок на основную сеть (SAN) и вычислительные комплексы (SAN, NAS);
- большая дальность передачи информации и возможность создания распределенных систем хранения;
- возможности управления распределением памяти и консолидация устройств хранения данных;
- возможность доступа к данным из гетерогенных сред.
В настоящее время основной топологией, применяемой при построении SAN, является коммутируемая архитектура (FC_SF – switch fabric), использование которой позволяет увеличить адресуемость до 16 млн. устройств, размеры области досягаемости данных и готовность всей сети хранения в целом.
По мере роста объема данных применение SAN становится наиболее оправданным решением с экономической точки зрения. Сегодня стоимость внедрения сетей хранения данных ненамного отличается от стоимости систем хранения с прямым подключением. В дальнейшем высокая масштабируемость SAN позволит снизить стоимость хранения информации.
Компания «Открытые Технологии» рассматривает внедрение сетей хранения данных как одно из наиболее перспективных направлений развития корпоративных информационных систем. Нашими партнерами являются лидеры в области построения SAN – компании Brocade Communication Systems, EMC, Hitachi Data Systems, VERITAS и BMC Software.
Репликация данных
Репликация данных обеспечивает выполнение большого числа задач, наиболее актуальными из которых являются:
- резервирование данных – хранение актуальной копии информации на альтернативных устройствах хранения;
- разделение данных – предоставление возможности нескольким серверам одновременно изменять разделяемый набор данных;
- консолидация данных – копирование данных с удаленных узлов на центральный узел;
- Follow-the-sun – управление локальными копиями данных для обеспечения информационной поддержки организации в целом.
Репликация данных может быть осуществлена встроенными средствами программных комплексов, однако в этом случае организация централизованного процесса репликации невозможна. Кроме этого, репликация данных на уровне приложений порождает дополнительные нагрузки на вычислительные мощности серверов. Для устранения этих недостатков применяются специализированные программные репликаторы или используются аппаратные средства репликации данных.
Вне зависимости от способа репликации может быть применен один из двух режимов – синхронный либо асинхронный. Синхронный режим репликации обеспечивает абсолютную актуальность данных, но требует применения высокопроизводительной коммуникационной инфраструктуры, например, внедрения SAN.
Резервирование данных
Эффективным способом избежать потерь информации, возникающих вследствие сбоев, служит зеркалирование. Однако при помощи зеркалирования данных невозможно устранить первопричину потерь – ошибочные действия пользователей. Резервное копирование данных позволяет избежать потерь как в случае программных или аппаратных сбоев, так и возникающих вследствие ошибок операторов.
При построении систем резервного копирования и восстановления данных требуют решения две важнейшие задачи:
- сокращение «окна» резервного копирования (времени останова приложений – zero downtime);
- сокращение трафика данных резервного копирования и затрат вычислительных ресурсов.
Время останова приложений возможно свести к минимуму, применяя специальные методы, такие как создание моментальных копий (snapshots). Моментальная копия – это «снимок» состояния и запись местонахождения данных. С помощью этой информации данные могут быть восстановлены в случае потери или повреждения. Создание моментальной копии требует останова приложения, однако время простоя исчисляется секундами.
С применением коммутируемой архитектуры SAN процессы резервного копирования и восстановления данных могут быть организованы без использования ресурсов локальной сети (внесетевое резервное копирование – LAN-free backup), а также серверов (внесерверное копирование – server-free backup). Кроме этого, благодаря централизованной схеме резервирования данных сокращается число устройств (ленточных накопителей, и т.п.), участвующих в процессе.
При внесетевом резервном копировании данные с дисковых массивов транспортируются внутри SAN, на ленточные накопители, подключенные непосредственно к сети хранения.
При внесерверном копировании данные перемещаются с устройств хранения на ленточные накопители без прямого участия серверов – обмен данными происходит непосредственно между устройствами хранения внутри SAN на уровне блоков данных, однако при необходимости возможно пофайловое восстановление информации. Главное преимущество внесерверного копирования заключается в высвобождении вычислительных серверных ресурсов.