Skip navigation

Възстановяване на ИТ инфраструктурата при бедствия

Networkworld България - брой 1, 2002 г. / Съдържание
1203 прочитания, 0

Няма по-голяма заплаха за бизнеса от внезапно унищожаване на ИТ оборудването и разработването на проекти за оцеляване при събития, подобни на атаките в САЩ през септември, е задължително за всяка компания. Ключова роля имат оценката на риска и изборът на подходяща схема за резервиране на основните модули. Евелин Стоев Под бедствие в статията се има предвид не вирусна атака или съобщения от вида “Primary master hard disc fail“, а физическо унищожаване на цялата мрежа или сграда, в която се намира. За да се случи подобно събитие, не е нужно да се заяждате с Осама бин Ладен, достатъчно е по-силно земетресение, пожар, наводнение, кражба. По-дребните произшествия се поправят с добър сервиз от страна на доставчика, с предварително инсталирани и работещи архивиращи решения, RAID системи и т.н. За разлика от тях мащабните антибедствени проекти имат няколко особености: – Често това са готови за работа, но неработещи системи, чиято изправност се проверява на определен период от време, обикновено 3 месеца; – Задействането на подобни системи изисква специално обучен персонал; – Физическото осигуряване засяга само необходимите за продължаване на нормална работа модули. Например съхраняването на архивираната в лентови библиотеки информация не влиза в този параграф; – Преминаването към резервен режим на работа трябва да стане бързо. За тази цел трябва предварително да се уточнят начините за неговото стартиране. При внезапни опасности като земетресения, пожари служителите не се втурват към телефоните и компютрите, а към изхода на сградата; – Степента на осигуреност варира. Ако градът не е в сеизмична зона, просто дублиране на мрежите може да се извърши и в градските рамки, но ако е, това не е удачно решение; – Проектите за възстановяване при бедствия понякога са по-скъпи от оборудването, което резервират, и не е изненада, че много фирми си спестяват тези разходи. Както разбрахме, в България шефовете на ИТ отделите трудно убеждават директорите си, че подобно вложение, което не носи никакви приходи, е обосновано и се стига до половинчати решения. По-голяма част от фирмите с офиси в Световния търговски център продължиха работа след атаките на 11 септември, защото имаха отлични резервни варианти. Според изследване на Gartner Group, две пети от преживелите подобни нещастия компании престават да съществуват до пет години след това, именно защото не могат да се възстановят. Друг любопитен факт, отново според Gartner – 15% от големия бизнес, 50% от средния и 75% от малкия нямат планове за работа при бедствия. Разработването на проекта минава през няколко етапа, но преди това трябва да се уточни, че възстановяването на ИТ инфраструктурата е част от възстановяването на бизнеса. Двете са свързани, но все пак цялостното осигуряване на бизнеса излиза извън рамките на статията. На първия етап се търсят отговорите на следните въпроси. Кои са ключовите за бизнеса сървъри, работни станции и данни, т.е. какъв тип оборудване, включително хардуер, софтуер, мрежи се опитваме да защитим? От какви точно бедствия се опитваме да ги предпазим? Какви мерки са вземани до този момент, колко ефективни са се оказали и подлежат ли на ъпгрейд, или се нуждаят от пълна подмяна? Вторият етап е оценка на риска. Няма общоприета скала, но се изяснява колко често са се случвали природни бедствия в района, близостта до опасни обекти (военни, АЕЦ, ТЕЦ, държавни граници и др.). Ефект на бедствие имат дълготрайното спиране на електрозахранването и продължителното застудяване. Прогнозират се възможните загуби – на клиенти, пазарен дял и финансови – при евентуално забавяне на възстановяването и естествено смисъла на прекомерно големите разходи за незабавното възстановяване. Оценката на риска е слабото място на повечето планове и тя се явява причина за недостатъчните средства, които се отпускат. Много компании наемат консултантски фирми, за да се сдобият с експертна оценка на риска преди да преминат към следващите стъпки. На третия етап се определя конкретната схема на резервиране – например пълно дублиране на ИТ модули в границите на града или страната, отдалечено архивиране и др. Четвъртият етап се състои в определяне на специалните задачи на персонала при извънредните ситуации и назначаване на нужното обучение. Петият и шестият етап са определянето на необходимата сума за изпълнение на проекта и избиране на доставчиците. Обичайна практика в големите компании е осъществяването на плана, провеждането на необходимите редовни тестове и поддръжката да се аутсорсва. Средният и малкият бизнес, където проектите не са така мащабни, се грижат самостоятелно. Често срещан е абонаментът за помещение с определена площ, което се предоставя на фирмата при бедствие, договор с вендорите на ИТ оборудване за експресна доставка на компютри и компоненти, като при сключването се заплаща такса, която може да се разпредели по месеци. За да намалят разходите по вноските, две или повече фирми с офиси на голямо разстояние един от друг сключват общ абонамент и плащат общи вноски, защото вероятността и двете фирми да пострадат едновременно е пренебрежимо малка, а при нещастие се обслужва потърпевшата. Плановете на една от най-големите ИТ компании – Eastman Kodak предвиждат при пълно унищожаване на сградата с централните офиси доставяне на 100 работни станции на новото място (за което фирмата се е абонирала) за 24 часа и 300 за три дена, а възстановяването на ERP системата да стане за 4 часа. Прегледът на предложенията на различните компании, който следва, не е пълен, но дава ясна представа за различните алтернативи. Аутсорсинг срещу собствени решения Наемането на компания, която разработва проекта за възстановяване при бедствия и го осъществява, има няколко преимущества: така е по-евтино (за едрия бизнес), редовните тестове на оборудването са гарантирани, при извънредни обстоятелства се действа професионално заради натрупания опит, възможни са и мащабируеми реакции, в зависимост от ситуацията. Всички големи доставчици на web услуги в света, собствениците на е-магазини, банки и финансови институции аутсорсват физическото резервиране и на повечето от тях поне веднъж се е налагало да се възползват от него. В историята на Нюйоркската стокова борса, както и Nasdaq има няколко случая, в които дистанционното дублиране на информацията е спасило цялата база данни на борсата. При наближаване на опасност – ураган, лоша прогноза за времето и др. – предлагащите услугите фирми предупреждават клиентите си, а в такива ситуации отсъствието на фактора изненада е огромен плюс. За по-малките фирми обаче самото възстановяване е по-важно от сроковете, в които трябва да се извърши, важните данни са по-малко, а касетите от лентовите библиотеки се пазят на сигурно място. В такива случаи самостоятелното разработване на план е може би по-изгодно. Освен това професионално предлагащите услуги по възстановяване фирми работят и ако се свържете с тях след бедствието. Compaq ­ системи против всевъзможни бедствия Сървърите NonStop Himalaya са известни в целия свят, по-интересен е предлаганият от компанията софтуер за тях. Remote Database Facility (RDF) свързва главната с резервната мрежа и извършва копиране на данните през определено време или следене и пълно дублиране на всички процеси, частично архивиране. Пакетът работи независимо от разстоянието. В случай че основната мрежа престане да функционира, той превръща резервната мрежа (или компютър, сървър) в главна и пренасочва целия трафик към нея. В идеалния вариант няма загуба на данни или влошаване на предлаганите услуги. Сред предимствата на RDF пакета са възможностите да резервира няколко компютъра на един, но по-мощен или обратно – сървър се подсигурява с няколко работни станции. Пакетът Reliable Transaction Router (RTR) резервира хетерогенни ИТ среди като клиент/сървър, които изискват непрекъсната обработка в реално време. Софтуерът дублира цялата информация и при авария втората мрежа автоматично се превръща в главна, а информация за промяната с точните данни се изпраща на предварително зададени лица по Интернет или като съобщение по мобилен телефон. Клиентите дори не подозират за случилото се. RTR е съвместим с продукти на различни доставчици. Например едната система може да е от Fujitsu Siemens, другата да е Hewlett-Packard, а третата да е AlphaServer на Compaq с операционна система OpenVMS. RTR поддържа Windows 95/98/NT/2000/Me, Tru64 UNIX и OpenVMS, Sun Solaris, IBM AIX, HP-UX и SCO UNIX. В добавка RTR разполага със собствен API (application program interface), с който още повече се улеснява неговото управление и настройка. Disaster Tolerant Cluster Services (DTCS) е сред водещите в бранша компютърни архитектури за ефективно възстановяване в рамките на няколко секунди или минути на работата на цял информационен център. Две системи се разполагат на разстояние до 800 км една от друга и се свързват с високоскоростна оптична връзка. Те са напълно заменяеми и дори при пълно изчезване на едната клиентите не усещат нищо. При поръчка Compaq прави проучване и предлага най-подходящия план за възстановяване при бедствия и осигурява обучение на персонала. IBM Според IDC три компании – IBM, Comdisco и SunGard – държат 80% от пазара на решения за възстановяване при бедствия. IBM Business Continuity and Recovery Services е поделението на Синия гигант, което се занимава с разработването на съответните проекти. Готови схеми не се предлагат, защото при подаване на поръчка специалисти от IBM извършват цялостна оценка на риска и предлагат вариант. Работи се с оборудване на различни доставчици, без това да намалява качеството на обслужването. Схемите включват както частично, така и пълно резервиране. Последното е 100 дублиране на ключовите машини на отдалечени и напълно обзаведени места, които при бедствие изпълняват функциите на основния офис. НР Подобни са услугите и на НР. През 2001 г. компанията закупи Comdisco, един от лидерите на този пазар, който изигра основна роля за възстановяването на маса фирми в Световния търговски център след атаката. Преките клиенти на Comdisco са били 40 и всички са обслужени експресно, т.е. резервните помещения с необходимото оборудване са били осигурени практически веднага и още на 12 септември техните клиенти са продължили дейността си. Сега сред тях няма нито един, за който катастрофата се е оказала фатална. Oracle Неотдавна компанията обяви софтуер, предназначен за резервното архивиране и дублиране на нейните бази данни. Той се нарича Data Guard, но за потребителите на 8i е достъпна версия, при която от копието на базата данни само се чете, но не може да се извършват промени. Пълната версия се доставя с 9i. Преминаването от главната система към дублираната се извършва елементарно, а функцията Zero Data Loss Log Transport следи за постоянния ъпдейт на информацията. От Oracle съобщават, че към пакета има голям интерес от райони, където електрозахранването спира за по няколко часа (в Щатите това е Калифорния). Пакетът на Computer Associates се нарича Crisis Life Cycle Management и включва модули от предишни продукта на СА – Unicenter TNG, eTrust, BrightStor, Advantage и Clever Path. Използва се технология, с която информация от различни места се дублира в общ център. CleverPath Aion Business Rules Expert настройва управлението според предварително зададени модели в зависимост от конкретното бедствие. Microsoft предлага много варианти за възстановяване при различни видове бедствия; повечето са от типа “Направи си сам“. За различните продукти има специфични съвети, а гигантът не е забравил нито един: от SQL и сървърните ОС до настолни приложения. Подробна информация ще намерите на http://support.microsoft.com/isapi/gosupport.asp?target=/highlights/recovery.asp (по-кратък адрес няма). Изборът на подходящ вариант е трудна задача, но в България също има добри специалисти, които ще ви помогнат. Дори лоша схема, но редовно тествана понякога е спасителна за бизнеса, а и сега има предложения за резервно дублиране от специализирани фирми, като разходите са минимални. Kare Разходите за решения за възстановяване при бедствия нарастват 36% от фирмите ще увеличат средствата за разработване и осъществяване на резервиращи схеми след атаките от 11 септември, сочи проучване на сп. NetworkWorld, САЩ. Това обаче няма да стане за сметка на повишен бюджет, а на пренасочване на средства, предимно от планирани ъпгрейди, защото едва 11% от фирмите ще увеличат ИТ разходите си. 65% от ИТ шефовете считат, че отпуснатите средства са недостатъчни.

(03.03.2002)

КОМЕНТАРИ

Трябва да сте регистриран потребител, за да коментирате статията
"Възстановяване на ИТ инфраструктурата при бедствия "



    

© Ай Си Ти Медиа ЕООД 1997 - 2012 съгласно общи условия за ползване