あらゆる災害を想定し、リカバリー体制を整えよ
Vol.5

あらゆる災害を想定し、リカバリー体制を整えよ

ITインフラにおけるDR&BCP対策
東日本大震災をきっかけに動き出した、JX金属株式会社様の災害復旧体制構築プロジェクト。同社のITインフラの担い手として、有事の際にもすみやかに業務システムや重要なデータを回復可能な体制づくりをめざした担当者たちの挑戦をご紹介します。

CLOSE
村上さん

エネルギー・資源ソリューション事業本部
エネルギー・金属システム事業部
システム基盤部
課長代理(当時)

村上 正利

Masatoshi Murakami

林さん

エネルギー・資源ソリューション事業本部
エネルギー・金属システム事業部
システム運用部
課長代理(当時)

林 利晃

Toshiaki Hayashi

3.11を教訓に

2011年3月11日、宮城県沖を震源として発生した東日本大震災。この未曾有の災害は、人々の防災に対する意識を大きく変えることになりました。「万が一の事態に、十分な備えはあるか?」多くの人が、そして組織が改めてこの問いに向き合い、対策を見直し始めたのです。NTTデータCCSのお客様であるJX金属株式会社様も、例外ではありませんでした。早急にDR(Disaster Recovery:災害復旧)およびBCP(Business Continuity Plan:事業継続計画)のためのプロジェクトチームが組まれ、有事の際に対応できる体制づくりに向けて動き出したのです。

同社のサーバやストレージ、ネットワークといったITインフラの構築や、会計や生産管理などの各種システムの開発、それぞれの運用・保守などを手掛けてきたNTTデータCCSは、システムのプロとしてこのプロジェクトに参加。システムエンジニアとしてJX金属様と計画していた村上さんが中心となって、ある拠点が被災した際に、別の場所で早急にシステムを復旧できる仕組みづくりに取り組みました。


いかに優先順位をつけるか

従来、生産情報や管理情報、ファイルサーバなどの重要なデータは、磁気テープにバックアップし、そのテープを他の拠点に運んで保管することでDR対策を行っていたJX金属様。しかし、この方法では移動に時間がかかることや、有事の際、復旧に時間がかかってしまう問題がありました。さらに、バックアップの頻度も限られるため、被災直前のデータを復旧することが困難でした。これらの問題を解決するために提案したのが、東日本に立地するNTTデータCCSのデータセンターに専用のシステム環境を構築し、各拠点のバックアップデータをネットワーク経由で同期させるプランでした。物理的な運搬をしないため、いざという時には早急に復旧に入れるだけでなく、より高い頻度でのバックアップも可能になります。

村上さん

お客様と話し合いながら、
スムーズに業務を再開できるよう
優先順位を決めていきました

とはいえ、バックアップされた膨大なデータすべてを一度に復旧させることはシステムに大きな負担がかかり、現実的とは言えません。そこで必要となったのが、バックアップデータの中で優先順位をつけること。1日で復旧させるべき情報から1週間後でも大きな問題につながらない情報までを精査し、順次復旧させていくことを目指したのです。

「業務上どのデータの優先度が高いのかを、私たちだけで判断することはできません。お客様と話し合いながら、もっともスムーズに業務を再開できるよう優先順位を決めていきました」と語る村上さん。結果、「JX金属様のお取引先様に影響が及ぶ情報」を最優先とする方針が決定しました。この方針にそって年に1~2拠点ずつDR対策を施していき、2015年度には国内の主要拠点すべてをカバーする体制をつくりあげることができたといいます。

2012〜2015年度に構築したDR体制

2つのデータセンターでさらなる安全性を追求

お客様とプロジェクトを進めていた村上さんに対し、バックアップを集約するデータセンターでDRシステムの運用を担当したのが林さんでした。この業務に携わるようになってから、災害に対する意識が大きく変わったといいます。

「2011年以降も地震はあちこちで起こっていましたし、台風や豪雨による被害も目につくようになりました。以前は『怖いな』『大変だな』という受け身の立場だったのが、限られた範囲とはいえその対策を担う立場になった。報道を見るたび、気が引き締まる想いです」

林さんの務めるデータセンターは、震度6強の地震にも耐えられるよう設計され、日本データセンター協会が定める最高品質“ティア4”の認定を受けています。同協会の基準によれば、これは稼働信頼性「99.99%以上」を指すレベルです。

それでも100%ではない。
さらなる安全性を求めて、
2016年から新たにスタート

林さん

「しかし、それでも100%ではない。さらなる安全性を求めて、2016年から新たにスタートしたのが、もう一箇所データセンターを選定して、想定外の規模の広域災害にも対応できる体制をつくるプロジェクトでした」

林さんはデータセンターのオペレーションを担ってきた経験を生かして、もう一箇所のデータセンターの選定を担当。複数のデータセンターに情報提供を呼びかけ、それをもとに検討を進めていきました。立地、設備、対応力、コストなどあらゆる面を踏まえて選出したのが、西日本に立地するデータセンター。さらなるBCP対策を目指すため、お客様にもご理解いただき、西日本のデータセンターへのDR環境の構築が進められていきました。

2016〜2018年度に構築したDR体制

そして、より多くのお客様へ

西日本と東日本にそれぞれバックアップ先が確保できたことで、各拠点のデータをより遠方のデータセンターと同期させるしくみを構築することができました。さらにその上で、各データセンターのバックアップデータを相互に補完し、より高い安全性を確保できたと林さんは語ります。

「加えて、改めてバックアップをとる頻度、それを復旧するまでにかかる時間も再検討。結果として、最も優先順位の高い情報については被災1時間前の情報を、6時間後には復旧できるようになりました」

日々の運用に加え、お客様の業務に支障をきたさない形で定期的なリハーサルも実施。いざという時に問題なく運用できる体制を維持するとともに、さらなる改善を加えていくことを目指しています。

2018年に西日本のデータセンターを含めたDR体制が完成し、現在は順調に稼働中。お客様からも、高い評価をいただくことができました。今後はその運用を担いつつ、今回得たノウハウをより多くのお客様に役立てていただきたいと村上さんは考えています。

「事業を展開する上で直面する、さまざまなリスク。私たちはそれに向き合い、ともに対策を立てていくパートナーになることができます。不測の事態に見舞われる前に、ぜひご相談いただきたいですね。きっとお役に立てると思います」