クラウド移行後も故障に備えた設計を
AWSユーザーが検討すべき4つの障害対策
クラウドをIaaS※として利用する場合、インフラはクラウド事業者が管理してくれますが、障害が発生しないかどうかはまったくの別問題。ミッションクリティカルなシステムのクラウド移行では、大規模障害を想定した対策が不可欠です。
※IaaSとは「Infrastructure as a Service」の略称で、サーバーやネットワークなどの物理環境をインターネット上で提供する仕組みのこと。
「AWSユーザーが検討すべき4つの障害対策」
-
クラウドベンダーの
責任範囲はインフラまで - IaaSの責任共有モデル(右図)(下図)では、OSより上位のソフトウェア領域に起因する障害は、ユーザー側で対応する必要があります。
-
SLAはあっても100%ではない
- インフラについて、SLAが細かく設定されていますが100%ではありません。過去にはデータセンター規模の障害発生も…。
IaaSの責任共有モデルを考慮したシステム設計(単一障害点のない設計など)により、クラウドをIaaSとして利用する際のシステムの可用性を確保することが重要です。
AWSユーザーが検討すべき
4つの障害対策
クラウドの中でも利用者の多いAWS環境で、
一般的によく使われる4つの障害対策をご紹介します。
-
マネージドサービスの
活用AWSでは、複数データセンター間で冗長構成が可能なマネージドサービスや、インスタンスの自動復旧機能などが標準提供され、簡単に障害対策を実現できます。
-
監視ツールの導入
+ 手動での復旧監視ツールを導入し、障害を検知したインスタンスを手動で再起動する対応も可能です。ただし、ダウンタイムが発生するため、ミッションクリティカルなシステムには不適です。
-
HAクラスター構成で
システムを冗長化異なるデータセンター間でデータをリアルタイムに同期し、万が一の際、迅速な自動復旧を行う仕組みです。ダウンタイムを最小化し、ミッションクリティカルなシステムの高可用性を実現します。
-
バックアップ
(スナップショット取得)クラウドにおいても、障害対策の基本はバックアップです。AWSではインスタンス全体のスナップショット取得によって、データを含め特定の時点を再現することができます。