システムを平常運用させるためにはバックアップが重要です。しかし、いざ自社のシステムをバックアップしようとしても「システムのバックアップ構成についてよくわからない」、「RPO、RTOの違いがわからない」
などの疑問を持つシステム担当者もいるのではないでしょうか。本記事では、バックアップの指標であるRPO(目標復旧時点)とRTO(目標復旧時間)について解説します。
目次
RPOとRTOとは?それぞれの違いとは
RPO、RTOは、どちらもシステムのバックアップに関する用語です。また、システムの事業継続や災害対策を構築するうえで重要な指標でもあります。バックアップの指標としてはほかにRLOがあり、RPO、RTO、RLOで「3つのR」と表されることもあります。
RPO(目標復旧時点)とは
RPOとは「Recovery Point Objective」の略称で、日本語では「目標復旧時点」を意味します。RPOはシステム障害が発生した際に、過去の「どの時点まで」のデータを復旧させるかを表す目標値です。RPOの表し方は「0秒」「4時間」「1日」といったように期間で定義されます。例えば、 RPO が0秒の場合は「システム障害直前までに記録したデータを復旧させる」ことを指し、1週間の場合は「システム障害が発生する1週間前までに記録したデータを復旧させる」という意味になります。
つまり、RPOの数値が小さければ小さいほど、より厳しいバックアップ体制が敷かれていることを意味し、その分運用コストも高くなります。
RTO(目標復旧時間)とは
RTOとは「 Recovery Time Objective」の略称で、日本語では「目標復旧時間」を意味します。RTOはシステム障害が発生した際に、「どのくらいの時間で(いつまでに)」システムを復旧させるかを表す目標値です。システムの利用者にとっては、サービスの中断やシステム停止が許される時間ともいえます。
RTOは「〇時間」と時間で表します。例えばRTOが72時間の場合は、「72時間以内にシステムを復旧させなくてはならない」ことになります。
RTOの数値はRPOと同様、ゼロに近ければ近いほど、システムが復旧するまでの時間を短くするためにバックアップ体制を強化する必要があります。その分運用コストも高くなります。
RLO(目標復旧レベル)とは
もうひとつのバックアップの指標としてRLOが存在します。RLOは「Recovery Level Objective」の略称で、日本語では「目標復旧レベル」を意味します。RLOはどのレベルでシステムを復旧させ、サービスを再開するかの目標値です。
RLOはパーセンテージ(%)で表します。例えばRLOが100%の場合は、「被災前の完全な状態に戻すこと」になります。RLOはRPOやRTOと違い、数値が100%に近ければ近いほど、より厳しいバックアップ基準を設けていることを示し、運用コストも高くなります。
RPOとRTOの事例
RPOやRTOは、どちらか一方を設定するものではなく、両者をセットで設定するのが一般的です。取り扱う情報に応じて設定されるRPO、RTOは変わります。実際に、企業がどのようにRPOとRTOを設定しているのかについて紹介します。
地方銀行Aの場合
ある地方銀行のRPOとRTOについて紹介します。
金融機関では金融情報や個人情報などといった重要情報を取り扱うため、バックアップ構成の構築は必須です。重要情報の損失は、銀行の利用者にとっては大きな問題に発展します。そのため、災害時を想定したBCP(事業継続計画)が万全に期されています。
地方銀行Aでも、保持する金融情報や個人情報について厳格なバックアップ体制を敷いています。RPOを1分、RTOは1時間と高度な信頼性を担保する基準を定めています。
同行ではデータのミラーリングとクラスタ構成の構築を行うことでRPOとRTOの最小化を図っています。ミラーリングはデータベースにあるデータを別の保存媒体に保管することを指し、クラスタ構成は複数のサーバをネットワーク上で連携させ1つのシステムとして利用する仕組みです。また、同行ではメインのサーバを大阪、バックアップ用のサーバを東京にそれぞれ配置し稼働させています。大阪にあるメインのサーバが被災した場合には、東京に存在するバックアップサーバが業務を継続するというバックアップ体制を整えています。東京にあるバックアップサーバが高い頻度で大阪のメインサーバに蓄積している情報をコピーし、ふたつのサーバ間の整合性をとっているのです。同行では、データベースの機能を利用して1分おきにバックアップサーバにバックアップを行っています。
電気機器メーカーBの場合
電機機器メーカーBでは、RPOを15分以内、RTOは最短4~5時間に設定しています。
同社は外部のシステム開発会社にシステムを委託しており、そのシステム開発会社が保有する2拠点のデータセンターを活用しています。2拠点のデータセンターは互いが物理的に離れており、たとえ一方のデータセンターで大規模災害が発生したとしても、もう一方のデータセンターには影響がないような体制を敷いています。
このような災害対策をシステム業界ではDR(Disaster Recovery:ディザスタリカバリ)対策と呼びます。
通常、2拠点のデータセンターを活用する場合は運用コストが増大する傾向にありますが、同社はシステムの保守運用業務を1社に一本化しています。それによってシステム運用の効率的な実施が可能になり、運用コストも抑えられています。
RPOとRTOの短縮方法
RPOとRTOを短縮するためには、主にシステム面と人間系のふたつの観点があります。
システム面:バックアップツールの導入
システム面では、手作業を減らし、効率的にシステムを復旧させるためにはバックアップツールを導入することが重要です。バックアップツールを使えば、ボタンひとつで外部メディアへのデータ保存やデータ復旧を行うことができるため、作業の効率化を図れます。
人間系:人間系の業務の効率化・明確化
災害からの復旧をシステムがすべて自動で行うことは難しく、一定の作業は人間が行う必要があります。そのため、人間系のリカバリ作業の整備も必要です。具体的には、リカバリ作業の手順化や事前にシステムの設定を変更するなど、リカバリに費やす時間を短縮することが可能です。手順が決められている場合でも、肝心の作業者が不在で対応者がいないといった事態もありうると想定して、人員の配置を検討することも重要です。
Carbonite製品でRPOとRTOを短縮しよう
ウェブルートでは「Carbonite® Migration」と「Carbonite® Availability」を提供しています。 Carbonite®シリーズは国内大手のさまざまな業種業での導入実績があります。「Carbonite® Availability」は災害発生時のデータ損失を防ぐための仕組みであり、導入によりシステムの可用性が増します。
当ツールの強みは、バイトレベルのリアルタイムレプリケーションにより、RPOをゼロとすることが可能なことです。そのため、企業・組織はデータの破損やランサムウェアから容易に回復が可能になります。ダウンタイム削減にも効果があり、即時フェイルオーバー機能と監視機能によりダウンタイムをわずか数分に短縮が可能です。フェイルオーバーに関する詳しい説明は、「フェイルオーバーとは|技術的な仕組みや事例、フェイルバックとの違いについて徹底解説」をご参照ください。
「Carbonite® Migration」はシステム移行ツールで、最大の特徴は、システム移行時に移行元のシステムを止めることなくシステムの移行が可能なことです。
取り扱い情報やシステムの重要性に応じてRPOとRTOを設定しよう
RPO(目標復旧時点)とRTO(目標復旧時間)は、ともにシステムのバックアップにおいて重要な指標です。取り扱っている情報やシステムの重要性に応じてRPOとRTOを設定しましょう。金融情報や個人情報などの重要な情報を取り扱っている場合はRPOとRTOを厳しい基準で設定することが要求されます。RPOとRTOを最小化するため、バックアップツールの導入や障害発生時のリカバリ作業の手順化などを行い、非常時に備えましょう。