新しいハードウェアベースの重複除外・圧縮技術を搭載したDRディスクバックアップアプライアンス『Dell DR4100』を発表しています。この投稿では現行モデルのDR4000をベースにサイジングについてご紹介します。
DRディスクバックアップ・アプライアンス
DR4000は、重複除外と圧縮技術を搭載した、バックアップ用ディスクストレージです。Windowsであれば、Symantec Backup Exec、LinuxであればQuest NetVaultといったようにバックアップソフトウェアが各種存在する中で、既存のテープストレージを置換えてご利用いただけます。つまり、既存のバックアップシステムへの影響が最小限に、効率的なディスクストレージ・バックアップに変更することが可能です。
図:テープバックアップからディスクバックアップへの変更
DR4000では、ストレージの容量が、RAID後 2.7TBから18TBのモデルを提供しています。DR4000はPowerEdgeベースにNVRAMを搭載することでパフォーマンス向上させている他、専用OSではデータ取り込み直後の破損チェックや、既存データの定期的な整合性検証を実行している高い信頼性を保つデータ保護を行ってます。
バックアップ・サイジングに影響を与える可変要素
適切なサイジングを行うためには、主要なバックアップ環境要素を理解しておく必要があります。
- 最初のバックアップ時の必要とされる保護データの総量
- 保護されるデータセットの変動率 (変動には既存データの削除や更新が含まれます)
- データセットを構成するデータの種類 (DBやメール、仮想化、オフィス書類など削減率が異なります)
- 要求されるバックアップ保持期間(世代)
固有データが多い(重複が少ない)場合、または圧縮できないデータセットでのバックアップでは、重複除外率は低くなります。また、追加、削除、改変によるデータタイプの変動は、重複除外率に影響を与えます。
DR4000を利用したサイジング例
Exchangeサーバ、オフィス系の多いファイルサーバをバックアップする想定で、サイジング例を挙げます。
データセット1 | データセット2 | |
データタイプ | メール(Exchange) | オフィス系(Microsoft) |
データ容量 | 1TB | 5TB |
変更率 | 10% Weekly | 5% Weekly |
バックアップフロー | 週次フル 日次差分(月-金) |
週次フル |
バックアップ保持世代 | 週次フル 4世代 | 週次フル 4世代 |
統計データによる推定値を元にした、各データセットの削減率
データタイプ | 初回フル | 差分 | 2回目以降フル |
メール(Exchange) | 1.7 | 10.0 | 15.0 |
オフィス系(Microsoft) | 2.0 | 7.0 | 40.0 |
上記の推定値によるサイジング計算結果:
データセット1(Exchange)
※データ保護の総量は、7TB
データセット2(オフィス系):
DR4000ディスク使用量: 5TB / 2 + (5TBx0.05/7x5day + 5TB/40) x4 = 3.7TB
※データ保護の総量は、30TB
サイジングの結果から、下記の構成が考えられます。
DR4000のパフォーマンスとバックアップ時間
DR4000は、1GbEを4ポート備えALBによるロードバランスを行っています。環境やデータアクセスにもよりますが、ネットワーク書込み速度は約300-400MB/秒程度を提供します。
バックアップ時間は、バックアップサーバ、ネットワーク、アプリケーションの特性など、DR4000以外の要素もボトルネックになる事を踏まえて検討する必要がありますが、他の要素を考慮せず、以下が参考時間を考えた場合の参考計算になります。
バックアップ参考時間の計算: 400MB/s = 1.44TB/hrを想定した場合
データセット1(Exchange)
日次差分: 1TB x 0.1 / 1.44 = 約5分
週次フル: 1TB x 1.44 = 約42分
データセット2(オフィス系)
日次差分: 5TB x 0.05 / 1.44 = 約11分
週次フル: 5TB x 1.44 = 約3.5時間
レプリケーション時間の計算: 1Gbpsの回線で、理論値 100MB/s = 0.1GB/s を想定した場合
データセット1(Exchange)と2(オフィス系)の転送時間
日次転送量: (1)1TB x 0.1 /10 +(2) 5TB x 0.05 /7 = 0.045TB (45GB)
日次転送時間: 45GB / 0.1 / 60秒 = 約8分
週次転送: (1) 1TB / 15 +(2) 5TB/40 = 0.19TB (190GB)
週次転送時間: 190GB / 0.1 / 60秒 = 約32分
バックアップ時間とレプリケーション時間がさらに許容できるのであれば、さらにバックアップ用ストレージを統合することも可能です。
※同様に、ディスクバックアップのパフォーマンスを重視する場合は、バックアップ先のDR4000を増やすことでバックアップ時間の短縮が可能です。
まとめ
今回の参考値は、データの増加率を省略してご紹介しましたが、実環境においてはデータの変更率と合わせてデータの増加も計算に入れる必要があります。※簡易なサイジング方法について紹介しましたが、環境によって結果が大きく異なることもありますのでご注意ください。
バックアップのサイジングの詳細については、Questの営業までお問い合わせください。
3月に提供を開始する、DR4100では、PowerEdge 12Gをベースとしたパフォーマンスの向上と、拡張シェルフ(DAS/※2.7TBは対象外)を利用した容量の拡張が可能になります。バックアップ運用のシンプル化をご検討の場合には、DRシリーズをご検討してみてください。