レポートメールだけではなく、あわせて VDP 管理画面も確認する

vSphere Data Protection (以下、VDP) のバックアップに失敗した仮想マシンを確認する方法としては、以下の 2通りがあります。

  • レポートメールを確認する
  • VDP のバックアップ・ジョブ管理画面にて直接確認する (Web Client)

そもそもレポートメールを受信するように設定しておかないとバックアップが成功したのか失敗したのかすら気付かないので、レポートメールの受信設定済み が前提になります。

前者のレポートメールを確認することが一番シンプルで基本的な確認方法なんですが、直感的には分かりにくい感があります。

やっぱり、直接画面見た方が分かりやすいので、レポートメールの最初の部分をざっと確認し、ぁ。。なんか失敗してるなー と思ったら直接 VDP 管理画面へログインして確認したほうが良いかもしれません。

全てのバックアップジョブの状況が一目瞭然分かりやすいからです。

直接 VDP の管理画面確認するもう一つの理由は、私の経験上、VDP はトラブルが多い故に、壊れやすく、中で動いているスケジュール管理プロセスだったり、メンテナンスプロセスが勝手に落ちちゃったりします。

その影響で、VDP 管理画面へ接続ができなかったりもするので、VDP そのものが動作していることを確認する・接続性を確認する意味合いも込めて、メールに頼るよりは、直接 VDP 管理画面へ接続して確認した方が良いのではないかと思います。

バックアップに失敗した仮想マシンの特定 その1. レポートメールを確認する

以下は、VDP から送信されたレポートメールの内容です。 (バージョンによって、メールの件名と内容が少し異なりますが、大体こんな感じです)

以下の例では、中身を見れば分かるように、JOB 1 に含まれている (設定されている) moc1 という仮想マシンがバックアップに失敗しています。

メール件名(例) : VMware vSphere Data Protection Summary Report for protection02.example.com
001
002
003
004
005
006
007
008
009
010
011
012
013
014
015
016
017
018
019
020
021
022
023
024
025
026
027
028
029
030
031
032
033
034
035
036
037
038
039
040
041
042
043
044
045
046
047
048
049
050
051
052
053
054
055
056
057
058
059
060
061
062
063
064
065
066
067
068
069
070
071
072
073
074
075
076
077
078
079
080
081
082
083
084
085
086
087
088
089
090
091
092
093
094
095
096
097
098
099
100
101
VMware vSphere Data Protection
Summary Report for protection02.example.com

Items Needing Attention
--------------------------------------------------------------------------------
Backup Job: JOB 1: Last Backup Job:  Failed
Unprotected Virtual Machines:  1,384
moc1:  Last backup failed
protection02.example.com - (10.10.10.12)
--------------------------------------------------------------------------------
Report Date::  June 20, 2017 - 09:00
Last Report Date:  June 19, 2017 - 09:00
Appliance Status:  Normal
Major Version:  6.1.1.19
Minor Version:  7.2.80.94_6.1.1.19
VDP Services State:  Normal
VDP Proxies State:  Normal
Byte Capacity:  2,145.5 GiB
Bytes Free:  1,987.162 GiB
Used Capacity:  7.38%
Bytes Protected:  2,520.107 GiB
Bytes Deduped:  158.338 GiB
Integrity Check Status:  Normal
Integrity Check Date:  June 19, 2017 - 09:13
Successful Backup VMs (Last 72 hours):  20
Failed Backup VMs (Last 72 hours):  1
Successful Backup Verifications (Last 72 hours):  0
Failed Backups Verifications (Last 72 hours):  0
Successful Replication Backups (Last 72 hours):  0
Failed Replication Backups (Last 72 hours):  0

Backup Jobs Summary
--------------------------------------------------------------------------------
Backup Job: JOB 1
     Backup Sources:
                           moc1
                           moc2
                           moc3
                           moc4
     Backup Storage:  protection02.example.com Appliance
     Retention Policy:
                           daily for: 3 day(s)
                           weekly for: 1 week(s)
                           monthly for: 0 month(s)
                           yearly for: 0 year(s)
     Last Start Time:  June 19, 2017 - 22:00
     Next Run Time:  June 20, 2017 - 22:00
     Last Backup Job:  Failed

Backup Job: JOB 2
     Backup Sources:
                           my-vm-1
                           my-vm-2
                           my-vm-3
                           my-vm-4
     Backup Storage:  protection02.example.com Appliance
     Retention Policy:
                           daily for: 3 day(s)
                           weekly for: 1 week(s)
                           monthly for: 0 month(s)
                           yearly for: 0 year(s)
     Last Start Time:  June 19, 2017 - 23:00
     Next Run Time:  June 20, 2017 - 23:00
     Last Backup Job:  Successful

・・・
    
Virtual Machines Summary
--------------------------------------------------------------------------------

・・・

Virtual Machine: moc1
     Type:  Image
     State:  poweredOn
     Backup Jobs:
                           JOB 1
     Last Backup Job:  JOB 1
     Last Backup Job Status:  Failed
     Last Backup Job Date:  June 19, 2017 - 22:00
     Last Backup Job Duration:  09:00

Virtual Machine: moc2
     Type:  Image
     State:  poweredOn
     Size (all disks):  250 GiB
     Backup Jobs:
                           JOB 2
     Last Backup Job:  JOB 2
     Last Backup Job Status:  Success
     Last Backup Job Date:  June 19, 2017 - 23:06
     Last Backup Job Duration:  09:05
    
・・・

Unprotected Virtual Machines
--------------------------------------------------------------------------------
Unprotected Virtual Machine:  etc-vm-101
Unprotected Virtual Machine:  etc-vm-102

・・・

バックアップに失敗した仮想マシンの特定 その2. Web Client の VDP 管理画面へ接続し、直接確認する

レポートメールだけじゃ物足りないというか、直感的に分かり難い部分があって、やっぱり画面見た方が一番分かりやすいかなと思います。

なので、上記のレポートメール 6行目Backup Job: JOB 1: Last Backup Job: Failed 部分を見て、失敗していることが分かったら、Web Client で vCenter へログイン > VDP 管理画面へログイン します。

その後、バックアップ > バックアップに失敗したジョブ > 期限切れ: アイテムを表示 をクリックすると 古いソース一覧 が表示されるので、ここを確認するとバックアップに失敗した仮想マシンが分かります。

VDP バックアップに失敗した仮想マシン確認

確認が終わったら、後は、対象仮想マシンのプロビジョニングサイズは問題ないか、VDP によって作成されたスナップショットのゴミは残ってないか、バックアップのリストアポイントは問題ないか等、色々と失敗の原因を調べる必要があります。

そもそも、レポートメール自体が飛んでこない場合には、VDP 関連プロセスが落ちてるか、VDP そのものが壊れてる可能性が高いです。

また、仮想マシンのバックアップを取得するように、バックアップジョブを作成したにも関わらず、翌日のレポートメールに 成功 0、失敗 0 という風にレポートされる場合もあるので、このときにも要確認です。

以上、vSphere Data Protection バックアップに失敗した仮想マシンの特定 でした。