灾难恢复

关于灾难恢复方法
- 城域灾难恢复 (Metro-DR)
- 区域灾难恢复 (Regional-DR)
定义灾难恢复的应用程序
- 定义 RHACM 管理的虚拟机的最佳实践
- 定义 RHACM 发现的虚拟机的最佳实践
灾难恢复场景中虚拟机的行为
Red Hat 管理的集群的灾难恢复解决方案
- Red Hat OpenShift Data Foundation 的城域灾难恢复 (Metro-DR)
- Red Hat OpenShift Data Foundation 的区域灾难恢复 (Regional-DR)
其他资源

OpenShift Virtualization 支持使用灾难恢复 (DR) 解决方案来确保您的环境能够在站点中断后恢复。要使用这些方法，必须提前规划 OpenShift Virtualization 部署。

关于灾难恢复方法

有关灾难恢复 (DR) 概念、架构和规划注意事项的概述，请参阅 Red Hat 知识库中的Red Hat OpenShift Virtualization 灾难恢复指南。

OpenShift Virtualization 的两种主要 DR 方法是城域灾难恢复 (Metro-DR) 和区域灾难恢复 (Regional-DR)。

Metro-DR

Metro-DR 使用同步复制。它在主站点和辅助站点都写入存储，以便数据始终在站点之间同步。由于存储提供商负责确保同步成功，因此环境必须满足存储提供商的吞吐量和延迟要求。

Regional-DR

Regional-DR 使用异步复制。主站点中的数据定期与辅助站点同步。对于这种类型的复制，主站点和辅助站点之间的连接可以具有更高的延迟。

定义灾难恢复的应用程序

使用 Red Hat Advanced Cluster Management (RHACM) 管理或发现的虚拟机来定义灾难恢复的应用程序。

定义 RHACM 管理的虚拟机的最佳实践

包含虚拟机的 RHACM 管理的应用程序必须使用 GitOps 工作流并创建 RHACM 应用程序或ApplicationSet 来创建。

在定义 RHACM 管理的虚拟机时，您可以采取一些措施来改善您的体验并提高成功的几率。

使用 PVC 和填充程序为虚拟机定义存储

由于数据卷隐式创建持久卷声明 (PVC)，因此数据卷和具有数据卷模板的虚拟机并不完全符合 GitOps 模型。

在为虚拟机磁盘选择填充源时，使用导入方法

选择软件目录中的 RHEL 镜像以使用导入方法。Red Hat 建议使用特定版本的镜像，而不是浮动标签，以获得一致的结果。KubeVirt 社区在 Quay 存储库中维护其他操作系统的容器磁盘。

使用`pullMethod: node`

从注册表源创建数据卷时，使用 pod pullMethod: node 以利用 OpenShift Container Platform 拉取密钥，这是从 Red Hat 注册表拉取容器镜像所必需的。

定义 RHACM 发现的虚拟机时的最佳实践

您可以将集群中任何非 RHACM 管理的应用程序的虚拟机配置为 RHACM 发现的应用程序。这包括使用虚拟化迁移工具包 (MTV) 导入的虚拟机、使用 OpenShift Virtualization Web 控制台创建的虚拟机或通过任何其他方式（例如 CLI）创建的虚拟机。

在定义 RHACM 发现的虚拟机时，您可以采取一些措施来改善您的体验并提高成功的几率。

使用 MTV、OpenShift Virtualization Web 控制台或自定义虚拟机时保护虚拟机

由于目前尚不支持自动标记，因此在使用 MTV、OpenShift Virtualization Web 控制台或自定义虚拟机时，应用程序所有者必须手动标记虚拟机应用程序的组件。

创建虚拟机后，请将通用标签应用于与虚拟机关联的以下资源：VirtualMachine、DataVolume、PersistentVolumeClaim、Service、Route、Secret、ConfigMap、VirtualMachinePreference 和 VirtualMachineInstancetype。请勿标记虚拟机实例 (VMI) 或 Pod；OpenShift Virtualization 会自动创建和管理这些实例。

您必须将通用标签应用于命名空间中您要保护的所有内容，包括您添加到虚拟机但此处未列出的对象。

在虚拟机中包含 `VirtualMachine` 对象以外的其他对象

正在运行的虚拟机通常还包含数据卷、持久卷声明 (PVC)、服务、路由、密钥、ConfigMap 对象和 VirtualMachineSnapshot 对象。

将虚拟机作为更大逻辑应用程序的一部分

这包括其他基于 Pod 的工作负载和虚拟机。

灾难恢复场景中的虚拟机行为

在重新定位和故障转移灾难恢复流程中，虚拟机的行为通常类似于基于 Pod 的工作负载。

重新定位

当主环境仍然可访问时，使用重新定位将应用程序从主环境移动到辅助环境。在重新定位过程中，虚拟机将被优雅地终止，任何未复制的数据将同步到辅助环境，并且虚拟机将在辅助环境中启动。

由于虚拟机优雅地终止，因此不会发生数据丢失。因此，虚拟机操作系统将不会执行崩溃恢复。

故障转移

当主环境发生严重故障，使其无法使用重新定位将工作负载移动到辅助环境时，使用故障转移。执行故障转移时，存储将从主环境中隔离，到虚拟机磁盘的 I/O 将突然停止，并且虚拟机将在辅助环境中使用复制的数据重新启动。

您应该预料到由于故障转移而导致的数据丢失。丢失的程度取决于您是否使用 Metro-DR（使用同步复制）或 Regional-DR（使用异步复制）。由于 Regional-DR 使用基于快照的复制间隔，因此数据丢失的时间窗口与复制间隔长度成正比。当虚拟机重新启动时，操作系统可能会执行崩溃恢复。

Red Hat 管理的集群的灾难恢复解决方案

以下灾难恢复解决方案结合了 Red Hat Advanced Cluster Management (RHACM)、Red Hat Ceph Storage 和 OpenShift Data Foundation 组件。您可以使用它们将应用程序从主站点故障转移到辅助站点，并在恢复灾难站点后将应用程序重新定位回主站点。

Red Hat OpenShift Data Foundation 的 Metro-DR

OpenShift Virtualization 支持OpenShift Data Foundation 的 Metro-DR 解决方案，该解决方案在安装在主站点和辅助站点上的受管理 OpenShift Virtualization 集群之间提供双向同步数据复制。

Metro-DR 的区别

此同步解决方案仅适用于网络往返延迟为 10 毫秒或更少的城域距离数据中心。
支持多磁盘虚拟机。
为了防止数据损坏，您必须确保在故障转移期间存储被隔离。

隔离是指隔离节点，以便工作负载不会在其上运行。

有关将 OpenShift Data Foundation 的 Metro-DR 解决方案与 OpenShift Virtualization 一起使用的更多信息，请参阅 IBM 的 OpenShift Data Foundation Metro-DR 文档。

Red Hat OpenShift Data Foundation 的 Regional-DR

OpenShift Virtualization 支持OpenShift Data Foundation 的 Regional-DR 解决方案，该解决方案在安装在主站点和辅助站点上的受管理 OpenShift Virtualization 集群之间定期提供异步数据复制。

Regional-DR 的区别

Regional-DR 支持主站点和辅助站点之间更高的网络延迟。
Regional-DR 使用 RBD 快照异步复制数据。目前，您的应用程序必须能够承受虚拟机磁盘之间的小差异。您可以通过使用单磁盘虚拟机来防止这些差异。
建议在为虚拟机磁盘选择填充源时使用导入方法。但是，如果您选择启用映像展平的VolumeReplicationClass，则可以保护使用克隆 PVC 的虚拟机。有关更多信息，请参阅 OpenShift Data Foundation 文档。

有关将 OpenShift Data Foundation 的 Regional-DR 解决方案与 OpenShift Virtualization 一起使用的更多信息，请参阅 IBM 的 OpenShift Data Foundation Regional-DR 文档。