×

集群通知是关于集群状态、健康状况或性能的消息。

集群通知是 Red Hat 站点可靠性工程 (SRE) 与您沟通集群健康状况的主要方式。SRE 还可以使用集群通知提示您执行操作,以解决或防止集群问题。

集群所有者和管理员必须定期检查和处理集群通知,以确保集群保持健康和受支持。

您可以在 Red Hat Hybrid Cloud Console 中,集群的“**集群历史记录**”选项卡中查看集群通知。默认情况下,只有集群所有者会收到集群通知邮件。如果其他用户需要接收集群通知邮件,请将每个用户添加到集群的通知联系人中。

集群通知预期

作为集群管理员,您需要了解何时以及为何发送集群通知,以及它们的类型和严重性级别,以便有效地了解集群的健康状况和管理需求。

集群通知策略

集群通知旨在使您随时了解集群的健康状况以及影响集群的重要事件。

大多数集群通知都是自动生成并发送的,以确保您能立即了解集群状态的问题或重要更改。

在某些情况下,Red Hat 站点可靠性工程 (SRE) 会创建和发送集群通知,以针对复杂问题提供更多上下文和指导。

对于低影响事件、低风险安全更新、例行操作和维护,或 SRE 快速解决的小型、短暂性问题,不会发送集群通知。

Red Hat 服务会在以下情况下自动发送通知:

  • 远程健康监控或环境验证检查检测到集群中的问题,例如,当工作节点磁盘空间不足时。

  • 发生重要的集群生命周期事件,例如,当计划的维护或升级开始时,或者集群操作受事件影响但不需要客户干预时。

  • 发生重要的集群管理更改,例如,当集群所有权或管理控制从一个用户转移到另一个用户时。

  • 您的集群订阅已更改或更新,例如,当 Red Hat 对您的集群提供的订阅条款或功能进行更新时。

SRE 会在以下情况下创建和发送通知:

  • 事件导致性能下降或中断,影响集群的可用性或性能,例如,您的云提供商发生区域性中断。SRE 会发送后续通知,告知您事件解决进度以及事件解决的时间。

  • 在您的集群上检测到安全漏洞、安全漏洞或异常活动。

  • Red Hat 检测到您所做的更改正在创建或可能导致集群不稳定。

  • Red Hat 检测到您的工作负载正在导致集群性能下降或不稳定。

集群通知严重性级别

每个集群通知都具有关联的严重性级别,可帮助您识别对您的业务影响最大的通知。您可以在 Red Hat Hybrid Cloud Console 中,集群的“**集群历史记录**”选项卡中,根据这些严重性级别筛选集群通知。

Red Hat 使用以下集群通知严重性级别,从最严重到最不严重:

严重

需要立即采取行动。服务或集群的一个或多个关键功能无法正常工作,或即将停止工作。严重警报非常重要,足以通知值班人员并中断常规工作流程。

主要

强烈建议立即采取行动。集群的一个或多个关键功能即将停止工作。如果未及时解决主要问题,可能会导致严重问题。

警告

需要尽快采取行动。集群的一个或多个关键功能工作效率不高,可能会进一步下降,但不构成对集群功能的直接威胁。

信息

无需采取任何行动。此严重性级别不描述需要解决的问题,仅描述关于有意义或重要的生命周期、服务或集群事件的重要信息。

调试

无需采取任何行动。调试通知提供关于不太重要的生命周期、服务或集群事件的低级别信息,以帮助调试意外行为。

集群通知类型

每个集群通知都具有关联的通知类型,可帮助您识别与您的角色和职责相关的通知。您可以在 Red Hat Hybrid Cloud Console 中,集群的“**集群历史记录**”选项卡中,根据这些类型筛选集群通知。

Red Hat 使用以下通知类型来指示通知的相关性:

容量管理

与更新、创建或删除节点池、机器池、计算副本或配额(负载均衡器、存储等)相关的事件的通知。

集群访问

与添加或删除组、角色或身份提供程序相关的事件的通知,例如,当 SRE 由于 STS 凭证过期而无法访问您的集群时,当您的 AWS 角色存在配置问题时,或者当您添加或删除身份提供程序时。

集群附加组件

与附加组件的附加组件管理或升级维护相关的事件的通知,例如,当安装、升级或删除附加组件时,或者由于不满足要求而无法安装附加组件时。

集群配置

集群调整事件、工作负载监控和进行中检查的通知。

集群生命周期

集群或集群资源创建、删除和注册的通知,或集群或资源状态的更改(例如,就绪或休眠)。

集群网络

与集群网络相关的通知,包括 HTTP/S 代理、路由器和入口状态。

集群所有权

与集群所有权从一个用户转移到另一个用户的通知。

集群扩展

与更新、创建或删除节点池、机器池、计算副本或配额相关的通知。

集群安全

与集群安全相关的事件,例如,失败的访问尝试次数增加、信任捆绑包的更新或具有安全影响的软件更新。

集群订阅

集群到期、试用集群通知或从免费切换到付费。

集群更新

与升级相关的任何内容,例如升级维护或启用。

客户支持

支持案例状态更新。

常规通知

默认通知类型。此类型仅用于没有更具体类别的通知。

使用 Red Hat Hybrid Cloud Console 查看集群通知

集群通知提供了有关集群健康状况的重要信息。您可以在 Red Hat Hybrid Cloud 控制台的**集群历史记录**选项卡中查看已发送到集群的通知。

先决条件
  • 您已登录到 Hybrid Cloud 控制台。

步骤
  1. 导航到 Hybrid Cloud 控制台的集群页面。

  2. 点击您的集群名称以转到集群详细信息页面。

  3. 点击**集群历史记录**选项卡。

    集群通知显示在集群历史记录标题下。

  4. 可选:筛选相关的集群通知

    使用筛选控件隐藏与您无关的集群通知,以便您可以专注于您的专业领域或解决关键问题。您可以根据通知描述中的文本、严重性级别、通知类型、接收通知的时间以及触发通知的系统或人员来筛选通知。

集群通知电子邮件

默认情况下,当集群通知发送到集群时,它也会作为电子邮件发送给集群所有者。您可以为通知电子邮件配置其他收件人,以确保所有相关用户都能了解集群的状态。

向您的集群添加通知联系人

当集群通知发送到集群时,通知联系人会收到电子邮件。默认情况下,只有集群所有者会收到集群通知电子邮件。您可以在集群支持设置中将其他集群用户配置为附加通知联系人。

先决条件
  • 您的集群已部署并注册到 Red Hat Hybrid Cloud 控制台。

  • 您已以集群所有者或具有集群编辑器角色的用户身份登录到 Hybrid Cloud 控制台。

  • 预期的通知收件人拥有与集群所有者相同的组织关联的 Red Hat 客户门户帐户。

步骤
  1. 导航到 Hybrid Cloud 控制台的集群页面。

  2. 点击您的集群名称以转到集群详细信息页面。

  3. 点击**支持**选项卡。

  4. 在**支持**选项卡上,找到**通知联系人**部分。

  5. 点击**添加通知联系人**。

  6. 在**Red Hat 用户名或电子邮件**字段中,输入新收件人的电子邮件地址或用户名。

  7. 点击**添加联系人**。

验证步骤
  • 将显示“已成功添加通知联系人”消息。

排查问题
**添加通知联系人**按钮被禁用

此按钮对无权添加通知联系人的用户被禁用。请使用具有集群所有者、集群编辑器或集群管理员角色的帐户登录并重试。

错误:找不到任何由<用户名><电子邮件地址>标识的帐户

当预期的通知收件人不属于与集群所有者相同的 Red Hat 帐户组织时,会发生此错误。请联系您的组织管理员,将预期的收件人添加到相关组织,然后重试。

从集群中删除通知联系人

当集群通知发送到集群时,通知联系人会收到电子邮件。

您可以删除集群支持设置中的通知联系人,以防止他们收到通知电子邮件。

先决条件
  • 您的集群已部署并注册到 Red Hat Hybrid Cloud 控制台。

  • 您已以集群所有者或具有集群编辑器角色的用户身份登录到 Hybrid Cloud 控制台。

步骤
  1. 导航到 Hybrid Cloud 控制台的集群页面。

  2. 点击您的集群名称以转到集群详细信息页面。

  3. 点击**支持**选项卡。

  4. 在**支持**选项卡上,找到**通知联系人**部分。

  5. 点击您要删除的收件人旁边的选项菜单()。

  6. 点击**删除**。

验证步骤
  • 将显示“已成功删除通知联系人”消息。

故障排除

如果您未收到集群通知电子邮件
  • 确保您的邮箱不会过滤掉来自@redhat.com地址发送的电子邮件。

  • 确保您的正确邮箱地址已列为集群的通知联系人。

  • 请集群所有者或管理员将您添加为通知联系人:集群通知电子邮件

如果您的集群未收到通知
  • 确保您的集群可以访问api.openshift.com上的资源。

  • 确保您的防火墙已根据已记录的先决条件进行配置:AWS 防火墙先决条件