集群通知是关于集群状态、健康状况或性能的消息。
集群通知是 Red Hat 站点可靠性工程 (SRE) 与您沟通托管集群健康状况的主要方式。SRE 也可能使用集群通知提示您执行操作,以解决或防止集群问题。
集群所有者和管理员必须定期查看和处理集群通知,以确保集群保持健康和受支持。
您可以在 Red Hat Hybrid Cloud Console 中的集群“历史记录”选项卡中查看集群通知。默认情况下,只有集群所有者会收到集群通知电子邮件。如果其他用户需要接收集群通知电子邮件,请将每个用户添加为集群的通知联系人。
作为集群管理员,您需要了解何时以及为何发送集群通知,以及它们的类型和严重性级别,以便有效地了解集群的健康状况和管理需求。
集群通知旨在让您了解集群的健康状况以及影响它的重大事件。
大多数集群通知都是自动生成并发送的,以确保您立即了解集群状态的问题或重要更改。
在某些情况下,Red Hat 站点可靠性工程 (SRE) 会创建和发送集群通知,以针对复杂问题提供其他上下文和指导。
对于低影响事件、低风险安全更新、例行操作和维护,或者 SRE 快速解决的小型、短暂问题,不会发送集群通知。
Red Hat 服务会在以下情况自动发送通知:
远程健康监控或环境验证检查检测到集群中的问题,例如,当工作节点磁盘空间不足时。
发生重要的集群生命周期事件,例如,当计划的维护或升级开始时,或者集群操作受到事件的影响,但不需客户干预。
发生重要的集群管理更改,例如,当集群所有权或管理控制从一个用户转移到另一个用户时。
您的集群订阅已更改或更新,例如,当 Red Hat 更新对您的集群可用的订阅条款或功能时。
SRE 在以下情况创建并发送通知:
事件导致性能下降或中断,影响集群的可用性或性能,例如,您的云提供商发生区域性中断。SRE 会发送后续通知,以告知您事件解决的进度,以及事件解决的时间。
在您的集群上检测到安全漏洞、安全漏洞或异常活动。
Red Hat 检测到您所做的更改正在创建或可能导致集群不稳定。
Red Hat 检测到您的工作负载正在导致集群性能下降或不稳定。
每个集群通知都关联着一个严重性级别,以帮助您识别对业务影响最大的通知。您可以在 Red Hat Hybrid Cloud Console 中的集群历史选项卡中,根据这些严重性级别过滤集群通知。
Red Hat 使用以下集群通知严重性级别,从最严重到最不严重:
需要立即采取行动。服务或集群的一个或多个关键功能无法工作,或即将停止工作。严重警报足够重要,可以通知值班人员并中断常规工作流程。
强烈建议立即采取行动。集群的一个或多个关键功能即将停止工作。如果未及时解决主要问题,可能会导致严重问题。
需要尽快采取行动。集群的一个或多个关键功能运行状况不佳,可能进一步恶化,但不构成对集群功能的直接危险。
无需采取任何行动。此严重性级别不描述需要解决的问题,仅描述有关有意义或重要生命周期、服务或集群事件的重要信息。
无需采取任何行动。调试通知提供有关不太重要的生命周期、服务或集群事件的低级别信息,以帮助调试意外行为。
每个集群通知都关联着一个通知类型,以帮助您识别与您的角色和职责相关的通知。您可以在 Red Hat Hybrid Cloud Console 中的集群历史选项卡中,根据这些类型过滤集群通知。
Red Hat 使用以下通知类型来指示通知的相关性:
与更新、创建或删除节点池、机器池、计算副本或配额(负载均衡器、存储等)相关的事件的通知。
与添加或删除组、角色或身份提供程序相关的事件的通知,例如,当 SRE 由于 STS 凭据过期而无法访问您的集群时,当您的 AWS 角色存在配置问题时,或当您添加或删除身份提供程序时。
与附加组件管理或附加组件升级维护相关的事件的通知,例如,当附加组件安装、升级或删除时,或者由于不满足要求而无法安装时。
集群调整事件、工作负载监控和进行中检查的通知。
集群或集群资源创建、删除和注册,或集群或资源状态更改(例如,就绪或休眠)的通知。
与集群网络相关的通知,包括 HTTP/S 代理、路由器和入口状态。
与集群所有权从一个用户转移到另一个用户的通知。
与更新、创建或删除节点池、机器池、计算副本或配额相关的通知。
与集群安全相关的事件,例如,失败的访问尝试次数增加、信任捆绑包更新或具有安全影响的软件更新。
集群到期、试用集群通知或从免费切换到付费。
与升级相关的任何内容,例如升级维护或启用。
关于支持案例状态的更新。
默认通知类型。仅用于没有更具体类别的通知。
集群通知提供有关集群运行状况的重要信息。您可以在 Red Hat Hybrid Cloud Console 的“集群历史”选项卡中查看已发送到集群的通知。
您已登录 Hybrid Cloud Console。
导航到 Hybrid Cloud Console 的集群页面。
单击您的集群名称以转到集群详细信息页面。
单击“集群历史”选项卡。
集群通知显示在“集群历史”标题下。
可选:过滤相关的集群通知
使用过滤器控件隐藏与您无关的集群通知,以便您可以专注于您的专业领域或解决关键问题。您可以根据通知说明中的文本、严重性级别、通知类型、接收通知的时间以及触发通知的系统或人员来过滤通知。
默认情况下,当集群通知发送到集群时,也会作为电子邮件发送给集群所有者。您可以为通知电子邮件配置其他收件人,以确保所有相关用户都能了解集群的状态。
当集群通知发送到集群时,通知联系人会收到电子邮件。默认情况下,只有集群所有者会收到集群通知电子邮件。您可以在集群支持设置中将其他集群用户配置为附加通知联系人。
您的集群已部署并注册到 Red Hat Hybrid Cloud Console。
您已以集群所有者或具有集群编辑器角色的用户身份登录 Hybrid Cloud Console。
预期的通知收件人拥有与集群所有者相同的组织关联的 Red Hat 客户门户帐户。
导航到 Hybrid Cloud Console 的“集群”页面。
单击您的集群名称以转到集群详细信息页面。
单击“支持”选项卡。
在“支持”选项卡上,找到“通知联系人”部分。
单击“添加通知联系人”。
在“Red Hat 用户名或电子邮件”字段中,输入新收件人的电子邮件地址或用户名。
单击“添加联系人”。
将显示“通知联系人添加成功”消息。
此按钮对无权添加通知联系人的用户禁用。请使用集群所有者、集群编辑器或集群管理员角色登录帐户,然后重试。
找不到由<用户名>
或<电子邮件地址>
标识的任何帐户如果预期的通知接收者不属于与集群所有者相同的 Red Hat 账户组织,则会发生此错误。请联系您的组织管理员,将预期的接收者添加到相关组织,然后重试。
当向集群发送集群通知时,通知联系人会收到电子邮件。
您可以在集群支持设置中删除集群中的通知联系人,以防止他们收到通知电子邮件。
您的集群已部署并注册到 Red Hat Hybrid Cloud Console。
您已以集群所有者或具有集群编辑器角色的用户身份登录 Hybrid Cloud Console。
导航到 Hybrid Cloud Console 的“集群”页面。
单击您的集群名称以转到集群详细信息页面。
单击“支持”选项卡。
在“支持”选项卡上,找到“通知联系人”部分。
单击要删除的接收者旁边的选项菜单 (⚙)。
单击删除。
将显示“通知联系人已成功删除”消息。
确保未将来自 @redhat.com
地址发送的电子邮件过滤到您的收件箱。
确保您的正确电子邮件地址已列为集群的通知联系人。
请集群所有者或管理员将您添加为通知联系人:集群通知电子邮件。
确保您的集群可以访问 api.openshift.com
上的资源。
确保您的防火墙已根据文档中记录的先决条件进行配置:AWS 防火墙先决条件