×

集群可观测性操作符仅为技术预览功能。技术预览功能不受 Red Hat 生产服务级别协议 (SLA) 的支持,并且功能可能不完整。Red Hat 不建议在生产环境中使用它们。这些功能可让客户提前访问即将推出的产品功能,从而能够在开发过程中测试功能并提供反馈。

有关 Red Hat 技术预览功能的支持范围的更多信息,请参阅 技术预览功能支持范围

集群可观测性操作符 (COO) 是 OpenShift Container Platform 的可选组件。您可以部署它来创建独立的可配置监控堆栈,供不同的服务和用户使用。

COO 部署以下监控组件

  • Prometheus

  • Thanos 查询器(可选)

  • Alertmanager(可选)

COO 组件独立于默认的集群内监控堆栈运行,后者由集群监控操作符 (CMO) 部署和管理。由这两个操作符部署的监控堆栈不会冲突。除了 CMO 部署的默认平台监控组件之外,您还可以使用 COO 监控堆栈。

了解集群可观测性操作符

集群可观测性操作符 (COO) 创建的默认监控堆栈包括一个高可用性 Prometheus 实例,该实例能够使用远程写入将指标发送到外部端点。

每个 COO 堆栈还包括一个可选的 Thanos 查询器组件,您可以使用它从中心位置查询高可用性 Prometheus 实例,以及一个可选的 Alertmanager 组件,您可以使用它为不同的服务设置警报配置。

使用集群可观测性操作符的优势

COO 使用的 MonitoringStack CRD 提供了 COO 部署的监控组件的意见性默认监控配置,但您可以根据更复杂的需要对其进行自定义。

部署 COO 管理的监控堆栈可以帮助满足使用集群监控操作符 (CMO) 部署的核心平台监控难以或无法解决的监控需求。使用 COO 部署的监控堆栈与核心平台和用户工作负载监控相比具有以下优势

可扩展性

用户可以向 COO 部署的监控堆栈添加更多指标,而无需丢失核心平台监控的支持。此外,COO 管理的堆栈可以使用联合从核心平台监控接收某些特定于集群的指标。

多租户支持

COO 可以为每个用户命名空间创建一个监控堆栈。您还可以为每个命名空间部署多个堆栈,或者为多个命名空间部署单个堆栈。例如,集群管理员、SRE 团队和开发团队都可以在单个集群上部署自己的监控堆栈,而不必使用单个共享的监控组件堆栈。然后,不同团队的用户可以独立配置其应用程序和服务的不同警报、警报路由和警报接收器等功能。

可扩展性

您可以根据需要创建 COO 管理的监控堆栈。多个监控堆栈可以在单个集群上运行,这可以通过手动分片来促进对非常大的集群的监控。此功能可以解决指标数量超过单个 Prometheus 实例的监控能力的情况。

灵活性

使用 Operator Lifecycle Manager (OLM) 部署 COO 可将 COO 版本与 OpenShift Container Platform 版本周期分离。这种部署方法可以实现更快的版本迭代,并能够快速响应不断变化的需求和问题。此外,通过部署 COO 管理的监控堆栈,用户可以独立于 OpenShift Container Platform 版本周期管理警报规则。

高度可定制

COO 可以使用服务器端应用 (SSA) 将自定义资源中单个可配置字段的所有权委托给用户,从而增强自定义功能。