×

集群监控操作符配置参考

OpenShift Container Platform 集群监控的部分内容是可配置的。可以通过设置各种配置映射中定义的参数来访问 API。

  • 要配置监控组件,请编辑openshift-monitoring命名空间中名为cluster-monitoring-configConfigMap对象。这些配置由ClusterMonitoringConfiguration定义。

  • 要配置监控用户定义项目的监控组件,请编辑openshift-user-workload-monitoring命名空间中名为user-workload-monitoring-configConfigMap对象。这些配置由UserWorkloadConfiguration定义。

配置文件始终在配置映射数据中的config.yaml键下定义。

  • 并非所有监控堆栈的配置参数都已公开。仅支持此参考中列出的参数和字段进行配置。有关支持的配置的更多信息,请参阅监控的维护和支持

  • 配置集群监控是可选的。

  • 如果配置不存在或为空,则使用默认值。

  • 如果配置是无效的 YAML 数据,则集群监控操作符将停止协调资源,并在操作符的状态条件中报告Degraded=True

AdditionalAlertmanagerConfig

描述

AdditionalAlertmanagerConfig资源定义了组件如何与其他 Alertmanager 实例通信的设置。

必需

  • apiVersion

属性 类型 描述

apiVersion

字符串

定义 Alertmanager 的 API 版本。可能的值为 v1v2。默认值为 v2

bearerToken

*v1.SecretKeySelector

定义包含用于向 Alertmanager 进行身份验证的 bearer 令牌的密钥引用。

pathPrefix

字符串

定义要添加到推送端点路径之前的路径前缀。

scheme

字符串

定义与 Alertmanager 实例通信时使用的 URL 方案。可能的值为 httphttps。默认值为 http

staticConfigs

[]string

<hosts>:<port> 格式静态配置的 Alertmanager 端点列表。

timeout

*string

定义发送警报时使用的超时值。

tlsConfig

TLSConfig

定义用于 Alertmanager 连接的 TLS 设置。

AlertmanagerMainConfig

描述

AlertmanagerMainConfig 资源定义了 openshift-monitoring 命名空间中 Alertmanager 组件的设置。

属性 类型 描述

enabled

*bool

一个布尔标志,用于启用或禁用 openshift-monitoring 命名空间中的主 Alertmanager 实例。默认值为 true

enableUserAlertmanagerConfig

bool

一个布尔标志,用于启用或禁用选择用户定义的命名空间来进行 AlertmanagerConfig 查询。此设置仅在未启用 Alertmanager 的用户工作负载监控实例时才适用。默认值为 false

logLevel

字符串

定义 Alertmanager 的日志级别设置。可能的值为:errorwarninfodebug。默认值为 info

nodeSelector

map[string]string

定义 Pod 调度的节点。

resources

*v1.ResourceRequirements

定义 Alertmanager 容器的资源请求和限制。

secrets

[]string

定义要挂载到 Alertmanager 的密钥列表。这些密钥必须位于与 Alertmanager 对象相同的命名空间中。它们被添加为名为 secret-<secret-name> 的卷,并挂载到 Alertmanager Pod 的 alertmanager 容器中的 /etc/alertmanager/secrets/<secret-name>

tolerations

[]v1.Toleration

定义 Pod 的容忍度。

topologySpreadConstraints

[]v1.TopologySpreadConstraint

定义 Pod 的拓扑扩展约束。

volumeClaimTemplate

*monv1.EmbeddedPersistentVolumeClaim

定义 Alertmanager 的持久化存储。使用此设置配置持久卷声明,包括存储类、卷大小和名称。

AlertmanagerUserWorkloadConfig

描述

AlertmanagerUserWorkloadConfig 资源定义了用于用户定义项目的 Alertmanager 实例的设置。

属性 类型 描述

enabled

bool

一个布尔标志,用于启用或禁用在 openshift-user-workload-monitoring 命名空间中为用户定义的警报提供专用 Alertmanager 实例。默认值为 false

enableAlertmanagerConfig

bool

一个布尔标志,用于启用或禁用选择用户定义的命名空间来进行 AlertmanagerConfig 查询。默认值为 false

logLevel

字符串

定义用于用户工作负载监控的 Alertmanager 的日志级别设置。可能的值为 errorwarninfodebug。默认值为 info

resources

*v1.ResourceRequirements

定义 Alertmanager 容器的资源请求和限制。

secrets

[]string

定义要挂载到 Alertmanager 的密钥列表。这些密钥必须位于与 Alertmanager 对象相同的命名空间中。它们被添加为名为 secret-<secret-name> 的卷,并挂载到 Alertmanager Pod 的 alertmanager 容器中的 /etc/alertmanager/secrets/<secret-name>

nodeSelector

map[string]string

定义 Pod 调度的节点。

tolerations

[]v1.Toleration

定义 Pod 的容忍度。

topologySpreadConstraints

[]v1.TopologySpreadConstraint

定义 Pod 的拓扑扩展约束。

volumeClaimTemplate

*monv1.EmbeddedPersistentVolumeClaim

定义 Alertmanager 的持久化存储。使用此设置配置持久卷声明,包括存储类、卷大小和名称。

ClusterMonitoringConfiguration

描述

ClusterMonitoringConfiguration 资源定义了通过 openshift-monitoring 命名空间中的 cluster-monitoring-config 配置映射自定义默认平台监控堆栈的设置。

属性 类型 描述

alertmanagerMain

*AlertmanagerMainConfig

AlertmanagerMainConfig 定义了 openshift-monitoring 命名空间中 Alertmanager 组件的设置。

enableUserWorkload

*bool

UserWorkloadEnabled 是一个布尔标志,用于启用对用户定义项目的监控。

kubeStateMetrics

*KubeStateMetricsConfig

KubeStateMetricsConfig 定义了 kube-state-metrics 代理的设置。

metricsServer

*MetricsServerConfig

MetricsServer 定义了 Metrics Server 组件的设置。

prometheusK8s

*PrometheusK8sConfig

PrometheusK8sConfig 定义了 Prometheus 组件的设置。

prometheusOperator

*PrometheusOperatorConfig

PrometheusOperatorConfig 定义了 Prometheus Operator 组件的设置。

prometheusOperatorAdmissionWebhook

*PrometheusOperatorAdmissionWebhookConfig

PrometheusOperatorAdmissionWebhookConfig 定义了 Prometheus Operator 的准入 Webhook 组件的设置。

openshiftStateMetrics

*OpenShiftStateMetricsConfig

OpenShiftMetricsConfig 定义了 openshift-state-metrics 代理的设置。

telemeterClient

*TelemeterClientConfig

TelemeterClientConfig 定义了 Telemeter Client 组件的设置。

thanosQuerier

*ThanosQuerierConfig

ThanosQuerierConfig 定义了 Thanos Querier 组件的设置。

nodeExporter

NodeExporterConfig

NodeExporterConfig 定义了 node-exporter 代理的设置。

monitoringPlugin

*MonitoringPluginConfig

MonitoringPluginConfig 定义了监控 console-plugin 组件的设置。

KubeStateMetricsConfig

描述

KubeStateMetricsConfig 资源定义了 kube-state-metrics 代理的设置。

属性 类型 描述

nodeSelector

map[string]string

定义 Pod 调度的节点。

resources

*v1.ResourceRequirements

定义 KubeStateMetrics 容器的资源请求和限制。

tolerations

[]v1.Toleration

定义 Pod 的容忍度。

topologySpreadConstraints

[]v1.TopologySpreadConstraint

定义 Pod 的拓扑扩展约束。

MetricsServerConfig

描述

MetricsServerConfig 资源定义了 Metrics Server 组件的设置。

属性 类型 描述

audit

*Audit

定义 Metrics Server 实例使用的审计配置。可能的配置文件值为 MetadataRequestRequestResponseNone。默认值为 Metadata

nodeSelector

map[string]string

定义 Pod 调度的节点。

tolerations

[]v1.Toleration

定义 Pod 的容忍度。

resources

*v1.ResourceRequirements

定义 Metrics Server 容器的资源请求和限制。

topologySpreadConstraints

[]v1.TopologySpreadConstraint

定义 Pod 的拓扑扩展约束。

MonitoringPluginConfig

描述

MonitoringPluginConfig 资源定义了 openshift-monitoring 命名空间中 Web 控制台插件组件的设置。

属性 类型 描述

nodeSelector

map[string]string

定义 Pod 调度的节点。

resources

*v1.ResourceRequirements

定义 console-plugin 容器的资源请求和限制。

tolerations

[]v1.Toleration

定义 Pod 的容忍度。

topologySpreadConstraints

[]v1.TopologySpreadConstraint

定义 Pod 的拓扑扩展约束。

NodeExporterCollectorBuddyInfoConfig

描述

NodeExporterCollectorBuddyInfoConfig 资源充当 node-exporter 代理的 buddyinfo 收集器的开关。默认情况下,buddyinfo 收集器是禁用的。

属性 类型 描述

enabled

bool

一个布尔标志,用于启用或禁用 buddyinfo 收集器。

NodeExporterCollectorConfig

描述

NodeExporterCollectorConfig 资源定义了 node-exporter 代理各个收集器的设置。

出现于:NodeExporterConfig

属性 类型 描述

cpufreq

NodeExporterCollectorCpufreqConfig

定义 cpufreq 收集器的配置,该收集器收集 CPU 频率统计信息。默认情况下禁用。

tcpstat

NodeExporterCollectorTcpStatConfig

定义 tcpstat 收集器的配置,该收集器收集 TCP 连接统计信息。默认情况下禁用。

netdev

NodeExporterCollectorNetDevConfig

定义 netdev 收集器的配置,该收集器收集网络设备统计信息。默认情况下启用。

netclass

NodeExporterCollectorNetClassConfig

定义 netclass 收集器的配置,该收集器收集有关网络设备的信息。默认情况下启用。

buddyinfo

NodeExporterCollectorBuddyInfoConfig

定义 buddyinfo 收集器的配置,该收集器从 node_buddyinfo_blocks 指标收集有关内存碎片的统计信息。此指标从 /proc/buddyinfo 收集数据。默认情况下禁用。

mountstats

NodeExporterCollectorMountStatsConfig

定义 mountstats 收集器的配置,该收集器收集有关 NFS 卷 I/O 活动的统计信息。默认情况下禁用。

ksmd

NodeExporterCollectorKSMDConfig

定义 ksmd 收集器的配置,该收集器从内核同页合并守护进程收集统计信息。默认情况下禁用。

processes

NodeExporterCollectorProcessesConfig

定义 processes 收集器的配置,该收集器收集系统中运行的进程和线程的统计信息。默认情况下禁用。

systemd

NodeExporterCollectorSystemdConfig

定义 systemd 收集器的配置,该收集器收集有关 systemd 守护程序及其管理的服务的统计信息。默认情况下禁用。

NodeExporterCollectorCpufreqConfig

描述

使用 NodeExporterCollectorCpufreqConfig 资源启用或禁用 node-exporter 代理的 cpufreq 收集器。默认情况下,cpufreq 收集器是禁用的。在某些情况下,启用 cpufreq 收集器会增加具有许多内核的机器上的 CPU 使用率。如果启用此收集器并且机器具有许多内核,请密切监控系统是否有过高的 CPU 使用率。

属性 类型 描述

enabled

bool

一个布尔标志,用于启用或禁用 cpufreq 收集器。

NodeExporterCollectorKSMDConfig

描述

使用 NodeExporterCollectorKSMDConfig 资源启用或禁用 node-exporter 代理的 ksmd 收集器。默认情况下,ksmd 收集器是禁用的。

属性 类型 描述

enabled

bool

一个布尔标志,用于启用或禁用 ksmd 收集器。

NodeExporterCollectorMountStatsConfig

描述

使用 NodeExporterCollectorMountStatsConfig 资源启用或禁用 node-exporter 代理的 mountstats 收集器。默认情况下,mountstats 收集器是禁用的。如果启用收集器,则以下指标可用:node_mountstats_nfs_read_bytes_totalnode_mountstats_nfs_write_bytes_totalnode_mountstats_nfs_operations_requests_total。请注意,这些指标可能具有较高的基数。如果启用此收集器,请密切监控 prometheus-k8s pod 的内存使用量是否增加。

属性 类型 描述

enabled

bool

一个布尔标志,用于启用或禁用 mountstats 收集器。

NodeExporterCollectorNetClassConfig

描述

使用 NodeExporterCollectorNetClassConfig 资源启用或禁用 node-exporter 代理的 netclass 收集器。默认情况下,netclass 收集器已启用。如果禁用此收集器,则以下指标将不可用:node_network_infonode_network_address_assign_typenode_network_carriernode_network_carrier_changes_totalnode_network_carrier_up_changes_totalnode_network_carrier_down_changes_totalnode_network_device_idnode_network_dormantnode_network_flagsnode_network_iface_idnode_network_iface_linknode_network_iface_link_modenode_network_mtu_bytesnode_network_name_assign_typenode_network_net_dev_groupnode_network_speed_bytesnode_network_transmit_queue_lengthnode_network_protocol_type

属性 类型 描述

enabled

bool

一个布尔标志,用于启用或禁用 netclass 收集器。

useNetlink

bool

一个布尔标志,用于激活 netclass 收集器的 netlink 实现。默认值为 true,它激活 netlink 模式。此实现提高了 netclass 收集器的性能。

NodeExporterCollectorNetDevConfig

描述

使用 NodeExporterCollectorNetDevConfig 资源启用或禁用 node-exporter 代理的 netdev 收集器。默认情况下,netdev 收集器已启用。如果禁用,则以下指标将不可用:node_network_receive_bytes_totalnode_network_receive_compressed_totalnode_network_receive_drop_totalnode_network_receive_errs_totalnode_network_receive_fifo_totalnode_network_receive_frame_totalnode_network_receive_multicast_totalnode_network_receive_nohandler_totalnode_network_receive_packets_totalnode_network_transmit_bytes_totalnode_network_transmit_carrier_totalnode_network_transmit_colls_totalnode_network_transmit_compressed_totalnode_network_transmit_drop_totalnode_network_transmit_errs_totalnode_network_transmit_fifo_totalnode_network_transmit_packets_total

属性 类型 描述

enabled

bool

一个布尔标志,用于启用或禁用 netdev 收集器。

NodeExporterCollectorProcessesConfig

描述

使用 NodeExporterCollectorProcessesConfig 资源启用或禁用 node-exporter 代理的 processes 收集器。如果启用收集器,则以下指标可用:node_processes_max_processesnode_processes_pidsnode_processes_statenode_processes_threadsnode_processes_threads_state。指标 node_processes_statenode_processes_threads_state 各最多可包含五个序列,具体取决于进程和线程的状态。进程或线程的可能状态为:D(UNINTERRUPTABLE_SLEEP)、R(RUNNING & RUNNABLE)、S(INTERRUPTABLE_SLEEP)、T(STOPPED)或 Z(ZOMBIE)。默认情况下,processes 收集器是禁用的。

属性 类型 描述

enabled

bool

一个布尔标志,用于启用或禁用 processes 收集器。

NodeExporterCollectorSystemdConfig

描述

使用NodeExporterCollectorSystemdConfig资源启用或禁用node-exporter代理的systemd收集器。默认情况下,systemd收集器处于禁用状态。启用后,将提供以下指标:node_systemd_system_runningnode_systemd_unitsnode_systemd_version。如果单元使用套接字,它还会生成以下指标:node_systemd_socket_accepted_connections_totalnode_systemd_socket_current_connectionsnode_systemd_socket_refused_connections_total。您可以使用units参数选择要由systemd收集器包含的systemd单元。选定的单元用于生成node_systemd_unit_state指标,该指标显示每个systemd单元的状态。但是,此指标的基数可能很高(每个节点每个单元至少五个序列)。如果使用很长的选定单元列表启用此收集器,请密切监控prometheus-k8s部署是否存在过度内存使用情况。请注意,只有当您将units参数的值配置为logrotate.timer时,才会显示node_systemd_timer_last_trigger_seconds指标。

属性 类型 描述

enabled

bool

一个布尔型标志,用于启用或禁用systemd收集器。

units

[]string

一个正则表达式 (regex) 模式列表,用于匹配要由systemd收集器包含的systemd单元。默认情况下,列表为空,因此收集器不公开systemd单元的任何指标。

NodeExporterCollectorTcpStatConfig

描述

NodeExporterCollectorTcpStatConfig资源充当node-exporter代理的tcpstat收集器的开关。默认情况下,tcpstat收集器处于禁用状态。

属性 类型 描述

enabled

bool

一个布尔型标志,用于启用或禁用tcpstat收集器。

NodeExporterConfig

描述

NodeExporterConfig资源定义了node-exporter代理的设置。

属性 类型 描述

collectors

NodeExporterCollectorConfig

定义哪些收集器已启用及其附加配置参数。

maxProcs

uint32

node-exporter进程将在其上运行的目标CPU数量。默认值为0,这意味着node-exporter在所有CPU上运行。如果在并发读取sysfs时发生内核死锁或性能下降,您可以将此值更改为1,这将node-exporter限制为在一个CPU上运行。对于CPU数量较多的节点,您可以将限制设置为较小的数字,这可以通过防止Go例程调度到所有CPU上运行来节省资源。但是,如果maxProcs值设置得太低并且有许多指标要收集,则I/O性能会下降。

ignoredNetworkDevices

*[]string

要从相关收集器配置(例如netdevnetclass)中排除的网络设备列表,定义为正则表达式。如果没有指定列表,集群监控操作员将使用预定义的要排除的设备列表,以最大限度地减少对内存使用量的影响。如果列表为空,则不排除任何设备。如果修改此设置,请密切监控prometheus-k8s部署是否存在过度内存使用情况。

resources

*v1.ResourceRequirements

定义NodeExporter容器的资源请求和限制。

OpenShiftStateMetricsConfig

描述

OpenShiftStateMetricsConfig资源定义了openshift-state-metrics代理的设置。

属性 类型 描述

nodeSelector

map[string]string

定义 Pod 调度的节点。

resources

*v1.ResourceRequirements

定义OpenShiftStateMetrics容器的资源请求和限制。

tolerations

[]v1.Toleration

定义 Pod 的容忍度。

topologySpreadConstraints

[]v1.TopologySpreadConstraint

定义Pod的拓扑分布约束。

PrometheusK8sConfig

描述

PrometheusK8sConfig资源定义了Prometheus组件的设置。

属性 类型 描述

additionalAlertmanagerConfigs

[]AdditionalAlertmanagerConfig

配置接收来自Prometheus组件的警报的其他Alertmanager实例。默认情况下,未配置其他Alertmanager实例。

enforcedBodySizeLimit

字符串

强制执行Prometheus抓取指标的正文大小限制。如果抓取目标的正文响应大于限制,则抓取将失败。有效值为:空值表示无限制,Prometheus大小格式的数值(例如64MB),或字符串automatic,表示限制将根据集群容量自动计算。默认值为empty,表示无限制。

externalLabels

map[string]string

定义在与外部系统(如联合、远程存储和Alertmanager)通信时要添加到任何时间序列或警报的标签。默认情况下,不添加任何标签。

logLevel

字符串

定义Prometheus的日志级别设置。可能的值为:errorwarninfodebug。默认值为info

nodeSelector

map[string]string

定义 Pod 调度的节点。

queryLogFile

字符串

指定记录PromQL查询的文件。此设置可以是文件名,在这种情况下,查询将保存到/var/log/prometheus处的emptyDir卷,也可以是将挂载emptyDir卷并保存查询的位置的完整路径。支持写入/dev/stderr/dev/stdout/dev/null,但不支持写入任何其他/dev/路径。也不支持相对路径。默认情况下,不记录PromQL查询。

remoteWrite

[]RemoteWriteSpec

定义远程写入配置,包括URL、身份验证和重新标记设置。

resources

*v1.ResourceRequirements

定义Prometheus容器的资源请求和限制。

retention

字符串

定义Prometheus保留数据的持续时间。此定义必须使用以下正则表达式模式指定:[0-9]+(ms|s|m|h|d|w|y)(ms = 毫秒,s = 秒,m = 分钟,h = 小时,d = 天,w = 周,y = 年)。默认值为15d

retentionSize

字符串

定义数据块加预写日志 (WAL) 使用的最大磁盘空间量。支持的值为BKBKiBMBMiBGBGiBTBTiBPBPiBEBEiB。默认情况下,未定义任何限制。

tolerations

[]v1.Toleration

定义 Pod 的容忍度。

topologySpreadConstraints

[]v1.TopologySpreadConstraint

定义Pod的拓扑分布约束。

collectionProfile

CollectionProfile

定义Prometheus用于从平台组件收集指标的指标收集配置文件。支持的值为fullminimal。在full配置文件(默认)中,Prometheus收集平台组件公开的所有指标。在minimal配置文件中,Prometheus仅收集默认平台警报、记录规则、遥测和控制台仪表板所需的指标。

volumeClaimTemplate

*monv1.EmbeddedPersistentVolumeClaim

定义Prometheus的持久性存储。使用此设置配置持久卷声明,包括存储类、卷大小和名称。

PrometheusOperatorConfig

描述

PrometheusOperatorConfig资源定义了Prometheus Operator组件的设置。

属性 类型 描述

logLevel

字符串

定义Prometheus Operator的日志级别设置。可能的值为errorwarninfodebug。默认值为info

nodeSelector

map[string]string

定义 Pod 调度的节点。

resources

*v1.ResourceRequirements

定义PrometheusOperator容器的资源请求和限制。

tolerations

[]v1.Toleration

定义 Pod 的容忍度。

topologySpreadConstraints

[]v1.TopologySpreadConstraint

定义Pod的拓扑分布约束。

PrometheusOperatorAdmissionWebhookConfig

描述

PrometheusOperatorAdmissionWebhookConfig资源定义了Prometheus Operator的准入Webhook工作负载的设置。

属性 类型 描述

resources

*v1.ResourceRequirements

定义prometheus-operator-admission-webhook容器的资源请求和限制。

topologySpreadConstraints

[]v1.TopologySpreadConstraint

定义 Pod 的拓扑扩展约束。

PrometheusRestrictedConfig

描述

PrometheusRestrictedConfig资源定义了监控用户定义项目的Prometheus组件的设置。

属性 类型 描述

additionalAlertmanagerConfigs

[]AdditionalAlertmanagerConfig

配置接收来自Prometheus组件的警报的其他Alertmanager实例。默认情况下,未配置其他Alertmanager实例。

enforcedLabelLimit

*uint64

指定每个抓取对样本接受的标签数量的限制。如果指标重新标记后标签数量超过此限制,则整个抓取将被视为失败。默认值为0,表示不设置限制。

enforcedLabelNameLengthLimit

*uint64

指定每个抓取对样本标签名称长度的限制。如果指标重新标记后标签名称长度超过此限制,则整个抓取将被视为失败。默认值为0,表示不设置限制。

enforcedLabelValueLengthLimit

*uint64

指定每个抓取对样本标签值长度的限制。如果指标重新标记后标签值长度超过此限制,则整个抓取将被视为失败。默认值为0,表示不设置限制。

enforcedSampleLimit

*uint64

指定将接受的已抓取样本的全局限制数量。如果此值大于enforcedTargetLimit,则此设置将覆盖任何用户定义的ServiceMonitorPodMonitor对象中设置的SampleLimit值。管理员可以使用此设置来控制样本的总数。默认值为0,表示不设置限制。

enforcedTargetLimit

*uint64

指定已抓取目标的全局限制数量。如果此值大于enforcedSampleLimit,则此设置将覆盖任何用户定义的ServiceMonitorPodMonitor对象中设置的TargetLimit值。管理员可以使用此设置来控制目标的总数。默认值为0

externalLabels

map[string]string

定义在与外部系统(如联合、远程存储和Alertmanager)通信时要添加到任何时间序列或警报的标签。默认情况下,不添加任何标签。

logLevel

字符串

定义Prometheus的日志级别设置。可能的值为errorwarninfodebug。默认设置为info

nodeSelector

map[string]string

定义 Pod 调度的节点。

queryLogFile

字符串

指定记录PromQL查询的文件。此设置可以是文件名,在这种情况下,查询将保存到/var/log/prometheus处的emptyDir卷,也可以是将挂载emptyDir卷并保存查询的位置的完整路径。支持写入/dev/stderr/dev/stdout/dev/null,但不支持写入任何其他/dev/路径。也不支持相对路径。默认情况下,不记录PromQL查询。

remoteWrite

[]RemoteWriteSpec

定义远程写入配置,包括URL、身份验证和重新标记设置。

resources

*v1.ResourceRequirements

定义Prometheus容器的资源请求和限制。

retention

字符串

定义Prometheus保留数据的持续时间。此定义必须使用以下正则表达式模式指定:[0-9]+(ms|s|m|h|d|w|y)(ms = 毫秒,s = 秒,m = 分钟,h = 小时,d = 天,w = 周,y = 年)。默认值为24h

retentionSize

字符串

定义数据块加预写日志 (WAL) 使用的磁盘空间最大量。支持的值为BKBKiBMBMiBGBGiBTBTiBPBPiBEBEiB。默认值为nil

tolerations

[]v1.Toleration

定义 Pod 的容忍度。

topologySpreadConstraints

[]v1.TopologySpreadConstraint

定义Pod的拓扑分布约束。

volumeClaimTemplate

*monv1.EmbeddedPersistentVolumeClaim

定义Prometheus的持久化存储。使用此设置配置卷的存储类和大小。

RemoteWriteSpec

描述

RemoteWriteSpec资源定义远程写入存储的设置。

必需

  • url

属性 类型 描述

授权

*monv1.SafeAuthorization

定义远程写入存储的授权设置。

基本身份验证

*monv1.BasicAuth

定义远程写入端点URL的基本身份验证设置。

bearerTokenFile

字符串

定义包含远程写入端点载体令牌的文件。但是,由于您不能在 Pod 中挂载密钥,因此实际上只能引用服务帐户的令牌。

headers

map[string]string

指定要与每个远程写入请求一起发送的自定义HTTP标头。Prometheus设置的标头不能被覆盖。

metadataConfig

*monv1.MetadataConfig

定义将系列元数据发送到远程写入存储的设置。

name

字符串

定义远程写入队列的名称。此名称用于指标和日志记录以区分队列。如果指定,此名称必须唯一。

oauth2

*monv1.OAuth2

定义远程写入端点的OAuth2身份验证设置。

proxyUrl

字符串

定义可选的代理URL。如果启用,则会被集群范围的代理取代。

queueConfig

*monv1.QueueConfig

允许调整远程写入队列参数的配置。

remoteTimeout

字符串

定义对远程写入端点请求的超时值。

sendExemplars

*bool

启用通过远程写入发送示例。启用后,此设置配置Prometheus在内存中最多存储100,000个示例。此设置仅适用于用户定义的监控,不适用于核心平台监控。

sigv4

*monv1.Sigv4

定义AWS签名版本4身份验证设置。

tlsConfig

*monv1.SafeTLSConfig

定义远程写入端点的TLS身份验证设置。

url

字符串

定义将发送样本的远程写入端点的URL。

writeRelabelConfigs

[]monv1.RelabelConfig

定义远程写入重新标记配置的列表。

TLSConfig

描述

TLSConfig资源配置TLS连接的设置。

必需

  • insecureSkipVerify

属性 类型 描述

ca

*v1.SecretKeySelector

定义包含用于远程主机的证书颁发机构 (CA) 的密钥引用。

cert

*v1.SecretKeySelector

定义包含用于远程主机的公共证书的密钥引用。

key

*v1.SecretKeySelector

定义包含用于远程主机的私钥的密钥引用。

serverName

字符串

用于验证返回证书上的主机名。

insecureSkipVerify

bool

设置为true时,禁用对远程主机的证书和名称的验证。

TelemeterClientConfig

描述

TelemeterClientConfig 定义了 Telemeter Client 组件的设置。

必需

  • nodeSelector

  • tolerations

属性 类型 描述

nodeSelector

map[string]string

定义 Pod 调度的节点。

resources

*v1.ResourceRequirements

定义TelemeterClient容器的资源请求和限制。

tolerations

[]v1.Toleration

定义 Pod 的容忍度。

topologySpreadConstraints

[]v1.TopologySpreadConstraint

定义Pod的拓扑分布约束。

ThanosQuerierConfig

描述

ThanosQuerierConfig资源定义Thanos Querier组件的设置。

属性 类型 描述

enableRequestLogging

bool

启用或禁用请求日志记录的布尔标志。默认值为false

logLevel

字符串

定义Thanos Querier的日志级别设置。可能的值为errorwarninfodebug。默认值为info

enableCORS

bool

启用设置CORS标头的布尔标志。这些标头允许从任何来源访问。默认值为false

nodeSelector

map[string]string

定义 Pod 调度的节点。

resources

*v1.ResourceRequirements

定义Thanos Querier容器的资源请求和限制。

tolerations

[]v1.Toleration

定义 Pod 的容忍度。

topologySpreadConstraints

[]v1.TopologySpreadConstraint

定义Pod的拓扑分布约束。

ThanosRulerConfig

描述

ThanosRulerConfig资源定义用于用户定义项目的Thanos Ruler实例的配置。

属性 类型 描述

additionalAlertmanagerConfigs

[]AdditionalAlertmanagerConfig

配置Thanos Ruler组件如何与其他Alertmanager实例通信。默认值为nil

logLevel

字符串

定义 Thanos Ruler 的日志级别设置。可能的值包括errorwarninfodebug。默认值为info

nodeSelector

map[string]string

定义 Pod 调度的节点。

resources

*v1.ResourceRequirements

定义 Alertmanager 容器的资源请求和限制。

retention

字符串

定义Prometheus保留数据的持续时间。此定义必须使用以下正则表达式模式指定:[0-9]+(ms|s|m|h|d|w|y)(ms = 毫秒,s = 秒,m = 分钟,h = 小时,d = 天,w = 周,y = 年)。默认值为15d

tolerations

[]v1.Toleration

定义 Pod 的容忍度。

topologySpreadConstraints

[]v1.TopologySpreadConstraint

定义Pod的拓扑分布约束。

volumeClaimTemplate

*monv1.EmbeddedPersistentVolumeClaim

定义 Thanos Ruler 的持久化存储。使用此设置来配置卷的存储类和大小。

UserWorkloadConfiguration

描述

UserWorkloadConfiguration 资源定义了openshift-user-workload-monitoring 命名空间中user-workload-monitoring-config 配置映射中用户定义项目的设置。只有在将openshift-monitoring 命名空间下cluster-monitoring-config 配置映射中的enableUserWorkload 设置为true 后,才能启用UserWorkloadConfiguration

属性 类型 描述

alertmanager

*AlertmanagerUserWorkloadConfig

定义用户工作负载监控中 Alertmanager 组件的设置。

prometheus

*PrometheusRestrictedConfig

定义用户工作负载监控中 Prometheus 组件的设置。

prometheusOperator

*PrometheusOperatorConfig

定义用户工作负载监控中 Prometheus Operator 组件的设置。

thanosRuler

*ThanosRulerConfig

定义用户工作负载监控中 Thanos Ruler 组件的设置。