×

集群监控操作符配置参考

Red Hat OpenShift Service on AWS 集群监控的某些部分是可配置的。可以通过设置各种 ConfigMap 中定义的参数来访问 API。

  • 要配置监控组件,请编辑名为 cluster-monitoring-configConfigMap 对象(位于 openshift-monitoring 命名空间中)。这些配置由 ClusterMonitoringConfiguration 定义。

  • 要配置监控用户定义项目的监控组件,请编辑名为 user-workload-monitoring-configConfigMap 对象(位于 openshift-user-workload-monitoring 命名空间中)。这些配置由 UserWorkloadConfiguration 定义。

配置文件始终在 config map 数据的 config.yaml 密钥下定义。

  • 并非所有监控堆栈的配置参数都已公开。此参考中仅列出了支持配置的参数和字段。有关支持配置的更多信息,请参见 监控的维护和支持

  • 配置集群监控是可选的。

  • 如果配置不存在或为空,则使用默认值。

  • 如果配置是无效的 YAML 数据,则集群监控操作符将停止协调资源,并在操作符的状态条件中报告 Degraded=True

AdditionalAlertmanagerConfig

描述

AdditionalAlertmanagerConfig 资源定义了组件如何与其他 Alertmanager 实例通信的设置。

必需

  • apiVersion

属性 类型 描述

apiVersion

字符串

定义 Alertmanager 的 API 版本。可能的值为 v1v2。默认为 v2

bearerToken

*v1.SecretKeySelector

定义包含用于向 Alertmanager 进行身份验证的 bearer 令牌的密钥引用。

pathPrefix

字符串

定义要添加到推送端点路径前面的路径前缀。

scheme

字符串

定义与 Alertmanager 实例通信时使用的 URL 方案。可能的值为 httphttps。默认值为 http

staticConfigs

[]string

<hosts>:<port> 形式表示的静态配置的 Alertmanager 端点列表。

timeout

*字符串

定义发送警报时使用的超时值。

tlsConfig

TLSConfig

定义用于 Alertmanager 连接的 TLS 设置。

AlertmanagerMainConfig

描述

AlertmanagerMainConfig 资源定义了 openshift-monitoring 命名空间中 Alertmanager 组件的设置。

属性 类型 描述

enabled

*布尔值

一个布尔标志,用于启用或禁用 openshift-monitoring 命名空间中的主 Alertmanager 实例。默认值为 true

enableUserAlertmanagerConfig

布尔值

一个布尔标志,用于启用或禁用选择用户定义的命名空间以进行 AlertmanagerConfig 查找。此设置仅在 Alertmanager 的用户工作负载监控实例未启用时适用。默认值为 false

logLevel

字符串

定义 Alertmanager 的日志级别设置。可能的值为:errorwarninfodebug。默认值为 info

nodeSelector

map[string]string

定义在哪个节点上调度 Pod。

resources

*v1.ResourceRequirements

定义 Alertmanager 容器的资源请求和限制。

secrets

[]string

定义要安装到 Alertmanager 中的秘密列表。这些秘密必须位于与 Alertmanager 对象相同的命名空间中。它们作为名为 secret-<secret-name> 的卷添加,并安装在 Alertmanager pod 的 alertmanager 容器中的 /etc/alertmanager/secrets/<secret-name> 位置。

tolerations

[]v1.Toleration

定义 pod 的容忍度。

topologySpreadConstraints

[]v1.TopologySpreadConstraint

定义 pod 的拓扑扩散约束。

volumeClaimTemplate

*monv1.EmbeddedPersistentVolumeClaim

定义 Alertmanager 的持久性存储。使用此设置配置持久卷声明,包括存储类、卷大小和名称。

AlertmanagerUserWorkloadConfig

描述

AlertmanagerUserWorkloadConfig 资源定义了用于用户定义项目的 Alertmanager 实例的设置。

属性 类型 描述

enabled

布尔值

一个布尔标志,用于启用或禁用在 openshift-user-workload-monitoring 命名空间中为用户定义的警报专用 Alertmanager 实例。默认值为 false

enableAlertmanagerConfig

布尔值

一个布尔标志,用于启用或禁用选择用户定义的命名空间以进行 AlertmanagerConfig 查找。默认值为 false

logLevel

字符串

定义用户工作负载监控的 Alertmanager 的日志级别设置。可能的值为 errorwarninfodebug。默认值为 info

resources

*v1.ResourceRequirements

定义 Alertmanager 容器的资源请求和限制。

secrets

[]string

定义要挂载到 Alertmanager 的机密列表。这些机密必须位于与 Alertmanager 对象相同的命名空间中。它们作为名为 secret-<secret-name> 的卷添加,并挂载到 Alertmanager Pod 的 alertmanager 容器中的 /etc/alertmanager/secrets/<secret-name>

nodeSelector

map[string]string

定义在哪些节点上调度 Pod。

tolerations

[]v1.Toleration

定义 pod 的容忍度。

topologySpreadConstraints

[]v1.TopologySpreadConstraint

定义 pod 的拓扑扩散约束。

volumeClaimTemplate

*monv1.EmbeddedPersistentVolumeClaim

定义 Alertmanager 的持久化存储。使用此设置配置持久卷声明,包括存储类、卷大小和名称。

ClusterMonitoringConfiguration

描述

ClusterMonitoringConfiguration 资源定义通过 openshift-monitoring 命名空间中的 cluster-monitoring-config 配置映射自定义默认平台监控堆栈的设置。

属性 类型 描述

alertmanagerMain

*AlertmanagerMainConfig

AlertmanagerMainConfig 定义 openshift-monitoring 命名空间中 Alertmanager 组件的设置。

enableUserWorkload

*布尔值

UserWorkloadEnabled 是一个布尔标志,用于启用对用户定义项目的监控。

kubeStateMetrics

*KubeStateMetricsConfig

KubeStateMetricsConfig 定义 kube-state-metrics 代理的设置。

metricsServer

*MetricsServerConfig

MetricsServer 定义 Metrics Server 组件的设置。

prometheusK8s

*PrometheusK8sConfig

PrometheusK8sConfig 定义 Prometheus 组件的设置。

prometheusOperator

*PrometheusOperatorConfig

PrometheusOperatorConfig 定义 Prometheus Operator 组件的设置。

prometheusOperatorAdmissionWebhook

*PrometheusOperatorAdmissionWebhookConfig

PrometheusOperatorAdmissionWebhookConfig 定义 Prometheus Operator 的准入 Webhook 组件的设置。

openshiftStateMetrics

*OpenShiftStateMetricsConfig

OpenShiftMetricsConfig 定义 openshift-state-metrics 代理的设置。

telemeterClient

*TelemeterClientConfig

TelemeterClientConfig 定义 Telemeter Client 组件的设置。

thanosQuerier

*ThanosQuerierConfig

ThanosQuerierConfig 定义 Thanos Querier 组件的设置。

nodeExporter

NodeExporterConfig

NodeExporterConfig 定义 node-exporter 代理的设置。

monitoringPlugin

*MonitoringPluginConfig

MonitoringPluginConfig 定义监控 console-plugin 组件的设置。

KubeStateMetricsConfig

描述

KubeStateMetricsConfig 资源定义 kube-state-metrics 代理的设置。

属性 类型 描述

nodeSelector

map[string]string

定义在哪些节点上调度 Pod。

resources

*v1.ResourceRequirements

定义 KubeStateMetrics 容器的资源请求和限制。

tolerations

[]v1.Toleration

定义 pod 的容忍度。

topologySpreadConstraints

[]v1.TopologySpreadConstraint

定义 pod 的拓扑扩散约束。

MetricsServerConfig

描述

MetricsServerConfig 资源定义 Metrics Server 组件的设置。

属性 类型 描述

audit

*审计

定义 Metrics Server 实例使用的审计配置。可能的配置文件值为 MetadataRequestRequestResponseNone。默认值为 Metadata

nodeSelector

map[string]string

定义在哪些节点上调度 Pod。

tolerations

[]v1.Toleration

定义 pod 的容忍度。

resources

*v1.ResourceRequirements

定义 Metrics Server 容器的资源请求和限制。

topologySpreadConstraints

[]v1.TopologySpreadConstraint

定义 pod 的拓扑扩散约束。

MonitoringPluginConfig

描述

MonitoringPluginConfig 资源定义 openshift-monitoring 命名空间中 Web 控制台插件组件的设置。

属性 类型 描述

nodeSelector

map[string]string

定义在哪些节点上调度 Pod。

resources

*v1.ResourceRequirements

定义 console-plugin 容器的资源请求和限制。

tolerations

[]v1.Toleration

定义 pod 的容忍度。

topologySpreadConstraints

[]v1.TopologySpreadConstraint

定义 pod 的拓扑扩散约束。

NodeExporterCollectorBuddyInfoConfig

描述

NodeExporterCollectorBuddyInfoConfig 资源充当 node-exporter 代理的 buddyinfo 收集器的开关。默认情况下,buddyinfo 收集器处于禁用状态。

属性 类型 描述

enabled

布尔值

一个布尔标志,用于启用或禁用 buddyinfo 收集器。

NodeExporterCollectorConfig

描述

NodeExporterCollectorConfig 资源定义 node-exporter 代理的各个收集器的设置。

出现于:NodeExporterConfig

属性 类型 描述

cpufreq

NodeExporterCollectorCpufreqConfig

定义 cpufreq 收集器的配置,该收集器收集 CPU 频率统计信息。默认情况下禁用。

tcpstat

NodeExporterCollectorTcpStatConfig

定义 tcpstat 收集器的配置,该收集器收集 TCP 连接统计信息。默认情况下禁用。

netdev

NodeExporterCollectorNetDevConfig

定义 netdev 收集器的配置,该收集器收集网络设备统计信息。默认情况下启用。

netclass

NodeExporterCollectorNetClassConfig

定义 netclass 收集器的配置,该收集器收集有关网络设备的信息。默认情况下启用。

buddyinfo

NodeExporterCollectorBuddyInfoConfig

定义 buddyinfo 收集器的配置,该收集器从 node_buddyinfo_blocks 指标收集有关内存碎片的统计信息。此指标从 /proc/buddyinfo 收集数据。默认情况下禁用。

mountstats

NodeExporterCollectorMountStatsConfig

定义 mountstats 收集器的配置,该收集器收集有关 NFS 卷 I/O 活动的统计信息。默认情况下禁用。

ksmd

NodeExporterCollectorKSMDConfig

定义 ksmd 收集器的配置,该收集器从内核同页合并守护进程收集统计信息。默认情况下禁用。

processes

NodeExporterCollectorProcessesConfig

定义 processes 收集器的配置,该收集器从系统中运行的进程和线程收集统计信息。默认情况下禁用。

systemd

NodeExporterCollectorSystemdConfig

定义 systemd 收集器的配置,该收集器收集有关 systemd 守护进程及其管理的服务的统计信息。默认情况下禁用。

NodeExporterCollectorCpufreqConfig

描述

使用 NodeExporterCollectorCpufreqConfig 资源启用或禁用 node-exporter 代理的 cpufreq 收集器。默认情况下,cpufreq 收集器处于禁用状态。在某些情况下,启用 cpufreq 收集器会增加具有许多内核的机器上的 CPU 使用率。如果启用此收集器并且机器具有许多内核,请密切监控系统以查看 CPU 使用率是否过高。

属性 类型 描述

enabled

布尔值

一个布尔标志,用于启用或禁用 cpufreq 收集器。

NodeExporterCollectorKSMDConfig

描述

使用 NodeExporterCollectorKSMDConfig 资源启用或禁用 node-exporter 代理的 ksmd 收集器。默认情况下,ksmd 收集器处于禁用状态。

属性 类型 描述

enabled

布尔值

一个布尔标志,用于启用或禁用 ksmd 收集器。

NodeExporterCollectorMountStatsConfig

描述

使用 NodeExporterCollectorMountStatsConfig 资源启用或禁用 node-exporter 代理的 mountstats 收集器。默认情况下,mountstats 收集器处于禁用状态。如果启用收集器,则以下指标可用:node_mountstats_nfs_read_bytes_totalnode_mountstats_nfs_write_bytes_totalnode_mountstats_nfs_operations_requests_total。请注意,这些指标可能具有高基数。如果启用此收集器,请密切监控 prometheus-k8s Pod 的内存使用情况的任何增加。

属性 类型 描述

enabled

布尔值

一个布尔标志,用于启用或禁用 mountstats 收集器。

NodeExporterCollectorNetClassConfig

描述

使用 NodeExporterCollectorNetClassConfig 资源启用或禁用 node-exporter 代理的 netclass 收集器。默认情况下,netclass 收集器已启用。如果禁用此收集器,则以下指标将不可用:node_network_infonode_network_address_assign_typenode_network_carriernode_network_carrier_changes_totalnode_network_carrier_up_changes_totalnode_network_carrier_down_changes_totalnode_network_device_idnode_network_dormantnode_network_flagsnode_network_iface_idnode_network_iface_linknode_network_iface_link_modenode_network_mtu_bytesnode_network_name_assign_typenode_network_net_dev_groupnode_network_speed_bytesnode_network_transmit_queue_lengthnode_network_protocol_type

属性 类型 描述

enabled

布尔值

一个布尔标志,用于启用或禁用 netclass 收集器。

useNetlink

布尔值

一个布尔型标志,用于激活netclass收集器的netlink实现。默认值为true,激活netlink模式。此实现提高了netclass收集器的性能。

NodeExporterCollectorNetDevConfig

描述

使用NodeExporterCollectorNetDevConfig资源启用或禁用node-exporter代理的netdev收集器。默认情况下,netdev收集器已启用。如果禁用,则以下指标将不可用:node_network_receive_bytes_totalnode_network_receive_compressed_totalnode_network_receive_drop_totalnode_network_receive_errs_totalnode_network_receive_fifo_totalnode_network_receive_frame_totalnode_network_receive_multicast_totalnode_network_receive_nohandler_totalnode_network_receive_packets_totalnode_network_transmit_bytes_totalnode_network_transmit_carrier_totalnode_network_transmit_colls_totalnode_network_transmit_compressed_totalnode_network_transmit_drop_totalnode_network_transmit_errs_totalnode_network_transmit_fifo_totalnode_network_transmit_packets_total

属性 类型 描述

enabled

布尔值

一个布尔型标志,用于启用或禁用netdev收集器。

NodeExporterCollectorProcessesConfig

描述

使用NodeExporterCollectorProcessesConfig资源启用或禁用node-exporter代理的processes收集器。如果启用收集器,则以下指标将可用:node_processes_max_processesnode_processes_pidsnode_processes_statenode_processes_threadsnode_processes_threads_state。指标node_processes_statenode_processes_threads_state每个最多可以有五个序列,具体取决于进程和线程的状态。进程或线程的可能状态为:D(UNINTERRUPTABLE_SLEEP)、R(RUNNING & RUNNABLE)、S(INTERRUPTABLE_SLEEP)、T(STOPPED)或Z(ZOMBIE)。默认情况下,processes收集器已禁用。

属性 类型 描述

enabled

布尔值

一个布尔型标志,用于启用或禁用processes收集器。

NodeExporterCollectorSystemdConfig

描述

使用NodeExporterCollectorSystemdConfig资源启用或禁用node-exporter代理的systemd收集器。默认情况下,systemd收集器已禁用。如果启用,则以下指标将可用:node_systemd_system_runningnode_systemd_unitsnode_systemd_version。如果单元使用套接字,它还会生成以下指标:node_systemd_socket_accepted_connections_totalnode_systemd_socket_current_connectionsnode_systemd_socket_refused_connections_total。您可以使用units参数选择要由systemd收集器包含的systemd单元。选定的单元用于生成node_systemd_unit_state指标,该指标显示每个systemd单元的状态。但是,此指标的基数可能很高(每个节点每个单元至少五个序列)。如果您使用很长的选定单元列表启用此收集器,请密切监控prometheus-k8s部署,以防内存使用过高。请注意,只有在将units参数的值配置为logrotate.timer时,才会显示node_systemd_timer_last_trigger_seconds指标。

属性 类型 描述

enabled

布尔值

一个布尔型标志,用于启用或禁用systemd收集器。

units

[]string

匹配要由systemd收集器包含的systemd单元的正则表达式 (regex) 模式列表。默认情况下,列表为空,因此收集器不公开systemd单元的任何指标。

NodeExporterCollectorTcpStatConfig

描述

NodeExporterCollectorTcpStatConfig资源充当node-exporter代理的tcpstat收集器的开关。默认情况下,tcpstat收集器已禁用。

属性 类型 描述

enabled

布尔值

一个布尔型标志,用于启用或禁用tcpstat收集器。

NodeExporterConfig

描述

NodeExporterConfig资源定义了node-exporter代理的设置。

属性 类型 描述

collectors

NodeExporterCollectorConfig

定义启用哪些收集器及其附加配置参数。

maxProcs

uint32

node-exporter进程将运行的目标CPU数量。默认值为0,这意味着node-exporter在所有CPU上运行。如果在并发读取sysfs时发生内核死锁或性能下降,您可以将此值更改为1,这将限制node-exporter在一个CPU上运行。对于CPU数量较多的节点,您可以将限制设置为较小的数字,这可以通过防止Go例程调度到所有CPU上运行来节省资源。但是,如果maxProcs值设置得太低并且要收集许多指标,则I/O性能会下降。

ignoredNetworkDevices

*[]string

要从相关收集器配置(如netdevnetclass)中排除的网络设备列表,定义为正则表达式。如果没有指定列表,则集群监控操作员使用预定义的要排除的设备列表,以最大限度地减少对内存使用量的影响。如果列表为空,则不排除任何设备。如果修改此设置,请密切监控prometheus-k8s部署,以防内存使用过高。

resources

*v1.ResourceRequirements

定义NodeExporter容器的资源请求和限制。

OpenShiftStateMetricsConfig

描述

OpenShiftStateMetricsConfig资源定义了openshift-state-metrics代理的设置。

属性 类型 描述

nodeSelector

map[string]string

定义在哪些节点上调度 Pod。

resources

*v1.ResourceRequirements

定义OpenShiftStateMetrics容器的资源请求和限制。

tolerations

[]v1.Toleration

定义 pod 的容忍度。

topologySpreadConstraints

[]v1.TopologySpreadConstraint

定义Pod的拓扑传播约束。

PrometheusK8sConfig

描述

PrometheusK8sConfig资源定义了Prometheus组件的设置。

属性 类型 描述

additionalAlertmanagerConfigs

[]AdditionalAlertmanagerConfig

配置从Prometheus组件接收警报的其他Alertmanager实例。默认情况下,未配置任何其他Alertmanager实例。

enforcedBodySizeLimit

字符串

强制执行Prometheus抓取指标的主体大小限制。如果抓取目标的主体响应大于限制,则抓取将失败。有效值为:空值表示无限制,Prometheus大小格式的数值(例如64MB),或字符串automatic,表示限制将根据集群容量自动计算。默认值为empty,表示无限制。

externalLabels

map[string]string

定义在与外部系统(如联合、远程存储和Alertmanager)通信时要添加到任何时间序列或警报的标签。默认情况下,不添加任何标签。

logLevel

字符串

定义Prometheus的日志级别设置。可能的值为:errorwarninfodebug。默认值为info

nodeSelector

map[string]string

定义在哪些节点上调度 Pod。

queryLogFile

字符串

指定 PromQL 查询的日志文件。此设置可以是文件名,在这种情况下,查询将保存到/var/log/prometheus处的emptyDir卷中,也可以是将挂载emptyDir卷并保存查询的完整路径。支持写入/dev/stderr/dev/stdout/dev/null,但不支持写入任何其他/dev/路径。也不支持相对路径。默认情况下,不会记录 PromQL 查询。

remoteWrite

[]RemoteWriteSpec

定义远程写入配置,包括 URL、身份验证和重新标记设置。

resources

*v1.ResourceRequirements

定义Prometheus容器的资源请求和限制。

retention

字符串

定义 Prometheus 保留数据的持续时间。此定义必须使用以下正则表达式模式指定:[0-9]+(ms|s|m|h|d|w|y)(ms = 毫秒,s = 秒,m = 分钟,h = 小时,d = 天,w = 周,y = 年)。默认值为15d

retentionSize

字符串

定义数据块加上预写日志 (WAL) 使用的磁盘空间最大量。支持的值为BKBKiBMBMiBGBGiBTBTiBPBPiBEBEiB。默认情况下,未定义限制。

tolerations

[]v1.Toleration

定义 pod 的容忍度。

topologySpreadConstraints

[]v1.TopologySpreadConstraint

定义Pod的拓扑传播约束。

collectionProfile

CollectionProfile

定义 Prometheus 用于从平台组件收集指标的指标收集配置文件。支持的值为fullminimal。在full配置文件(默认)中,Prometheus 收集平台组件公开的所有指标。在minimal配置文件中,Prometheus 只收集默认平台警报、记录规则、遥测和控制台仪表板所需的指标。

volumeClaimTemplate

*monv1.EmbeddedPersistentVolumeClaim

定义 Prometheus 的持久存储。使用此设置配置持久卷声明,包括存储类、卷大小和名称。

PrometheusOperatorConfig

描述

PrometheusOperatorConfig资源定义了 Prometheus Operator 组件的设置。

属性 类型 描述

logLevel

字符串

定义 Prometheus Operator 的日志级别设置。可能的值为errorwarninfodebug。默认值为info

nodeSelector

map[string]string

定义在哪些节点上调度 Pod。

resources

*v1.ResourceRequirements

定义PrometheusOperator容器的资源请求和限制。

tolerations

[]v1.Toleration

定义 pod 的容忍度。

topologySpreadConstraints

[]v1.TopologySpreadConstraint

定义Pod的拓扑传播约束。

PrometheusOperatorAdmissionWebhookConfig

描述

PrometheusOperatorAdmissionWebhookConfig资源定义了 Prometheus Operator 的准入 Webhook 工作负载的设置。

属性 类型 描述

resources

*v1.ResourceRequirements

定义prometheus-operator-admission-webhook容器的资源请求和限制。

topologySpreadConstraints

[]v1.TopologySpreadConstraint

定义 pod 的拓扑扩散约束。

PrometheusRestrictedConfig

描述

PrometheusRestrictedConfig资源定义了监控用户定义项目的 Prometheus 组件的设置。

属性 类型 描述

additionalAlertmanagerConfigs

[]AdditionalAlertmanagerConfig

配置从Prometheus组件接收警报的其他Alertmanager实例。默认情况下,未配置任何其他Alertmanager实例。

enforcedLabelLimit

*uint64

指定每个抓取对样本接受的标签数量的限制。如果指标重新标记后标签数量超过此限制,则整个抓取将被视为失败。默认值为0,这意味着未设置限制。

enforcedLabelNameLengthLimit

*uint64

指定每个抓取对样本标签名称长度的限制。如果指标重新标记后标签名称的长度超过此限制,则整个抓取将被视为失败。默认值为0,这意味着未设置限制。

enforcedLabelValueLengthLimit

*uint64

指定每个抓取对样本标签值长度的限制。如果指标重新标记后标签值的长度超过此限制,则整个抓取将被视为失败。默认值为0,这意味着未设置限制。

enforcedSampleLimit

*uint64

指定将接受的已抓取样本的全局限制。如果此值大于enforcedTargetLimit,则此设置将覆盖在任何用户定义的ServiceMonitorPodMonitor对象中设置的SampleLimit值。管理员可以使用此设置来控制样本的总数。默认值为0,这意味着未设置限制。

enforcedTargetLimit

*uint64

指定已抓取目标的全局限制。如果此值大于enforcedSampleLimit,则此设置将覆盖在任何用户定义的ServiceMonitorPodMonitor对象中设置的TargetLimit值。管理员可以使用此设置来控制目标的总数。默认值为0

externalLabels

map[string]string

定义在与外部系统(如联合、远程存储和Alertmanager)通信时要添加到任何时间序列或警报的标签。默认情况下,不添加任何标签。

logLevel

字符串

定义 Prometheus 的日志级别设置。可能的值为errorwarninfodebug。默认设置为info

nodeSelector

map[string]string

定义在哪些节点上调度 Pod。

queryLogFile

字符串

指定 PromQL 查询的日志文件。此设置可以是文件名,在这种情况下,查询将保存到/var/log/prometheus处的emptyDir卷中,也可以是将挂载emptyDir卷并保存查询的完整路径。支持写入/dev/stderr/dev/stdout/dev/null,但不支持写入任何其他/dev/路径。也不支持相对路径。默认情况下,不会记录 PromQL 查询。

remoteWrite

[]RemoteWriteSpec

定义远程写入配置,包括 URL、身份验证和重新标记设置。

resources

*v1.ResourceRequirements

定义 Prometheus 容器的资源请求和限制。

retention

字符串

定义 Prometheus 保留数据的持续时间。此定义必须使用以下正则表达式模式指定:[0-9]+(ms|s|m|h|d|w|y)(ms = 毫秒,s = 秒,m = 分钟,h = 小时,d = 天,w = 周,y = 年)。默认值为24h

retentionSize

字符串

定义数据块加上预写日志 (WAL) 使用的磁盘空间最大量。支持的值为BKBKiBMBMiBGBGiBTBTiBPBPiBEBEiB。默认值为nil

tolerations

[]v1.Toleration

定义 pod 的容忍度。

topologySpreadConstraints

[]v1.TopologySpreadConstraint

定义Pod的拓扑传播约束。

volumeClaimTemplate

*monv1.EmbeddedPersistentVolumeClaim

定义 Prometheus 的持久存储。使用此设置配置卷的存储类和大小。

RemoteWriteSpec

描述

RemoteWriteSpec资源定义了远程写入存储的设置。

必需

  • url

属性 类型 描述

authorization

*monv1.SafeAuthorization

定义远程写入存储的授权设置。

basicAuth

*monv1.BasicAuth

定义远程写入端点 URL 的基本身份验证设置。

bearerTokenFile

字符串

定义包含远程写入端点载体令牌的文件。但是,由于您无法在 Pod 中挂载密钥,因此实际上您只能引用服务帐户的令牌。

headers

map[string]string

指定要与每个远程写入请求一起发送的自定义 HTTP 头。Prometheus 设置的 Header 无法被覆盖。

metadataConfig

*monv1.MetadataConfig

定义将系列元数据发送到远程写入存储的设置。

name

字符串

定义远程写入队列的名称。此名称用于指标和日志记录以区分队列。如果指定,则此名称必须唯一。

oauth2

*monv1.OAuth2

定义远程写入端点的 OAuth2 身份验证设置。

proxyUrl

字符串

定义可选的代理 URL。如果启用,则会被集群范围的代理取代。

queueConfig

*monv1.QueueConfig

允许调整远程写入队列参数的配置。

remoteTimeout

字符串

定义对远程写入端点的请求超时值。

sendExemplars

*布尔值

启用通过远程写入发送示例。启用后,此设置将配置 Prometheus 在内存中最多存储 100,000 个示例。此设置仅适用于用户定义的监控,不适用于核心平台监控。

sigv4

*monv1.Sigv4

定义 AWS 签名版本 4 身份验证设置。

tlsConfig

*monv1.SafeTLSConfig

定义远程写入端点的 TLS 身份验证设置。

url

字符串

定义将向其发送样本的远程写入端点的 URL。

writeRelabelConfigs

[]monv1.RelabelConfig

定义远程写入重命名配置列表。

TLSConfig

描述

TLSConfig 资源配置 TLS 连接的设置。

必需

  • insecureSkipVerify

属性 类型 描述

ca

*v1.SecretKeySelector

定义包含用于远程主机的证书颁发机构 (CA) 的密钥引用。

cert

*v1.SecretKeySelector

定义包含用于远程主机的公钥证书的密钥引用。

key

*v1.SecretKeySelector

定义包含用于远程主机的私钥的密钥引用。

serverName

字符串

用于验证返回证书上的主机名。

insecureSkipVerify

布尔值

设置为true时,禁用对远程主机证书和名称的验证。

TelemeterClientConfig

描述

TelemeterClientConfig 定义 Telemeter Client 组件的设置。

必需

  • nodeSelector

  • tolerations

属性 类型 描述

nodeSelector

map[string]string

定义在哪些节点上调度 Pod。

resources

*v1.ResourceRequirements

定义TelemeterClient容器的资源请求和限制。

tolerations

[]v1.Toleration

定义 pod 的容忍度。

topologySpreadConstraints

[]v1.TopologySpreadConstraint

定义Pod的拓扑传播约束。

ThanosQuerierConfig

描述

ThanosQuerierConfig 资源定义 Thanos 查询组件的设置。

属性 类型 描述

enableRequestLogging

布尔值

一个布尔型标志,用于启用或禁用请求日志记录。默认值为false

logLevel

字符串

定义 Thanos Querier 的日志级别设置。可能的值为errorwarninfodebug。默认值为info

enableCORS

布尔值

一个布尔型标志,用于启用设置 CORS 头部。这些头部允许来自任何来源的访问。默认值为false

nodeSelector

map[string]string

定义在哪些节点上调度 Pod。

resources

*v1.ResourceRequirements

定义 Thanos Querier 容器的资源请求和限制。

tolerations

[]v1.Toleration

定义 pod 的容忍度。

topologySpreadConstraints

[]v1.TopologySpreadConstraint

定义Pod的拓扑传播约束。

ThanosRulerConfig

描述

ThanosRulerConfig 资源定义用于用户定义项目的 Thanos Ruler 实例的配置。

属性 类型 描述

additionalAlertmanagerConfigs

[]AdditionalAlertmanagerConfig

配置 Thanos Ruler 组件如何与其他 Alertmanager 实例通信。默认值为nil

logLevel

字符串

定义 Thanos Ruler 的日志级别设置。可能的值为errorwarninfodebug。默认值为info

nodeSelector

map[string]string

定义在哪个节点上调度 Pod。

resources

*v1.ResourceRequirements

定义 Alertmanager 容器的资源请求和限制。

retention

字符串

定义 Prometheus 保留数据的持续时间。此定义必须使用以下正则表达式模式指定:[0-9]+(ms|s|m|h|d|w|y)(ms = 毫秒,s = 秒,m = 分钟,h = 小时,d = 天,w = 周,y = 年)。默认值为15d

tolerations

[]v1.Toleration

定义 pod 的容忍度。

topologySpreadConstraints

[]v1.TopologySpreadConstraint

定义Pod的拓扑传播约束。

volumeClaimTemplate

*monv1.EmbeddedPersistentVolumeClaim

定义 Thanos Ruler 的持久化存储。使用此设置配置卷的存储类和大小。

UserWorkloadConfiguration

描述

UserWorkloadConfiguration 资源定义负责openshift-user-workload-monitoring命名空间中的user-workload-monitoring-config配置映射中用户定义项目的设置。只有在将openshift-monitoring命名空间下的cluster-monitoring-config配置映射中的enableUserWorkload设置为true后,才能启用UserWorkloadConfiguration

属性 类型 描述

alertmanager

*AlertmanagerUserWorkloadConfig

定义用户工作负载监控中 Alertmanager 组件的设置。

prometheus

*PrometheusRestrictedConfig

定义用户工作负载监控中 Prometheus 组件的设置。

prometheusOperator

*PrometheusOperatorConfig

定义用户工作负载监控中 Prometheus Operator 组件的设置。

thanosRuler

*ThanosRulerConfig

定义用户工作负载监控中 Thanos Ruler 组件的设置。