query=avg_over_time(pod:container_cpu_usage:sum{namespace="openshift-kube-apiserver"}[30m])
使用以下信息规划电信 RAN DU 工作负载、集群资源和中心集群以及管理的单节点 OpenShift 集群的硬件规格。
DU 工作节点必须具有第三代至强 (Ice Lake) 2.20 GHz 或更高版本的 CPU,其固件经过调整以实现最大性能。
5G RAN DU 用户应用程序和工作负载应符合以下最佳实践和应用程序限制
开发符合最新版本的云原生网络功能 (CNF) Red Hat Kubernetes 最佳实践。
使用 SR-IOV 进行高性能网络。
谨慎使用 exec 探针,并且仅在没有其他合适的选项可用时才使用。
如果 CNF 使用 CPU 固定,请不要使用 exec 探针。使用其他探针实现,例如 httpGet
或 tcpSocket
。
当您需要使用 exec 探针时,请限制 exec 探针的频率和数量。exec 探针的最大数量必须保持在 10 个以下,频率不得设置为小于 10 秒。
除非绝对没有可行的替代方案,否则避免使用 exec 探针。
启动探针在稳定运行期间需要最少的资源。对 exec 探针的限制主要适用于存活性探针和就绪性探针。 |
符合本规范中描述的参考 DU 应用工作负载维度的测试工作负载可在 openshift-kni/du-test-workloads 找到。
代表性参考应用工作负载具有以下特性:
vRAN 应用(包括其管理和控制功能)最多包含 15 个 Pod 和 30 个容器。
每个 Pod 最多使用 2 个ConfigMap
和 4 个Secret
CR。
最多使用 10 个 exec 探针,频率不低于 10 秒。
对kube-apiserver
的增量应用负载小于集群平台使用率的 10%。
您可以从平台指标中提取 CPU 负载。例如:
|
平台日志收集器不收集应用程序日志。
主 CNI 上的聚合流量小于 1 MBps。
系统中运行的 Pod 最大数量(包括应用程序工作负载和 OpenShift Container Platform Pod)为 120 个。
OpenShift Container Platform 资源利用率取决于许多因素,包括应用程序工作负载特性,例如:
Pod 数量
探针的类型和频率
主 CNI 或具有内核网络的辅助 CNI 上的消息速率
API 访问速率
日志记录速率
存储 IOPS
集群资源需求适用于以下条件:
集群正在运行所描述的代表性应用程序工作负载。
集群使用“电信 RAN DU 工作节点集群资源利用率”中描述的约束进行管理。
RAN DU 使用模型配置中标注为可选的组件未应用。
您需要进行额外的分析,以确定对资源利用率的影响以及在电信 RAN DU 参考设计范围之外的配置下能否满足 KPI 目标。根据您的需求,您可能需要在集群中分配额外的资源。 |
建议使用 Red Hat Advanced Cluster Management (RHACM) 作为集群管理解决方案。将其配置为中心集群上的以下限制:
配置最多 5 个 RHACM 策略,符合的评估间隔至少为 10 分钟。
在策略中最多使用 10 个托管集群模板。尽可能使用中心端模板。
禁用所有 RHACM 附加组件,除了policy-controller
和observability-controller
附加组件。将Observability
设置为默认配置。
配置可选组件或启用其他功能将导致额外的资源使用,并可能降低整体系统性能。 更多信息,请参见 参考设计部署组件。 |
指标 | 限制 | 备注 |
---|---|---|
CPU 使用率 |
小于 4000 mc – 2 个核心(4 个超线程) |
平台 CPU 固定到预留核心,包括每个预留核心中的两个超线程。系统设计为在稳定状态下使用 3 个 CPU(3000 mc),以便允许进行周期性系统任务和峰值处理。 |
已用内存 |
小于 16G |
以下部分描述了用于配置和部署集群以运行电信 RAN DU 工作负载的各种 OpenShift Container Platform 组件和配置。
确保电信 RAN DU 配置文件中未包含的组件不会影响分配给工作负载应用程序的 CPU 资源。 |
不支持树外驱动程序。 |
有关电信 RAN RDS KPI 测试结果的详细信息,请参见 电信 RAN DU 4.17 参考设计规范 KPI 测试结果。此信息仅供客户和合作伙伴使用。