tencent cloud

组件版本维护说明
最后更新时间:2023-08-09 15:12:09
组件版本维护说明
最后更新时间: 2023-08-09 15:12:09

更新说明

腾讯云容器服务提供了涵盖网络、存储、监控、镜像、调度、GPU 相关场景下的增强组件来扩展集群功能,您可在容器集群详情中的组件管理页面查看当前组件版本,并支持对组件版本进行手动升级操作。

升级须知

1. 升级属于不可逆操作。
2. 仅支持向上升级容器服务提供的组件版本,在满足集群 kubernetes 版本限制的情况下,默认升级至当前最新版本。
3. 针对已废弃的组件版本,容器团队将不再提供技术支持,建议您及时升级。

版本迭代记录

2023年3月

组件名称
发布时间
版本号
变更内容
限制和影响
CFS-CSI 腾讯云文件存储
2023-03-07
v1.1.0
支持 inline 形式挂载。
更新负载配置,提升组件稳定性。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。

2023年2月

组件名称
发布时间
版本号
变更内容
限制和影响
CBS-CSI 腾讯云硬盘存储
2023-02-21
v1.1.0
支持自动感知 cvm 最大可挂载数。
优化云盘卸载逻辑,保证云盘状态正常。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
Craned
Request 推荐组件
2023-02-24
v1.3.0
提升了组件的稳定性。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
qGPU GPU 隔离组件
2023-02-08
v1.0.13
处理 qGPU 资源为0的 Pod 时,直接返回全部节点或者打分全部为0,避免处理大量节点耗时过长,阻塞 qgpu pod 的调度。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。

2023年1月

组件名称
发布时间
版本号
变更内容
限制和影响
QOSAgent
QOS 保障组件
2023-01-01
v1.0.1
修复了一些参数 default 值设置的问题。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
重调度器插件
2023-01-12
v1.0.2
修复集群节点 name 和 IP 不一致导致监控指标无法获取的问题。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
安全组策略插件
2023-01-15
v1.0.5
修复绑定多个重复的安全组造成 Pod 创建失败。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。

2022年12月

组件名称
发布时间
版本号
变更内容
限制和影响
Craned
Request 推荐组件
2022-12-09
v1.2.0
优化内存推荐逻辑,增加推荐数据精度。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
qGPU GPU 隔离组件
2022-12-20
v1.0.12
支持16卡。
优化日志,避免打印干扰信。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。

2022年11月

组件名称
发布时间
版本号
变更内容
限制和影响
CBS-CSI 腾讯云硬盘存储
2022-11-15
v1.0.8
支持 lvm 多盘管理。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
CBS-CSI 腾讯云硬盘存储
2022-11-23
v1.0.9
支持 lvm 条带模式。
调高 csi-resizer 配额。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。

2022年10月

组件名称
发布时间
版本号
变更内容
限制和影响
CBS-CSI 腾讯云硬盘存储
2022-10-20
v1.0.7
支持 xfs 文件系统快照。
支持1G粒度云盘创建。
支持 block 类型 volume。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
qGPU GPU 隔离组件
2022-10-24
v1.0.10
修复某些多卡机型上,GPU 卡序号与次设备号不一致,导致 qGPU 挂错显卡,业务无法正常运行的问题。
私有化允许安装不支持混部的 base 版本 run 包,此时不需要修改内核参数及重启节点。
修复未设置 qgpu-memory 却提示缺少 qgpu-core 的问题。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
qGPU GPU 隔离组件
2022-10-28
v1.0.11
删除 Pod 时,直接批量删除该 Pod 相关的指标,而不是按照容器逐个删除,避免某些情况下指标未删除的问题。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。

2022年9月

组件名称
发布时间
版本号
变更内容
限制和影响
qGPU GPU 隔离组件
2022-09-06
v1.0.7
修复 qGPU 调度器未清理已删除节点信息的问题。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
qGPU GPU 隔离组件
2022-09-21
v1.0.8
增加 /metrics 接口,暴露分配给 Pod 容器的 GPU 信息(node_gpu_core_request,node_gpu_memory_request_bytes; 类型Gauge,标签"node", "gpu", "namespace", "pod", "container"),Pod 删除后,相关容器的指标即被删除。
对于各种原因遗留的 qGPU 设备,在每分钟进行的 gc 中兜底删除,避免影响创建新的 qGPU 设备。
修复 Pod 删除后同名 Pod 马上被创建和调度到同一个节点可能导致创建 qGPU 设备失败的问题。
支持原生节点安装使用 qGPU(原生节点的 qGPU 不支持在离线混部功能)。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
qGPU GPU 隔离组件
2022-09-29
v1.0.9
修复 crd 引入的回归问题,该问题导致 qGPU 调度器重启后在未同步 Pod 分配信息的情况下就开始调度新 Pod,产生不一致问题。
更新 Pod 容器指标前,先清理相关数据,避免脏数据。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
CBS-CSI 腾讯云硬盘存储
2022-09-13
v1.0.6
支持从快照恢复时扩容。
支持 xfs 文件系统扩容。
支持 TKE 集群添加超级节点模式。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
Craned
Request 推荐组件
2022-09-20
v1.1.0
请求云监控的 metric 间隔调成5m,推荐频率降低到12小时一次。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
CranesScheduler
原生节点专用调度器
2022-09-21
v1.1.3
fix helm repo 参数确实导致节点的指标无法更新到 node 上。
将 descheduler 融入到 cranescheduler ,新增重调度器驱逐水位,动态调度器水位和重调度器目标水位一致。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
CFS-CSI 腾讯云文件存储
2022-09-23
v1.0.8
支持 TKE 集群添加超级节点模式。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
Cerberus 镜像签名验证组件
2022-09-26
v0.0.1
镜像验签组件。
此次升级不会对已有业务造成影响。

2022年8月

组件名称
发布时间
版本号
变更内容
限制和影响
Nginx Ingress 开源七层网络接入层
2022-08-17
v1.2.0
接口迁移,不再依赖弹性网卡。
此次升级不会对已有业务造成影响。
pod-identity-webhook
Pod 身份注入器
2022-08-25
v1.0.0
添加 chart,支持 Pod 绑定一个 sa,sa 支持扮演 cam 角色来访问其他资源的能力。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
安全组策略插件
2022-08-25
v1.0.0
添加 chart,支持一批 tke serverless pod 绑定同一个安全组来使用安全组放通安全组的能力。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
QOSAgent
QOS保障组件
2022-08-30
v1.0.0
添加 chart,初步支持基于内核的 qos 能力。
次升级不会对已有业务造成影响 升级过程中存在组件不可用情况,建议业务低峰期升级
qGPU GPU 隔离组件
2022-08-31
v1.0.6
支持使用节点的 kubeconfig 访问 apiserver (此时不能启用 crd 参数)
支持使用 TencentOS 2.4(TK4) 公有镜像安装 qGPU
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。

2022年7月

组件名称
发布时间
版本号
变更内容
限制和影响
CBS-CSI 腾讯云硬盘存储
2022-07-06
v1.0.5
支持云标签重复时的云盘创建。
解决在线扩容时序问题。
回收 csi-node secret 资源权限。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
腾讯云文件存储
2022-07-14
v1.0.7
动态存储功能适配 Serverless 集群。
共享存储功能适配 Serverless 集群。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
qGPU GPU 隔离组件
2022-07-20
v1.0.5
支持使用公有镜像安装和使用 qGPU。
持关闭给节点打 label 的功能( --enable-label=false)。
此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。

2022年6月

组件名称
发布时间
版本号
变更内容
限制和影响
重调度器插件
2022-06-07
v1.0.1
TMP 认证支持:
prom-probe 中添加 auth 认证。
descheduler 和 init container 中传入 token/appid 等环境变量,并进行解码。
descheduler 中增加 prometheus client 认证功能。
此次升级不会对已有业务造成影响,升级过程中可能存在组件不可用情况,建议业务低峰期升级。
GPU 隔离组件
2022-06-08
v1.0.3
qgpu manager 镜像更新为 tkeimages/elastic-gpu-agent:v1.0.2。
qgpu scheduler 镜像更新为 tkeimages/elastic-gpu-scheduler:v1.0.2。
支持使用 GPU CRD 管理 GPU 资源。
此次升级不会对已有业务造成影响,升级过程中可能存在组件不可用情况,建议业务低峰期升级。
动态调度器
2022-06-30
v1.0.2
TMP 认证支持:
probe-prometheus 中添加 auth 认证。
node-annotator 和 init container 中传入 token,appid 等环境变量,并进行解码。
node-annotator 中增加 prometheus client 认证功能,更新镜像到 v3.2.1。

对于使用 ip 作为 node exporter 上报标签的 promql 语句适配,修复无法查数据 bug。
此次升级不会对已有业务造成影响,升级过程中可能存在组件不可用情况,建议业务低峰期升级。

2022年5月

组件名称
发布时间
版本号
变更内容
限制和影响
腾讯云硬盘存储
2022-05-06
v1.0.3
插件支持配置污点容忍。
插件新增 type 启动参数。
此次升级不会对已有业务造成影响,升级过程中可能存在组件不可用情况,建议业务低峰期升级。
腾讯云对象存储
2022-05-06
v1.0.1
插件支持配置污点容忍。
此次升级不会对已有业务造成影响,升级过程中可能存在组件不可用情况,建议业务低峰期升级。
腾讯云文件存储
2022-05-06
v1.0.4
插件支持配置污点容忍。
tcfs 配置文件中新增优先级和 hostAliases。
此次升级不会对已有业务造成影响,升级过程中可能存在组件不可用情况,建议业务低峰期升级。
腾讯云文件存储
2022-05-24
v1.0.5
支持 Serverless 集群 cfs provisoner。
此次升级不会对已有业务造成影响,升级过程中可能存在组件不可用情况,建议业务低峰期升级。
腾讯云硬盘存储
2022-05-31
v1.0.4
优化插件启动逻辑。
csi-attacher 默认并发数调大至 50。
此次升级不会对已有业务造成影响,升级过程中可能存在组件不可用情况,建议业务低峰期升级。

2022年4月

组件名称
发布时间
版本号
变更内容
限制和影响
腾讯云文件存储
2022-04-12
v1.0.2
插件 umount 幂等性支持。
此次升级不会对已有业务造成影响,升级过程中可能存在组件不可用情况,建议业务低峰期升级。
开源七层网络接入层
2022-04-18
v1.1.0
eks.tke.cloud.tencent.com/norm : "true" eks.tke.cloud.tencent.com/disable-metrics : "true" 考虑到 TKE 集群中使用超级节点的场景,将原来在 TKE Serverless 下生效的注解开放到 TKE、TKE Serverless 场景下生效。
此次升级不会对已有业务造成影响,升级过程中可能存在组件不可用情况,建议业务低峰期升级。
腾讯云文件存储
2022-04-19
v1.0.3
tcfs crd 增加资源标签字段。
1.12 及以下 k8s 版本不安装 tcfs 相关的资源。
cfs-csi startServer 注册启动优化。
此次升级不会对已有业务造成影响,升级过程中可能存在组件不可用情况,建议业务低峰期升级。
GPU 隔离组件
2022-04-21
v1.0.2
更新了 qgpu manager 镜像版本,支持自动所在节点设置 gpu 驱动版本以及其他信息。
更新了 clusterrole qgpu-manager,增加了对 nodes 的操作权限。
此次升级不会对已有业务造成影响,升级过程中可能存在组件不可用情况,建议业务低峰期升级。
腾讯云硬盘存储
2022-04-24
v1.0.2
取消插件 NodeUnpublishVolume 接口中的目录清理逻辑。
插件支持通过 Serial 获取盘符。
插件删除时保留对应 crd 资源。
此次升级不会对已有业务造成影响,升级过程中可能存在组件不可用情况,建议业务低峰期升级。

2022年3月

组件名称
发布时间
版本号
变更内容
限制和影响
腾讯云硬盘存储
2022-03-16
v1.0.1
支持使用了 intree cbs 的业务负载在集群从 1.18 升级到 1.20 时原地无损迁移到 csi。
此次升级不会对已有业务造成影响,升级过程中可能存在组件不可用情况,建议业务低峰期升级。
腾讯云文件存储
2022-03-24
v1.0.1
支持动态创建时共享存储实例,通过自动生成的子目录进行数据隔离。
此次升级不会对已有业务造成影响,升级过程中可能存在组件不可用情况,建议业务低峰期升级。

本页内容是否解决了您的问题?
您也可以 联系销售 提交工单 以寻求帮助。

文档反馈