tencent cloud

文档反馈

组件版本维护说明

最后更新时间:2023-08-09 15:12:09

    更新说明

    腾讯云容器服务提供了涵盖网络、存储、监控、镜像、调度、GPU 相关场景下的增强组件来扩展集群功能,您可在容器集群详情中的组件管理页面查看当前组件版本,并支持对组件版本进行手动升级操作。

    升级须知

    1. 升级属于不可逆操作。
    2. 仅支持向上升级容器服务提供的组件版本,在满足集群 kubernetes 版本限制的情况下,默认升级至当前最新版本。
    3. 针对已废弃的组件版本,容器团队将不再提供技术支持,建议您及时升级。

    版本迭代记录

    2023年3月

    组件名称
    发布时间
    版本号
    变更内容
    限制和影响
    CFS-CSI 腾讯云文件存储
    2023-03-07
    v1.1.0
    支持 inline 形式挂载。
    更新负载配置,提升组件稳定性。
    此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。

    2023年2月

    组件名称
    发布时间
    版本号
    变更内容
    限制和影响
    CBS-CSI 腾讯云硬盘存储
    2023-02-21
    v1.1.0
    支持自动感知 cvm 最大可挂载数。
    优化云盘卸载逻辑,保证云盘状态正常。
    此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
    Craned
    Request 推荐组件
    2023-02-24
    v1.3.0
    提升了组件的稳定性。
    此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
    qGPU GPU 隔离组件
    2023-02-08
    v1.0.13
    处理 qGPU 资源为0的 Pod 时,直接返回全部节点或者打分全部为0,避免处理大量节点耗时过长,阻塞 qgpu pod 的调度。
    此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。

    2023年1月

    组件名称
    发布时间
    版本号
    变更内容
    限制和影响
    QOSAgent
    QOS 保障组件
    2023-01-01
    v1.0.1
    修复了一些参数 default 值设置的问题。
    此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
    重调度器插件
    2023-01-12
    v1.0.2
    修复集群节点 name 和 IP 不一致导致监控指标无法获取的问题。
    此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
    安全组策略插件
    2023-01-15
    v1.0.5
    修复绑定多个重复的安全组造成 Pod 创建失败。
    此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。

    2022年12月

    组件名称
    发布时间
    版本号
    变更内容
    限制和影响
    Craned
    Request 推荐组件
    2022-12-09
    v1.2.0
    优化内存推荐逻辑,增加推荐数据精度。
    此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
    qGPU GPU 隔离组件
    2022-12-20
    v1.0.12
    支持16卡。
    优化日志,避免打印干扰信。
    此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。

    2022年11月

    组件名称
    发布时间
    版本号
    变更内容
    限制和影响
    CBS-CSI 腾讯云硬盘存储
    2022-11-15
    v1.0.8
    支持 lvm 多盘管理。
    此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
    CBS-CSI 腾讯云硬盘存储
    2022-11-23
    v1.0.9
    支持 lvm 条带模式。
    调高 csi-resizer 配额。
    此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。

    2022年10月

    组件名称
    发布时间
    版本号
    变更内容
    限制和影响
    CBS-CSI 腾讯云硬盘存储
    2022-10-20
    v1.0.7
    支持 xfs 文件系统快照。
    支持1G粒度云盘创建。
    支持 block 类型 volume。
    此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
    qGPU GPU 隔离组件
    2022-10-24
    v1.0.10
    修复某些多卡机型上,GPU 卡序号与次设备号不一致,导致 qGPU 挂错显卡,业务无法正常运行的问题。
    私有化允许安装不支持混部的 base 版本 run 包,此时不需要修改内核参数及重启节点。
    修复未设置 qgpu-memory 却提示缺少 qgpu-core 的问题。
    此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
    qGPU GPU 隔离组件
    2022-10-28
    v1.0.11
    删除 Pod 时,直接批量删除该 Pod 相关的指标,而不是按照容器逐个删除,避免某些情况下指标未删除的问题。
    此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。

    2022年9月

    组件名称
    发布时间
    版本号
    变更内容
    限制和影响
    qGPU GPU 隔离组件
    2022-09-06
    v1.0.7
    修复 qGPU 调度器未清理已删除节点信息的问题。
    此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
    qGPU GPU 隔离组件
    2022-09-21
    v1.0.8
    增加 /metrics 接口,暴露分配给 Pod 容器的 GPU 信息(node_gpu_core_request,node_gpu_memory_request_bytes; 类型Gauge,标签"node", "gpu", "namespace", "pod", "container"),Pod 删除后,相关容器的指标即被删除。
    对于各种原因遗留的 qGPU 设备,在每分钟进行的 gc 中兜底删除,避免影响创建新的 qGPU 设备。
    修复 Pod 删除后同名 Pod 马上被创建和调度到同一个节点可能导致创建 qGPU 设备失败的问题。
    支持原生节点安装使用 qGPU(原生节点的 qGPU 不支持在离线混部功能)。
    此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
    qGPU GPU 隔离组件
    2022-09-29
    v1.0.9
    修复 crd 引入的回归问题,该问题导致 qGPU 调度器重启后在未同步 Pod 分配信息的情况下就开始调度新 Pod,产生不一致问题。
    更新 Pod 容器指标前,先清理相关数据,避免脏数据。
    此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
    CBS-CSI 腾讯云硬盘存储
    2022-09-13
    v1.0.6
    支持从快照恢复时扩容。
    支持 xfs 文件系统扩容。
    支持 TKE 集群添加超级节点模式。
    此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
    Craned
    Request 推荐组件
    2022-09-20
    v1.1.0
    请求云监控的 metric 间隔调成5m,推荐频率降低到12小时一次。
    此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
    CranesScheduler
    原生节点专用调度器
    2022-09-21
    v1.1.3
    fix helm repo 参数确实导致节点的指标无法更新到 node 上。
    将 descheduler 融入到 cranescheduler ,新增重调度器驱逐水位,动态调度器水位和重调度器目标水位一致。
    此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
    CFS-CSI 腾讯云文件存储
    2022-09-23
    v1.0.8
    支持 TKE 集群添加超级节点模式。
    此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
    Cerberus 镜像签名验证组件
    2022-09-26
    v0.0.1
    镜像验签组件。
    此次升级不会对已有业务造成影响。

    2022年8月

    组件名称
    发布时间
    版本号
    变更内容
    限制和影响
    Nginx Ingress 开源七层网络接入层
    2022-08-17
    v1.2.0
    接口迁移,不再依赖弹性网卡。
    此次升级不会对已有业务造成影响。
    pod-identity-webhook
    Pod 身份注入器
    2022-08-25
    v1.0.0
    添加 chart,支持 Pod 绑定一个 sa,sa 支持扮演 cam 角色来访问其他资源的能力。
    此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
    安全组策略插件
    2022-08-25
    v1.0.0
    添加 chart,支持一批 tke serverless pod 绑定同一个安全组来使用安全组放通安全组的能力。
    此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
    QOSAgent
    QOS保障组件
    2022-08-30
    v1.0.0
    添加 chart,初步支持基于内核的 qos 能力。
    次升级不会对已有业务造成影响 升级过程中存在组件不可用情况,建议业务低峰期升级
    qGPU GPU 隔离组件
    2022-08-31
    v1.0.6
    支持使用节点的 kubeconfig 访问 apiserver (此时不能启用 crd 参数)
    支持使用 TencentOS 2.4(TK4) 公有镜像安装 qGPU
    此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。

    2022年7月

    组件名称
    发布时间
    版本号
    变更内容
    限制和影响
    CBS-CSI 腾讯云硬盘存储
    2022-07-06
    v1.0.5
    支持云标签重复时的云盘创建。
    解决在线扩容时序问题。
    回收 csi-node secret 资源权限。
    此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
    腾讯云文件存储
    2022-07-14
    v1.0.7
    动态存储功能适配 Serverless 集群。
    共享存储功能适配 Serverless 集群。
    此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。
    qGPU GPU 隔离组件
    2022-07-20
    v1.0.5
    支持使用公有镜像安装和使用 qGPU。
    持关闭给节点打 label 的功能( --enable-label=false)。
    此次升级不会对已有业务造成影响,升级过程中存在组件不可用情况,建议业务低峰期升级。

    2022年6月

    组件名称
    发布时间
    版本号
    变更内容
    限制和影响
    重调度器插件
    2022-06-07
    v1.0.1
    TMP 认证支持:
    prom-probe 中添加 auth 认证。
    descheduler 和 init container 中传入 token/appid 等环境变量,并进行解码。
    descheduler 中增加 prometheus client 认证功能。
    此次升级不会对已有业务造成影响,升级过程中可能存在组件不可用情况,建议业务低峰期升级。
    GPU 隔离组件
    2022-06-08
    v1.0.3
    qgpu manager 镜像更新为 tkeimages/elastic-gpu-agent:v1.0.2。
    qgpu scheduler 镜像更新为 tkeimages/elastic-gpu-scheduler:v1.0.2。
    支持使用 GPU CRD 管理 GPU 资源。
    此次升级不会对已有业务造成影响,升级过程中可能存在组件不可用情况,建议业务低峰期升级。
    动态调度器
    2022-06-30
    v1.0.2
    TMP 认证支持:
    probe-prometheus 中添加 auth 认证。
    node-annotator 和 init container 中传入 token,appid 等环境变量,并进行解码。
    node-annotator 中增加 prometheus client 认证功能,更新镜像到 v3.2.1。
    
    对于使用 ip 作为 node exporter 上报标签的 promql 语句适配,修复无法查数据 bug。
    此次升级不会对已有业务造成影响,升级过程中可能存在组件不可用情况,建议业务低峰期升级。

    2022年5月

    组件名称
    发布时间
    版本号
    变更内容
    限制和影响
    腾讯云硬盘存储
    2022-05-06
    v1.0.3
    插件支持配置污点容忍。
    插件新增 type 启动参数。
    此次升级不会对已有业务造成影响,升级过程中可能存在组件不可用情况,建议业务低峰期升级。
    腾讯云对象存储
    2022-05-06
    v1.0.1
    插件支持配置污点容忍。
    此次升级不会对已有业务造成影响,升级过程中可能存在组件不可用情况,建议业务低峰期升级。
    腾讯云文件存储
    2022-05-06
    v1.0.4
    插件支持配置污点容忍。
    tcfs 配置文件中新增优先级和 hostAliases。
    此次升级不会对已有业务造成影响,升级过程中可能存在组件不可用情况,建议业务低峰期升级。
    腾讯云文件存储
    2022-05-24
    v1.0.5
    支持 Serverless 集群 cfs provisoner。
    此次升级不会对已有业务造成影响,升级过程中可能存在组件不可用情况,建议业务低峰期升级。
    腾讯云硬盘存储
    2022-05-31
    v1.0.4
    优化插件启动逻辑。
    csi-attacher 默认并发数调大至 50。
    此次升级不会对已有业务造成影响,升级过程中可能存在组件不可用情况,建议业务低峰期升级。

    2022年4月

    组件名称
    发布时间
    版本号
    变更内容
    限制和影响
    腾讯云文件存储
    2022-04-12
    v1.0.2
    插件 umount 幂等性支持。
    此次升级不会对已有业务造成影响,升级过程中可能存在组件不可用情况,建议业务低峰期升级。
    开源七层网络接入层
    2022-04-18
    v1.1.0
    eks.tke.cloud.tencent.com/norm : "true" eks.tke.cloud.tencent.com/disable-metrics : "true" 考虑到 TKE 集群中使用超级节点的场景,将原来在 TKE Serverless 下生效的注解开放到 TKE、TKE Serverless 场景下生效。
    此次升级不会对已有业务造成影响,升级过程中可能存在组件不可用情况,建议业务低峰期升级。
    腾讯云文件存储
    2022-04-19
    v1.0.3
    tcfs crd 增加资源标签字段。
    1.12 及以下 k8s 版本不安装 tcfs 相关的资源。
    cfs-csi startServer 注册启动优化。
    此次升级不会对已有业务造成影响,升级过程中可能存在组件不可用情况,建议业务低峰期升级。
    GPU 隔离组件
    2022-04-21
    v1.0.2
    更新了 qgpu manager 镜像版本,支持自动所在节点设置 gpu 驱动版本以及其他信息。
    更新了 clusterrole qgpu-manager,增加了对 nodes 的操作权限。
    此次升级不会对已有业务造成影响,升级过程中可能存在组件不可用情况,建议业务低峰期升级。
    腾讯云硬盘存储
    2022-04-24
    v1.0.2
    取消插件 NodeUnpublishVolume 接口中的目录清理逻辑。
    插件支持通过 Serial 获取盘符。
    插件删除时保留对应 crd 资源。
    此次升级不会对已有业务造成影响,升级过程中可能存在组件不可用情况,建议业务低峰期升级。

    2022年3月

    组件名称
    发布时间
    版本号
    变更内容
    限制和影响
    腾讯云硬盘存储
    2022-03-16
    v1.0.1
    支持使用了 intree cbs 的业务负载在集群从 1.18 升级到 1.20 时原地无损迁移到 csi。
    此次升级不会对已有业务造成影响,升级过程中可能存在组件不可用情况,建议业务低峰期升级。
    腾讯云文件存储
    2022-03-24
    v1.0.1
    支持动态创建时共享存储实例,通过自动生成的子目录进行数据隔离。
    此次升级不会对已有业务造成影响,升级过程中可能存在组件不可用情况,建议业务低峰期升级。
    
    联系我们

    联系我们,为您的业务提供专属服务。

    技术支持

    如果你想寻求进一步的帮助,通过工单与我们进行联络。我们提供7x24的工单服务。

    7x24 电话支持