tencent cloud

智能顾问

产品动态
产品简介
产品概述
功能介绍
产品优势
应用场景
客户案例
购买指南
快速入门
使用智能顾问进行混沌演练
操作指南
智能顾问-云架构操作指南
智能顾问-云巡检操作指南
智能顾问-混沌演练操作指南
智能顾问-数字资产操作指南
权限管理
API 文档
History
Introduction
API Category
Making API Requests
Other APIs
Task APIs
Cloud Architecture Console APIs
Data Types
Error Codes
常见问题
智能顾问常见问题
智能顾问-云巡检常见问题
智能顾问-云架构常见问题
智能顾问-混沌演练常见问题
相关协议
Tencent Cloud Smart Advisor Service Level Agreement
PRIVACY POLICY MODULE CHAOTIC FAULT GENERATOR
DATA PRIVACY AND SECURITY AGREEMENT MODULE CHAOTIC FAULT GENERATOR
联系我们

容器资源应用进程故障演练案例

PDF
聚焦模式
字号
最后更新时间: 2025-11-20 15:58:56

背景

容器资源提供了一种轻量级、可移植和可扩展的应用程序运行环境。然而,容器内的应用进程可能会遇到崩溃、死锁、资源泄漏等故障,导致应用程序无法正常运行。
为了提高容器服务的可靠性和稳定性,需进行应用进程故障演练。通过演练,可以验证系统在应用进程发生故障时是否能正常运行,提前暴露此故障场景下的一系列问题,以便优化系统架构和做好应急预案。

演练实施

说明:
适用资源对象:标准集群普通节点、标准集群 Pod、Serverless 集群 Pod。

步骤一:演练准备

购买容器实例,部署测试服务。若已有可以演练的容器实例,则直接创建演练。
进入 探针管理 页面安装探针。

步骤二:创建演练

1. 登录 智能顾问 > 混沌演练控制台,进入演练管理页面,单击新建演练
2. 点击跳过,新建空白演练,并填写演练信息。
3. 实例类型选择容器,实例对象选择标准集群Pod, 然后添加实例。
4. 添加故障动作,点击立即添加,选择应用进程。
5. 选择故障动作进程停止,然后点击下一步
6. 设置动作参数,点击确定
全部容器:每个容器中的目标进程都会被停止
按字母排序选择首个容器:首个容器中的目标进程会被停止
指定容器名称:目标容器中的目标进程会被停止
7. 动作参数配置完成之后,单击下一步。根据实际情况配置护栏策略监控指标,最后单击提交,完成演练创建。

步骤三:执行演练

1. 登录准备执行故障的机器,查看当前进程管理详情。可以发现,存在一个 python 进程。



2. 进入演练详情,单击前往动作组执行
3. 点击执行,开始演练。
4. 点击动作卡片,查看动作执行详情。
5. 查看执行日志,确认执行成功。
6. 查看故障执行后的效果。再次查看当前进程管理详情,可以发现,python 进程已经被杀死。




帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈