功能概述
腾讯云分布式缓存数据库 审计功能,是一套完整的数据库操作日志记录与分析系统。它通过实时采集、安全存储和高效查询用户执行的所有命令,全方位提升数据库的安全防护与可观测性。
全量行为记录: 实时采集并记录针对分布式缓存数据库的所有操作指令。
满足合规要求: 帮助企业轻松应对金融、医疗、政务等行业严苛的合规审计标准(如等保合规)。
问题追溯: 为运维与安全团队提供历史操作查询与安全监控能力,实现风险的快速定位与定责。
功能说明
|
按需开通与关闭 | 开通数据库审计 | 支持对单实例或批量实例一键开启审计功能。开通后系统将在后台自动采集并记录命令执行情况。 |
| 关闭数据库审计 | 支持随时关闭单实例或批量实例的审计采集,关闭后停止产生相关费用。 说明: 关闭审计会同步清空该实例的所有历史审计日志且无法恢复,请谨慎操作。 |
自定义审计规则 | 按需调整审计类型 | 支持根据安全策略动态调整审计范围,修改即刻生效: 写命令(默认):审计 SET、DEL、HSET 等写操作命令,聚焦数据变更行为。 读命令:审计 GET、HGET、LRANGE 等读操作命令,追踪数据访问行为。 全部命令:审计所有读写操作命令,实现全量操作留痕。 |
| 自动降级策略 | 支持配置触发审计降级的 P99 延迟阈值(默认500ms,范围300~1000ms)。 说明: 当实例延迟达到该阈值时,系统将自动暂停日志采集,优先保障数据库主业务的可用性。 |
审计日志管理 | 设置日志保存时长 | 支持自定义保留周期(7~30天,默认7天),到期自动清理。 |
| 分级存储 | 提供高频存储与低频存储相结合的分级架构。系统会自动将近期活跃日志存放于高频区,确保日常排查的检索速度;历史日志则自动沉降至低频区,兼顾长期合规留存与存储成本控制。 |
| 审计信息全记录 | 全链路记录命令执行上下文,包含:执行时间、执行命令(含完整内容)、用户账号、数据库名、客户端 IP、节点 ID、执行时长以及错误信息。 |
使用条件
|
实例版本 | Redis 引擎: 4.0及以上版本。 Valkey 引擎:8.0。 Proxy 引擎:5.8.25。 |
实例状态 | 实例须处于"运行中"状态,处于"创建中"、"升级中"、"隔离中"、"已销毁"等状态的实例无法开启或配置审计功能。 |
地域支持 | 实例所在地域已开通审计功能。当前审计功能已覆盖全部公有云地域,灰度期间新增地域可能受白名单限制,请以控制台实际显示为准。 |
相关概念
P99延迟
定义:P99延迟(99th Percentile Latency)是衡量系统性能稳定性的关键指标,表示在所有请求中,99%的请求响应时间都不超过该值,仅有1%的请求响应时间会超过该值。
在审计中的作用:P99延迟是审计功能降级保护机制的核心触发指标。当实例负载过高导致P99延迟超过配置阈值时,系统会自动触发降级策略,临时暂停审计日志采集,将计算资源优先分配给业务请求处理,确保核心业务不受影响。
降级策略
定义:降级策略是一种自适应的保护机制,当实例性能指标(P99延迟)超过预设阈值时,系统自动暂停审计日志的采集和上报,将系统资源优先分配给业务请求处理,确保业务可用性不受审计功能的影响。
正常状态:实例 P99 延迟处于正常范围内,所有符合审计规则的用户命令都会被完整记录到审计日志中
降级触发:当 P99 延迟连续超过配置阈值(默认500ms)达到一定时间窗口后,系统自动进入降级状态,暂停审计数据采集
降级期间:在降级状态下执行的命令将不会被记录到审计日志中,但不影响命令的正常执行
自动恢复:当 P99 延迟恢复到正常水平并保持稳定后,系统自动退出降级状态,恢复审计日志的正常采集
常见问题
Q1:开启审计功能会影响性能吗?
会有一定影响,但通过多重优化机制将影响控制在可接受范围内。审计采用异步日志采集机制,命令执行与日志上报解耦进行。同时,系统内置降级策略,当 P99 延迟超过配置阈值(默认500ms)时会自动暂停审计,优先保障业务可用性,待性能恢复后自动恢复审计。对于"读命令"和"全部命令"审计,由于日志量更大,性能影响需根据实际业务的读写比例进行评估,建议在生产环境开启前先在测试环境进行压测验证。
Q2:审计日志能保留多久?
审计日志支持7-30天的灵活保留期限配置,默认保留7天。您可以根据行业合规要求和成本预算在控制台随时调整保留时长,修改后对新产生的日志立即生效。超过保留期限的日志将自动从系统中清理,清理后无法恢复。
Q3:审计日志会记录哪些信息?
审计日志会完整记录以下维度的信息,为问题追溯和合规审计提供充分依据:
命令执行时间:命令执行的精确时间戳。
客户端 IP:发起请求的客户端 IP 地址,用于追溯操作来源。
用户账号:执行命令的数据库账号名称(如使用默认账号则显示为 default)。
数据库编号:数据库编号(0-15),标识命令作用的具体数据库。
命令类型:执行的命令名称,如 SET、GET、HSET、DEL、LPUSH 等。
节点 ID:集群架构下执行命令的具体节点标识,便于定位分片级别的问题。
命令详情:完整的命令内容,包括 Key 名称和参数(敏感数据如密码、密钥会自动脱敏)。
执行时长:命令执行耗时,单位毫秒,可用于识别慢查询。
错误信息:命令执行失败时的错误原因描述。