为什么从集群维度上看集群 TPS 没有达到阈值,但是集群维度监控的限流次数指标却不为0?
目前限流是以秒维度进行限流的,但目前 TPS avg 统计方式显示的是分钟维度的 TPS 平均值,当用户的集群毛刺较多时,就会出现当前分钟 TPS 没达到阈值,但是这分钟的某一秒达到了阈值被限流,详情可以参考限流机制说明。查看秒维度的 TPS 指标,需要将指标的 avg 统计方式修改为 max 统计方式。如果只是偶发限流,可以在客户端调大生产超时时间,如果频繁出现限流,建议用户评估当前集群是否需要升配。 除此之外,由于默认集群规格的 TPS 是生产和消费各占比 50%,假设当前集群规格 1000,则生产和消费默认的 TPS 上限都是 500,如果用户的场景生产和消费比例不同,需要在控制台进行修改生产消费的 TPS 占比。