tencent cloud

腾讯云可观测平台

动态与公告
产品动态
产品简介
产品概述
产品优势
基本功能
基本概念
应用场景
使用限制
购买指南
云产品监控
应用性能监控
终端性能监控
前端性能监控
云拨测
Prometheus 监控服务
Grafana 服务
事件总线
云压测
快速入门
监控概览
实例分组
云产品监控
应用性能监控
云拨测
云压测
Prometheus 监控服务
Grafana 服务
创建 Dashboard
事件总线
告警服务
云产品监控
云产品监控指标
控制台操作指南
云服务器监控组件
云产品监控对接 Grafana
故障处理
实践教程
应用性能监控
应用性能监控简介
接入指南
控制台操作指南
实践教程
参考信息
常见问题
终端性能监控
终端性能监控概述
控制台操作指南
接入指南
实践教程
前端性能监控
前端性能监控简介
控制台操作指南
接入指南
常见问题
云拨测
产品简介
控制台操作指南
常见问题
云压测
云压测概述
控制台操作指南
实践教程
JavaScript API 列表
常见问题
Prometheus 监控
Prometheus 监控简介
接入指南
控制台操作指南
实践教程
Terraform
常见问题
Grafana 服务
产品简介
控制台操作指南
Grafana 平台常用功能指引
常见问题
Dashboard
什么是 Dashboard
控制台操作指南
告警管理
控制台操作指南
故障处理
常见问题
事件总线
事件总线简介
控制台操作指南
实践教程
常见问题
报表管理
常见问题
腾讯云可观测平台常见问题
告警服务相关
一般性问题
监控图表相关
云服务器监控组件相关
动态阈值告警相关
云监控对接 Grafana 相关
文档阅读指南
相关协议
应用性能监控服务等级协议
APM 隐私协议
APM 数据处理和安全协议
前端性能监控服务等级协议
终端性能监控服务等级协议
云拨测服务等级协议
Prometheus 监控服务服务等级协议
Grafana 服务服务等级协议
云压测服务等级协议
云压测使用限制
Cloud Monitor Service Level Agreement
词汇表

接入 LLM 应用

PDF
聚焦模式
字号
最后更新时间: 2025-10-13 19:10:48
大语言模型近年来呈现出快速增长的趋势,随着 DeepSeek 的强势出圈,AI 应用的门槛进一步降低,为各行业引入高效且低成本的解决方案,推动了人工智能落地应用的爆炸式发展。
大语言模型应用的运行涉及多个组件和复杂的交互过程,应用性能监控 APM 通过分布式追踪技术,清晰地展示请求在各个组件之间的调用链路,一旦出现故障,可以快速定位到问题所在的具体环节。同时,APM 可以实时监测模型应用的运行状态,及时发现异常行为并发出告警,使运维人员及时采取措施,避免问题扩大化。

支持的 LLM 组件与框架

腾讯云自研 Python 探针同时支持对常见 LLM 框架和传统(非 LLM)Python 框架的自动埋点,兼容 OpenTelemetry 协议标准,能够和其他使用 OpenTelemetry 方案接入的应用实现链路信息互通,支持以下组件或框架。
说明:
要求 Python 3.9及以上版本。
支持的组件与框架
链接
LLM 组件与框架
OpenAI SDK(openai >= 0.27.0):OpenAI 官方提供的 API 封装,用于直接调用所有兼容 OpenAI 标准的大模型。
Ollama(ollama >= 0.4.0):本地运行和管理开源大模型的轻量化推理框架。
LangChain / LangGraph(langchain-core > 0.1.0):用于构建和编排大模型应用的工作流框架,支持复杂链路与状态管理。
LlamaIndex(llama-index >= 0.7.0,llama-index-core >= 0.7.0):专注于把外部数据接入 LLM 的 RAG 框架,提供检索与索引能力。
传统 Python 组件与框架
完整的 支持列表

接入流程

注意:
如果服务部署在 TKE 集群中,同时集群安装了腾讯云 APM 的 operator,需要手动在工作负载中加入环境变量 OTEL_EXPORTER_METRICS_TEMPORALITY_PREFERENCE,值为 true。

获取接入点与 token

1. 登录 腾讯云可观测平台 控制台。
2. 在左侧菜单栏中选择应用性能监控,单击应用列表 > 接入应用
3. 在右侧弹出的数据接入抽屉框中,单击 Python 语言。
4. 接入 Python 应用页面,选择您所要接入的地域以及业务系统
5. 选择接入协议类型OpenTelemetry
6. 上报方式选择您所想要的上报方式,获取您的接入点Token
说明:
内网上报:使用此上报方式,您的服务需运行在腾讯云 VPC。通过 VPC 直接联通,在避免外网通信的安全风险同时,可以节省上报流量开销。
外网上报:当您的服务部署在本地或非腾讯云 VPC 内,可以通过此方式上报数据。请注意外网通信存在安全风险,同时也会造成一定上报流量费用。

安装 pip 包

通过pip命令安装腾讯云自研探针,其中包含 OpenTelemetry-SDK 的相关依赖。
pip install tapm-distro opentelemetry-exporter-otlp==1.34.1

tapm-bootstrap -a install

命令行方式上报

加上 tapm-instrument 前缀完成埋点和启动,假设原来的项目启动命令是python app.py,现在可以通过如下命令启动 Python 应用。
tapm-instrument --traces_exporter otlp \\
--metrics_exporter otlp \\
--logs_exporter none \\
--service_name <service_name> \\
--resource_attributes "token=<token>,host.name=<host.name>" \\
--exporter_otlp_endpoint <endpoint> \\
python app.py
对应的字段说明如下,请根据实际情况进行替换。
<service_name> :应用名,多个使用相同 serviceName 接入的应用进程,在 APM 中会表现为相同应用下的多个实例。应用名最长63个字符,只能包含小写字母、数字及分隔符“ - ”,且必须以小写字母开头,数字或小写字母结尾。
<token> :前置步骤中拿到业务系统 Token。
<host.name>:该实例的主机名,是应用实例的唯一标识,通常情况下可以设置为应用实例的 IP 地址。
<endpoint> :前置步骤中拿到的接入点。

接入验证

完成接入工作后,启动 LLM 应用,应用就会向 APM 上报链路数据。在 应用性能监控 > LLM 可观测 > 应用列表 页面将展示接入的应用。由于可观测数据的处理存在一定延时,如果接入后在控制台没有查询到应用或实例,请等待30秒左右。
同时,在 应用性能监控 > 链路追踪 中,也能够查询到相关的 Span 记录,通过单击第一列 traceID 对应的链接,可以进入链路详情视图分析链路的每个环节。


帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈