tencent cloud

腾讯云 TI 平台

产品简介
产品概述
产品定价
客户价值
应用场景
购买指南
计费概述
购买方式
续费说明
欠费说明
安全合规
数据安全保护机制
监控、审计与日志
安全合规资质
快速入门
平台使用准备
操作指南
大模型广场
任务式建模
开发机
模型管理
模型评测
在线服务
资源组管理
数据源管理
Tikit
GPU 虚拟化
实践教程
LLM 部署及推理
LLM 训练及评测
内置训练镜像列表
自定义训练镜像规范
Angel 训练加速功能介绍
基于标签实现子用户间资源隔离
相关协议
TI Platform 隐私协议
TI Platform 数据处理和安全协议
开源软件信息
联系我们

在线服务简介

PDF
聚焦模式
字号
最后更新时间: 2025-05-09 15:11:04

模块概述

TI-ONE 的在线服务模块,提供将模型部署为在线推理服务的能力,供用户通过 API 接口调用的方式对接自身业务应用。在线服务支持虚拟化异构算力和弹性扩缩容能力,帮助用户解决模型部署复杂、资源浪费、手工扩展资源效率低下等问题。同时,在线服务还支持部署多种模型格式、支持服务流量分配与滚动更新,以支撑在线推理场景中的多元应用诉求。

模块特点

算力虚拟化:支持为服务分配小至0.1卡 GPU 算力,通过细粒度算力分配,让您随时随地享受高性价比服务体验。
自动弹性扩缩容:您可以选择手动或自动调整弹性实例扩展策略,模型部署会根据业务负载情况,动态实时自动管理实例数量,帮助您以最合适的实例数量应对业务情况,免去人工部署负担。
丰富的管理能力:提供丰富的多模型支持、多版本管理、流量分配、滚动更新等能力,支持服务及调用信息的多维度监控及事件查看,为您的各类业务保驾护航。

应用场景

支持用户将推荐、图像处理、自然语言处理、语音识别等各类机器学习场景的模型部署为在线服务。

帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈