产品概述
产品定价
客户价值
应用场景
内置大模型 | 模型清单 | 推理资源推荐 | |
| | 机器来源:从 CVM 机器中选择(包年包月) | 机器来源:从 TIONE 平台购买(按量计费) |
Hunyuan-Large | hunyuan-large-chat | 部署方式:标准部署(开 nf4 量化) 【推荐配置1】 CVM 实例规格:PNV6.96XLARGE2304 CVM 实例配置:384C2304GB 8卡 推理资源配置:380C2214GB 8卡 【推荐配置2】 CVM 实例规格:HCCPNV4h.48XLARGE1024 CVM 实例配置:192核1024GB 8卡A100 推理资源配置: 189核980GB 8卡A100 | – |
DeepSeek 系列模型 | DeepSeek-V3 | 【单节点】 CVM 实例规格:PNV6.32XLARGE1280 CVM 实例配置:128C1280GB 8卡 部署方式:标准部署 推理资源配置:125C1207GB 8卡 【多节点】 CVM 实例规格:HCCPNV6.96XLARGE2304 CVM 实例配置:384C2304GB 8卡 部署方式:多机分布式部署 节点数量:2个 推理资源配置(每节点):380C2214GB 8卡 | 部署方式:标准部署 算力规格:128C1280GB GPU*8(PNV6.32XLARGE1280) |
| DeepSeek-R1 | 【单节点】 CVM 实例规格:PNV6.32XLARGE1280 CVM 实例配置:128C1280GB 8卡 部署方式:标准部署 推理资源配置:125C1207GB 8卡 【多节点】 CVM 实例规格:HCCPNV6.96XLARGE2304 CVM 实例配置:384C2304GB 8卡 部署方式:多机分布式部署 节点数量:2个 推理资源配置(每节点):380C2214GB 8卡 | 部署方式:标准部署 算力规格:128C1280GB GPU*8(PNV6.32XLARGE1280) |
| DeepSeek-R1-Distill-Qwen-1.5B | CVM 实例规格:GNV4.3XLARGE44 CVM 实例配置:12C44GB 1卡A10 部署方式:标准部署 推理资源配置:11C35GB 1卡A10 | 部署方式:标准部署 算力规格:12C44GB 1卡A10 |
| DeepSeek-R1-Distill-Qwen-7B | CVM 实例规格:GNV4.3XLARGE44 CVM 实例配置:12C44GB 1卡A10 部署方式:标准部署 推理资源配置:11C35GB 1卡A10 | 部署方式:标准部署 算力规格:12C44GB 1卡A10 |
| DeepSeek-R1-Distill-Llama-8B | CVM 实例规格:GNV4.3XLARGE44 CVM 实例配置:12C44GB 1卡A10 部署方式:标准部署 推理资源配置:11C35GB 1卡A10 | 部署方式:标准部署 算力规格:12C44GB 1卡A10 |
| DeepSeek-R1-Distill-Qwen-14B | 【推荐配置1】 CVM 实例规格:PNV6.4XLARGE160 CVM 实例配置:16C160GB 1卡GPU 推理资源配置:15C144GB 1卡GPU 【推荐配置2】 CVM 实例规格:PNV5b.8XLARGE96 CVM 实例配置:32C96GB 1卡PNV5b 推理资源配置: 30C80GB 1卡PNV5b 部署方式:标准部署 | 【推荐配置1】 部署方式:标准部署 算力规格:16C160GB GPU*1(PNV6.4XLARGE160) 【推荐配置2】 部署方式:标准部署 算力规格:32C96GB 1卡PNV5b |
| DeepSeek-R1-Distill-Qwen-32B | 【推荐配置1】 CVM 实例规格:PNV6.4XLARGE160 CVM 实例配置:16C160GB 1卡 推理资源配置:15C144GB 1卡 【推荐配置2】 CVM 实例规格:PNV5b.16XLARGE192 CVM 实例配置:64C192GB 2卡PNV5b 推理资源配置:62C172GB 2卡PNV5b 部署方式:标准部署 | 【推荐配置1】 部署方式:标准部署 算力规格:16C160GB GPU*1(PNV6.4XLARGE160) 【推荐配置2】 部署方式:标准部署 算力规格:64C192GB 2卡PNV5b |
| DeepSeek-R1-Distill-Llama-70B | 【推荐配置1】 CVM 实例规格:PNV6.8XLARGE320 CVM 实例配置1:32C320GB 2卡GPU 推理资源配置:31C290GB 2卡GPU 【推荐配置2】 CVM 实例规格:PNV5b.32XLARGE384 CVM 实例配置:128C384GB 4卡PNV5b 推理资源配置:125C350GB 4卡PNV5b 部署方式:标准部署 | 【推荐配置1】 部署方式:标准部署 算力规格:32C320GB GPU*2(PNV6.8XLARGE320) 【推荐配置2】 部署方式:标准部署 算力规格:128C384GB 4卡PNV5b |
Llama3.2 系列模型 | llama-3.2-1b-chat | CVM 实例规格:PNV4.7XLARGE116 CVM 实例配置:28C116GB 1卡A10 部署方式:标准部署 推理资源配置:24C96GB 1卡A10 | 部署方式:标准部署 算力规格:28核116GB 1卡A10 |
| llama-3.2-1b | CVM 实例规格:PNV4.7XLARGE116 CVM 实例配置:28C116GB 1卡A10 部署方式:标准部署 推理资源配置:24C96GB 1卡A10 | 部署方式:标准部署 算力规格:28核116GB 1卡A10 |
| llama-3.2-3b-chat | CVM 实例规格:PNV4.7XLARGE116 CVM 实例配置:28C116GB 1卡A10 部署方式:标准部署 推理资源配置:24C96GB 1卡A10 | 部署方式:标准部署 算力规格:28核116GB 1卡A10 |
| llama-3.2-3b | CVM 实例规格:PNV4.7XLARGE116 CVM 实例配置:28C116GB 1卡A10 部署方式:标准部署 推理资源配置:24C96GB 1卡A10 | 部署方式:标准部署 算力规格:28核116GB 1卡A10 |
| llama-3.2-11b-vision-chat | CVM 实例规格:PNV5b.8XLARGE96 CVM 实例配置:32C96GB 1卡PNV5b 推理资源配置: 30C80GB 1卡PNV5b 部署方式:标准部署 | 部署方式:标准部署 算力规格:32C96GB 1卡PNV5b |
| llama-3.2-90b-vision-chat | CVM 实例规格:PNV5b.64XLARGE768 CVM 实例配置:256C768GB 8卡PNV5b 推理资源配置: 250C688GB 8卡PNV5b 部署方式:标准部署 | 部署方式:标准部署 算力规格:256C768GB 8卡PNV5b |
Llama3.1 系列模型 | llama-3.1-8b-chat | CVM 实例规格:PNV4.7XLARGE116 CVM 实例配置:28C116GB 1卡A10 部署方式:标准部署 推理资源配置:24C96GB 1卡A10 | 部署方式:标准部署 算力规格:28核116GB 1卡A10 |
| llama-3.1-70b-chat | CVM 实例规格:PNV5b.64XLARGE768 CVM 实例配置:256C768GB 8卡PNV5b 推理资源配置: 250C688GB 8卡PNV5b 部署方式:标准部署 | 部署方式:标准部署 算力规格:256C768GB 8卡PNV5b |
| llama-3.1-8b-base | CVM 实例规格:PNV4.7XLARGE116 CVM 实例配置:28C116GB 1卡A10 部署方式:标准部署 推理资源配置:24C96GB 1卡A10 | 部署方式:标准部署 算力规格:28核116GB 1卡A10 |
| llama-3.1-70b-base | CVM 实例规格:PNV5b.64XLARGE768 CVM 实例配置:256C768GB 8卡PNV5b 推理资源配置: 250C688GB 8卡PNV5b 部署方式:标准部署 | 部署方式:标准部署 算力规格:256C768GB 8卡PNV5b |
Llama3 系列模型 | llama-3-8b-chat | CVM 实例规格:PNV4.7XLARGE116 CVM 实例配置:28C116GB 1卡A10 部署方式:标准部署 推理资源配置:24C96GB 1卡A10 | 部署方式:标准部署 算力规格:28核116GB 1卡A10 |
| llama-3-70b-chat | CVM 实例规格:PNV5b.64XLARGE768 CVM 实例配置:256C768GB 8卡PNV5b 推理资源配置: 250C688GB 8卡PNV5b 部署方式:标准部署 | 部署方式:标准部署 算力规格:256C768GB 8卡PNV5b |
| llama-3-8b-base | CVM 实例规格:PNV4.7XLARGE116 CVM 实例配置:28C116GB 1卡A10 部署方式:标准部署 推理资源配置:24C96GB 1卡A10 | 部署方式:标准部署 算力规格:28核116GB 1卡A10 |
| llama-3-70b-base | CVM 实例规格:PNV5b.64XLARGE768 CVM 实例配置:256C768GB 8卡PNV5b 推理资源配置: 250C688GB 8卡PNV5b 部署方式:标准部署 | 部署方式:标准部署 算力规格:256C768GB 8卡PNV5b |
Llama2 系列模型 | llama-2-7b-chat | CVM 实例规格:PNV4.7XLARGE116 CVM 实例配置:28C116GB 1卡A10 部署方式:标准部署 推理资源配置:24C96GB 1卡A10 | 部署方式:标准部署 算力规格:28核116GB 1卡A10 |
| llama-2-13b-chat | CVM 实例规格:PNV5b.8XLARGE96 CVM 实例配置:32C96GB 1卡PNV5b 推理资源配置: 30C80GB 1卡PNV5b 部署方式:标准部署 | 部署方式:标准部署 算力规格:32C96GB 1卡PNV5b |
| llama-2-70b-chat | CVM 实例规格:PNV5b.64XLARGE768 CVM 实例配置:256C768GB 8卡PNV5b 推理资源配置: 250C688GB 8卡PNV5b 部署方式:标准部署 | 部署方式:标准部署 算力规格:256C768GB 8卡PNV5b |
| llama-2-7b-base | CVM 实例规格:PNV4.7XLARGE116 CVM 实例配置:28C116GB 1卡A10 部署方式:标准部署 推理资源配置:24C96GB 1卡A10 | 部署方式:标准部署 算力规格:28核116GB 1卡A10 |
| llama-2-13b-base | CVM 实例规格:PNV5b.8XLARGE96 CVM 实例配置:32C96GB 1卡PNV5b 推理资源配置: 30C80GB 1卡PNV5b 部署方式:标准部署 | 部署方式:标准部署 算力规格:32C96GB 1卡PNV5b |
| llama-2-70b-base | CVM 实例规格:PNV5b.64XLARGE768 CVM 实例配置:256C768GB 8卡PNV5b 推理资源配置: 250C688GB 8卡PNV5b 部署方式:标准部署 | 部署方式:标准部署 算力规格:256C768GB 8卡PNV5b |
Baichuan2 系列模型 | baichuan2-7b-base | CVM 实例规格:PNV4.7XLARGE116 CVM 实例配置:28C116GB 1卡A10 部署方式:标准部署 推理资源配置:24C96GB 1卡A10 | 部署方式:标准部署 算力规格:28核116GB 1卡A10 |
| baichuan2-7b-chat | CVM 实例规格:PNV4.7XLARGE116 CVM 实例配置:28C116GB 1卡A10 部署方式:标准部署 推理资源配置:24C96GB 1卡A10 | 部署方式:标准部署 算力规格:28核116GB 1卡A10 |
| baichuan2-13b-base | CVM 实例规格:PNV5b.8XLARGE96 CVM 实例配置:32C96GB 1卡PNV5b 推理资源配置: 30C80GB 1卡PNV5b 部署方式:标准部署 | 部署方式:标准部署 算力规格:32C96GB 1卡PNV5b |
| baichuan2-13b-chat | CVM 实例规格:PNV5b.8XLARGE96 CVM 实例配置:32C96GB 1卡PNV5b 推理资源配置: 30C80GB 1卡PNV5b 部署方式:标准部署 | 部署方式:标准部署 算力规格:32C96GB 1卡PNV5b |
Chatglm 系列模型 | chatglm3-6b-chat | CVM 实例规格:PNV4.7XLARGE116 CVM 实例配置:28C116GB 1卡A10 部署方式:标准部署 推理资源配置:24C96GB 1卡A10 | 部署方式:标准部署 算力规格:28核116GB 1卡A10 |
Qwen系列模型 | qwen-14b-base | CVM 实例规格:PNV5b.8XLARGE96 CVM 实例配置:32C96GB 1卡PNV5b 推理资源配置: 30C80GB 1卡PNV5b 部署方式:标准部署 | 部署方式:标准部署 算力规格:32C96GB 1卡PNV5b |
| qwen-14b-chat | CVM 实例规格:PNV5b.8XLARGE96 CVM 实例配置:32C96GB 1卡PNV5b 推理资源配置: 30C80GB 1卡PNV5b 部署方式:标准部署 | 部署方式:标准部署 算力规格:32C96GB 1卡PNV5b |
Bloom 系列模型 | bloom-7b-chat | CVM 实例规格:PNV4.7XLARGE116 CVM 实例配置:28C116GB 1卡A10 部署方式:标准部署 推理资源配置:24C96GB 1卡A10 | 部署方式:标准部署 算力规格:28核116GB 1卡A10 |
| bloomz-7b1-chat | CVM 实例规格:PNV4.7XLARGE116 CVM 实例配置:28C116GB 1卡A10 部署方式:标准部署 推理资源配置:24C96GB 1卡A10 | 部署方式:标准部署 算力规格:28核116GB 1卡A10 |
| bloom-1b1-chat | CVM 实例规格:PNV4.7XLARGE116 CVM 实例配置:28C116GB 1卡A10 部署方式:标准部署 推理资源配置:24C96GB 1卡A10 | 部署方式:标准部署 算力规格:28核116GB 1卡A10 |
| bloom-3b-chat | CVM 实例规格:PNV4.7XLARGE116 CVM 实例配置:28C116GB 1卡A10 部署方式:标准部署 推理资源配置:24C96GB 1卡A10 | 部署方式:标准部署 算力规格:28核116GB 1卡A10 |
| bloomz-3b-chat | CVM 实例规格:PNV4.7XLARGE116 CVM 实例配置:28C116GB 1卡A10 部署方式:标准部署 推理资源配置:24C96GB 1卡A10 | 部署方式:标准部署 算力规格:28核116GB 1卡A10 |
金融行业大模型 | jinrong-13b-chat | CVM 实例规格:PNV5b.8XLARGE96 CVM 实例配置:32C96GB 1卡PNV5b 推理资源配置: 30C80GB 1卡PNV5b 部署方式:标准部署 | 部署方式:标准部署 算力规格:32C96GB 1卡PNV5b |
汽车行业大模型 | qiche-13b-chat | CVM 实例规格:PNV5b.8XLARGE96 CVM 实例配置:32C96GB 1卡PNV5b 推理资源配置: 30C80GB 1卡PNV5b 部署方式:标准部署 | 部署方式:标准部署 算力规格:32C96GB 1卡PNV5b |
Baichuan1 系列模型 | baichuan-7b-chat | CVM 实例规格:PNV4.7XLARGE116 CVM 实例配置:28C116GB 1卡A10 部署方式:标准部署 推理资源配置:24C96GB 1卡A10 | 部署方式:标准部署 算力规格:28核116GB 1卡A10 |
| baichuan-13b-chat | CVM 实例规格:PNV5b.8XLARGE96 CVM 实例配置:32C96GB 1卡PNV5b 推理资源配置: 30C80GB 1卡PNV5b 部署方式:标准部署 | 部署方式:标准部署 算力规格:32C96GB 1卡PNV5b |
Dolly 系列模型 | dolly-v2-3b-chat | CVM 实例规格:PNV4.7XLARGE116 CVM 实例配置:28C116GB 1卡A10 部署方式:标准部署 推理资源配置:24C96GB 1卡A10 | 部署方式:标准部署 算力规格:28核116GB 1卡A10 |
| dolly-v2-7b-chat | CVM 实例规格:PNV4.7XLARGE116 CVM 实例配置:28C116GB 1卡A10 部署方式:标准部署 推理资源配置:24C96GB 1卡A10 | 部署方式:标准部署 算力规格:28核116GB 1卡A10 |
| dolly-v2-12b-chat | CVM 实例规格:PNV5b.8XLARGE96 CVM 实例配置:32C96GB 1卡PNV5b 推理资源配置: 30C80GB 1卡PNV5b 部署方式:标准部署 | 部署方式:标准部署 算力规格:32C96GB 1卡PNV5b |
Vicuna 系列模型 | vicuna-7b-v1.5-chat | CVM 实例规格:PNV4.7XLARGE116 CVM 实例配置:28C116GB 1卡A10 部署方式:标准部署 推理资源配置:24C96GB 1卡A10 | 部署方式:标准部署 算力规格:28核116GB 1卡A10 |
| vicuna-13b-v1.5-chat | CVM 实例规格:PNV5b.8XLARGE96 CVM 实例配置:32C96GB 1卡PNV5b 推理资源配置: 30C80GB 1卡PNV5b 部署方式:标准部署 | 部署方式:标准部署 算力规格:32C96GB 1卡PNV5b |
Falcon 系列模型 | falcon-7b-base | CVM 实例规格:PNV4.7XLARGE116 CVM 实例配置:28C116GB 1卡A10 部署方式:标准部署 推理资源配置:24C96GB 1卡A10 | 部署方式:标准部署 算力规格:28核116GB 1卡A10 |
| falcon-7b-chat | CVM 实例规格:PNV4.7XLARGE116 CVM 实例配置:28C116GB 1卡A10 部署方式:标准部署 推理资源配置:24C96GB 1卡A10 | 部署方式:标准部署 算力规格:28核116GB 1卡A10 |
| falcon-rw-7b-base | CVM 实例规格:PNV4.7XLARGE116 CVM 实例配置:28C116GB 1卡A10 部署方式:标准部署 推理资源配置:24C96GB 1卡A10 | 部署方式:标准部署 算力规格:28核116GB 1卡A10 |
Chinese-alpaca 系列模型 | chinese-alpaca-2-7b-chat | CVM 实例规格:PNV4.7XLARGE116 CVM 实例配置:28C116GB 1卡A10 部署方式:标准部署 推理资源配置:24C96GB 1卡A10 | 部署方式:标准部署 算力规格:28核116GB 1卡A10 |
文档反馈