tencent cloud

GPU 云服务器
GPU 云服务器(Cloud GPU Service)是提供 GPU 算力的弹性计算服务,具有超强的并行计算能力。作为 IaaS 层强大的计算基础工具,能提供深度学习训练、科学计算、图形图像处理、视频编解码等场景的超强计算能力。
为什么选择腾讯云 GPU 云服务器
极致并行计算能力
具有超强的并行计算能力,致力于提升您的业务效率与竞争力。
极致并行计算能力
具有超强的并行计算能力,致力于提升您的业务效率与竞争力。
环境极速部署
帮助您快速搭建部署环境,自动安装 GPU 驱动、CUDA 及 cuDNN,并提供预装驱动镜像。
环境极速部署
帮助您快速搭建部署环境,自动安装 GPU 驱动、CUDA 及 cuDNN,并提供预装驱动镜像。
原生加速引擎
结合腾讯云自研计算加速引擎 TACO Kit,开箱即用,加速分布式训练和推理。
原生加速引擎
结合腾讯云自研计算加速引擎 TACO Kit,开箱即用,加速分布式训练和推理。
场景解决方案
全真互联解决方案
渲染解决方案
游戏直播鉴黄解决方案
自动驾驶解决方案
全真互联解决方案
面向渲染、游戏、虚拟人、NFT 艺术品等场景
客户痛点
为了提供高沉浸感和逼真的体验,虚拟世界依赖强大的计算能力进行渲染和其他高负载工作。然而,大多数手机和终端设备没有足够的硬件性能来支持高强度的渲染。此外,包含所需渲染引擎和各种素材的软件包往往达到数千兆字节,占用用户设备的大量存储空间。
解决方案
依托腾讯云强大的 GPU 算力,该解决方案集成了企业级渲染、基于 qGPU 的容器级资源切分和虚拟化技术、视频编解码技术以及云流化方案。它在云端提供高算力进行渲染,终端用户只需连接网络即可访问高性能渲染服务。这释放了终端设备的资源和存储空间,并提供了流畅的云边一体化体验。
上云价值
基于云原生的解决方案允许灰度发布和快速启动业务。弹性伸缩功能让您可以调度海量资源,轻松扩展业务以适应高峰和低谷时段。结合具有 GPU 算力和显存隔离功能的 qGPU 虚拟化共享技术,可以大大提高 GPU 利用率,同时降低企业成本。新一代 GPU 云服务器提供高密度编码算力和更高的网络性能。携手 NVIDIA,打造中国首个一站式 CloudXR 解决方案,保证 VR 应用的流畅、轻量级用户体验。
渲染解决方案
简单易用,自动化流程,全方位监控
客户痛点
在影视、广告、建筑规划等行业,内容创作者和后期制作团队依赖大量机器来完成与视觉特效、3D 动画和设计草图相关的渲染工作。传统的 IDC 资源往往难以满足偶尔出现的峰值高渲染需求,而在低谷期闲置资源又会被浪费。这意味着前期投入成本非常高,而投资回报慢,使得企业业务难以扩展。
解决方案
腾讯云提供多种专业的 GPU 渲染实例,结合批量计算(BatchCompute),使团队能够自动化其内容渲染工作流。创意和技术专业人员可以利用 GPU 云服务器的海量计算资源和批量计算的作业调度能力,构建自己的渲染依赖流程,更高效地完成视觉创作项目。
上云价值
GPU 云服务器允许您快速创建和管理集群,选择所需的 GPU 型号和数量,以完全满足您的渲染需求。作业可配置、易于使用且可复用。您可以在云端设置专门针对您的流程和渲染逻辑的作业流。GPU 云服务器提供多维度的作业和资源监控系统,无需担心 IaaS 层的运维问题。
游戏直播鉴黄解决方案
快速扩容,满足业务需求
客户痛点
业务不断增长,自建集群扩容周期长,难以支撑日益增长的视频审核任务。自建集群硬件设备老旧,计算、存储和网络性能已无法满足业务对高并发、低延迟的要求。
解决方案
大规模 GPU 推理集群支持海量数据样本。集群可快速扩容,支撑高并发请求,消除性能瓶颈。高性能训练集群配合 Turbo 高吞吐存储,快速训练和迭代模型,提高视频审核准确率及审核成功率。
上云价值
GPU 云服务器支持弹性伸缩,您可以根据当前业务需求快速调整服务规模。您可以按需购买和使用算力,从而大幅降低前期投入成本。
自动驾驶解决方案
以最具成本效益的方式处理海量数据
客户痛点
自动驾驶系统通过车载传感器和摄像头收集数据,每天产生数 TB 的数据。这些海量数据需要快速分析处理并持久存储。因此,需要一个具有高 IOPS、高性能存储和高带宽网络基础设施的大规模计算集群,以充分满足标注、训练和仿真等不同阶段的计算和存储需求。
解决方案
GPU 云服务器提供基于强大 V100 和 A100 GPU 的 CPM 高性能计算集群,能够支撑自动驾驶系统所需的高性能计算。高性能计算集群支持 100 GiB RDMA 网络互联。它可以配合 GooseFS 提高用于训练的大规模分布式集群的效率。COS 以跨基础设施、多设备和冗余的方式存储数据,并提供异地容灾和资源隔离能力,保证数据的持久性和安全性。
上云价值
GPU 云服务器允许您利用高弹性且极具成本效益的存储运行大规模并行仿真。它提供全链路服务,使汽车制造商和研发团队能够以更低的成本更快地开发和优化自动驾驶技术。
规格推荐
深度学习推理
深度学习训练
科学计算
视频编解码
图形工作站
竞价实例
Intel Xeon Cascade Lake 8255C(2.5 GHz) + NVIDIA® Tesla T4
CPU
8 核
内存
32GB
GPU
1
收发包能力
60 万 PPS
$0.204/小时
按量计费
GPU 计算型 GN10Xp
Intel Xeon Cascade Lake 8255C(2.5 GHz) + NVIDIA® Tesla® V100 NVLink 32GB
CPU
80 核
内存
320GB
GPU
8
收发包能力
490 万 PPS
$23.54/小时
按量计费
GPU 计算型 GN10Xp
Intel Xeon Cascade Lake 8255C(2.5 GHz) + NVIDIA® Tesla® V100 NVLink 32GB
CPU
80 核
内存
320GB
GPU
8
收发包能力
490 万 PPS
$23.54/小时
竞价实例
GPU 计算型 GN7
Intel Xeon Cascade Lake 8255C(2.5 GHz) + NVIDIA® Tesla T4
CPU
8 核
内存
32GB
GPU
1
收发包能力
60 万 PPS
$0.204/小时
竞价实例
GPU 渲染型 GN7vw
Intel Xeon Cascade Lake 8255C(2.5 GHz) + NVIDIA® Tesla T4
CPU
16 核
内存
64GB
GPU
1
收发包能力
150 万 PPS
$0.242/小时
资源与文档
快速入门
安装 CUBA / NVIDIA 快速入门
计算型实例
GPU 计算型实例提供强大的计算能力,帮助您实时处理大量并发计算任务。
渲染型实例
GPU 渲染型实例支持基于 GPU 的传统图形和图像处理,如 3D 渲染。它们提供快速、稳定、弹性的计算服务,管理方式与 CVM 实例相同。
常见问题

常见问题

一般性问题
计费类
网络类
存储类
地域与可用区
安全类
镜像类
什么场景下应该使用 GPU 实例?

GPU 具有比 CPU 更多的算术逻辑单元(ALU),支持大规模多线程并行计算。它最适合以下场景:

  • AI 计算:深度学习推理和训练。
  • 图形图像处理:云游戏、云手机、云桌面和 CloudXR。
  • 高性能计算:流体力学、分子建模、气象工程、地震分析、基因组学等。
如何选择 GPU 实例型号?

您需要根据您的使用场景选择实例型号:

  • AI 训练:GN10Xp、GN10X、GT4、GN8 和 GN6/GN6S
  • AI 推理:GN7、GN10Xp、GN10X、PNV4、GI3X、GN6 和 GN6S
  • 图形图像处理:GN7vw、GNV4、GNV4v 和 GI1
  • 科学计算:GN10Xp、GN10X、GT4 和 GI3X
  • 更多信息,请参阅 计算型实例渲染型实例
如何根据实例型号和场景选择驱动?

NVIDIA GPU 实例型号包括物理直通实例(拥有完整 GPU)和 vGPU 实例(没有完整 GPU,如 1/4 GPU)。

物理直通实例上的 GPU 可以使用 Tesla 或 GRID 驱动(部分型号不支持 GRID 驱动)在不同场景下加速计算。

vGPU 只能使用特定版本的 GRID 驱动来加速计算。

有关如何在 NVIDIA GPU 实例上安装驱动的详细指南,请参阅 安装 NVIDIA Tesla 驱动

GPU 云服务器是否支持调整实例配置?

GPU 实例型号 PNV4、GT4、GN10X、GN10Xp、GN6、GN6S、GN7、GN8、GNV4v、GNV4、GN7vw 和 GI1 支持在同一实例族内调整配置,而 GI3X 不支持调整实例配置。

购买实例时如果资源售罄怎么办?

您可以尝试以下方法:

  • 更换地域
  • 更换可用区
  • 更改资源配置

如果问题仍然存在,请 联系我们

GPU 实例如何计费?

GPU 实例采用按量计费模式,按秒计费,按小时结算。您可以随时购买或释放实例。更多信息,请参阅 价格总览

如何获取 GPU 实例的预估价格?

购买 GPU 实例时,您可以在 价格计算器 中查看预估价格。

GPU 实例的内网 IP 和公网 IP 有什么区别?

内网 IP 是为源 IP 来自内网的客户端提供服务的连接地址。公网 IP 是为源 IP 来自公网的客户端实现公网通信的连接地址。它们可以通过网络地址转换直接相互映射。同一地域的 GPU 实例可以通过内网通信,而不同地域的实例只能通过公网通信。

什么是弹性公网 IP (EIP)?

EIP 是专为动态云计算设计的静态 IP。它是地域特定的。您可以快速将 EIP 重新映射到账户下的另一个 GPU 实例(或 CVM/NAT 网关实例),以屏蔽实例故障。更多信息,请参阅 弹性公网 IP

GPU 云服务器提供哪些存储选项?

腾讯云为 GPU 实例提供不同类型的数据存储选项,包括云硬盘、本地盘、COS 和块存储设备映射。不同选项在性能和价格上有所不同,适用于不同的使用场景。更多信息,请参阅 存储概述

CPM GPU 实例提供哪些存储选项?

部分 CPM GPU 实例型号支持本地存储,您也可以根据需要使用远程存储。

1. 本地存储

特定 CPM GPU 实例配备 NVMe SSD 硬盘,具有卓越的读写性能,是普通型号的三倍,从而保证高性能计算作业的稳定性。

2. 远程存储

CFS:您可以通过智能网卡技术挂载 Turbo CFS,实现存储容量的灵活扩展,并保证三副本的强一致性。

COS:COS 配合 GooseFS 的分布式集群架构,提高数据局部性,并利用高速缓存特性提升存储性能,增加写入 COS 的带宽。

如何备份 GPU 实例中的数据?

1. 如果您的 GPU 实例使用云硬盘,您可以通过创建自定义系统盘镜像和数据盘快照来备份业务数据。

2. 如果您的 GPU 实例使用本地盘,您可以通过创建自定义系统盘镜像来备份业务数据。但是,您需要为数据盘中的业务数据定制备份策略。通常,您可以通过 FTP 备份 GPU 实例中的数据。有关 FTP 部署的更多信息,请参阅以下文档:

3. 此外,如果您需要高数据安全性,可以购买更专业的第三方自定义备份服务。

什么是地域?

腾讯云地域完全隔离。这保证了最大的跨地域稳定性和容错能力。我们将逐步在更多地域部署节点以实现更广泛的覆盖。我们建议您选择最接近终端用户的地域,以最大限度地减少访问延迟并提高下载速度。有关支持地域的更多信息,请参阅 地域和可用区

如何选择合适的地域?

建议选择最接近您用户的地域,并为您的 GPU 实例选择相同的地域,以便通过内网进行通信。

  • 靠近用户:选择地理位置上接近您用户的地域,可以减少访问延迟并提高访问速度。例如,如果您的用户主要分布在东南亚附近,新加坡或泰国将是不错的选择。
  • 同地域通信:同一地域内的 GPU 实例可以通过内网免费通信。当它们位于不同地域时,只能通过公网通信,这会产生费用。要使实例能够通过内网通信,必须为它们选择相同的地域。
可用区之间是如何隔离的?

每个可用区(AZ)都在其独立且物理隔离的基础设施上运行,旨在高度可靠。可用区之间不共享供电设备和冷却设备等常见易损设备。此外,它们在物理上相互独立,因此如果发生火灾、龙卷风或洪水等自然灾害,只有该位置的可用区会受到影响,而其他可用区仍可正常运行。

哪里可以找到更多关于安全的信息?

腾讯云提供各种网络和安全服务,如安全组、加密登录和 EIP,以确保您的实例安全、高效和自由运行。有关 GPU 安全的更多信息,请参阅 网络与安全概述

如何防止他人查看我的系统?

您可以通过将 GPU 实例添加到安全组来控制对其的访问。您还可以配置跨 安全组 的通信,并指定哪些 IP 子网可以与您的实例通信。

如何排查安全问题?

当检测到安全风险时,您可以按照 安全违规处理指南 中的说明排查问题,并按照主机安全中的说明进行解决。

GPU 云服务器是否提供预装 GPU 驱动的镜像?

如果您选择 vGPU 或渲染实例,您可以在购买页面的“公共镜像”中选择预装 GRID 驱动的镜像。

有哪些类型的镜像可用?

腾讯云提供公共镜像、共享镜像和自定义镜像。更多信息,请参阅 镜像类型。您可以根据不同的特性选择合适的镜像。

什么是共享镜像?

您可以与其他用户共享自定义镜像,或获取他人共享的镜像。有关共享镜像的限制和使用的更多信息,请参阅共享自定义镜像。

我可以与多少个用户共享镜像?

一个镜像最多可以共享给 50 个用户。共享镜像不计入您自己的镜像配额。

常见问题

常见问题

一般性问题
计费类
网络类
存储类
地域与可用区
安全类
镜像类
什么场景下应该使用 GPU 实例?

GPU 具有比 CPU 更多的算术逻辑单元(ALU),支持大规模多线程并行计算。它最适合以下场景:

  • AI 计算:深度学习推理和训练。
  • 图形图像处理:云游戏、云手机、云桌面和 CloudXR。
  • 高性能计算:流体力学、分子建模、气象工程、地震分析、基因组学等。
如何选择 GPU 实例型号?

您需要根据您的使用场景选择实例型号:

  • AI 训练:GN10Xp、GN10X、GT4、GN8 和 GN6/GN6S
  • AI 推理:GN7、GN10Xp、GN10X、PNV4、GI3X、GN6 和 GN6S
  • 图形图像处理:GN7vw、GNV4、GNV4v 和 GI1
  • 科学计算:GN10Xp、GN10X、GT4 和 GI3X
  • 更多信息,请参阅 计算型实例渲染型实例
如何根据实例型号和场景选择驱动?

NVIDIA GPU 实例型号包括物理直通实例(拥有完整 GPU)和 vGPU 实例(没有完整 GPU,如 1/4 GPU)。

物理直通实例上的 GPU 可以使用 Tesla 或 GRID 驱动(部分型号不支持 GRID 驱动)在不同场景下加速计算。

vGPU 只能使用特定版本的 GRID 驱动来加速计算。

有关如何在 NVIDIA GPU 实例上安装驱动的详细指南,请参阅 安装 NVIDIA Tesla 驱动

GPU 云服务器是否支持调整实例配置?

GPU 实例型号 PNV4、GT4、GN10X、GN10Xp、GN6、GN6S、GN7、GN8、GNV4v、GNV4、GN7vw 和 GI1 支持在同一实例族内调整配置,而 GI3X 不支持调整实例配置。

购买实例时如果资源售罄怎么办?

您可以尝试以下方法:

  • 更换地域
  • 更换可用区
  • 更改资源配置

如果问题仍然存在,请 联系我们

GPU 实例如何计费?

GPU 实例采用按量计费模式,按秒计费,按小时结算。您可以随时购买或释放实例。更多信息,请参阅 价格总览

如何获取 GPU 实例的预估价格?

购买 GPU 实例时,您可以在 价格计算器 中查看预估价格。

GPU 实例的内网 IP 和公网 IP 有什么区别?

内网 IP 是为源 IP 来自内网的客户端提供服务的连接地址。公网 IP 是为源 IP 来自公网的客户端实现公网通信的连接地址。它们可以通过网络地址转换直接相互映射。同一地域的 GPU 实例可以通过内网通信,而不同地域的实例只能通过公网通信。

什么是弹性公网 IP (EIP)?

EIP 是专为动态云计算设计的静态 IP。它是地域特定的。您可以快速将 EIP 重新映射到账户下的另一个 GPU 实例(或 CVM/NAT 网关实例),以屏蔽实例故障。更多信息,请参阅 弹性公网 IP

GPU 云服务器提供哪些存储选项?

腾讯云为 GPU 实例提供不同类型的数据存储选项,包括云硬盘、本地盘、COS 和块存储设备映射。不同选项在性能和价格上有所不同,适用于不同的使用场景。更多信息,请参阅 存储概述

CPM GPU 实例提供哪些存储选项?

部分 CPM GPU 实例型号支持本地存储,您也可以根据需要使用远程存储。

1. 本地存储

特定 CPM GPU 实例配备 NVMe SSD 硬盘,具有卓越的读写性能,是普通型号的三倍,从而保证高性能计算作业的稳定性。

2. 远程存储

CFS:您可以通过智能网卡技术挂载 Turbo CFS,实现存储容量的灵活扩展,并保证三副本的强一致性。

COS:COS 配合 GooseFS 的分布式集群架构,提高数据局部性,并利用高速缓存特性提升存储性能,增加写入 COS 的带宽。

如何备份 GPU 实例中的数据?

1. 如果您的 GPU 实例使用云硬盘,您可以通过创建自定义系统盘镜像和数据盘快照来备份业务数据。

2. 如果您的 GPU 实例使用本地盘,您可以通过创建自定义系统盘镜像来备份业务数据。但是,您需要为数据盘中的业务数据定制备份策略。通常,您可以通过 FTP 备份 GPU 实例中的数据。有关 FTP 部署的更多信息,请参阅以下文档:

3. 此外,如果您需要高数据安全性,可以购买更专业的第三方自定义备份服务。

什么是地域?

腾讯云地域完全隔离。这保证了最大的跨地域稳定性和容错能力。我们将逐步在更多地域部署节点以实现更广泛的覆盖。我们建议您选择最接近终端用户的地域,以最大限度地减少访问延迟并提高下载速度。有关支持地域的更多信息,请参阅 地域和可用区

如何选择合适的地域?

建议选择最接近您用户的地域,并为您的 GPU 实例选择相同的地域,以便通过内网进行通信。

  • 靠近用户:选择地理位置上接近您用户的地域,可以减少访问延迟并提高访问速度。例如,如果您的用户主要分布在东南亚附近,新加坡或泰国将是不错的选择。
  • 同地域通信:同一地域内的 GPU 实例可以通过内网免费通信。当它们位于不同地域时,只能通过公网通信,这会产生费用。要使实例能够通过内网通信,必须为它们选择相同的地域。
可用区之间是如何隔离的?

每个可用区(AZ)都在其独立且物理隔离的基础设施上运行,旨在高度可靠。可用区之间不共享供电设备和冷却设备等常见易损设备。此外,它们在物理上相互独立,因此如果发生火灾、龙卷风或洪水等自然灾害,只有该位置的可用区会受到影响,而其他可用区仍可正常运行。

哪里可以找到更多关于安全的信息?

腾讯云提供各种网络和安全服务,如安全组、加密登录和 EIP,以确保您的实例安全、高效和自由运行。有关 GPU 安全的更多信息,请参阅 网络与安全概述

如何防止他人查看我的系统?

您可以通过将 GPU 实例添加到安全组来控制对其的访问。您还可以配置跨 安全组 的通信,并指定哪些 IP 子网可以与您的实例通信。

如何排查安全问题?

当检测到安全风险时,您可以按照 安全违规处理指南 中的说明排查问题,并按照主机安全中的说明进行解决。

GPU 云服务器是否提供预装 GPU 驱动的镜像?

如果您选择 vGPU 或渲染实例,您可以在购买页面的“公共镜像”中选择预装 GRID 驱动的镜像。

有哪些类型的镜像可用?

腾讯云提供公共镜像、共享镜像和自定义镜像。更多信息,请参阅 镜像类型。您可以根据不同的特性选择合适的镜像。

什么是共享镜像?

您可以与其他用户共享自定义镜像,或获取他人共享的镜像。有关共享镜像的限制和使用的更多信息,请参阅共享自定义镜像。

我可以与多少个用户共享镜像?

一个镜像最多可以共享给 50 个用户。共享镜像不计入您自己的镜像配额。

专业产业咨询
助力企业上云和数字化转型,释放无限潜能