tencent cloud

数据加速器 GooseFS

动态与公告
产品动态
产品选型指引
GooseFSx
产品简介
快速入门
购买指南
控制台指南
工具指南
实践教程
Service Level Agreement
词汇表
GooseFS
产品简介
计费概述
快速入门
核心特性
控制台指南
开发者指南
客户端工具
集群配置实践
数据安全
Service Level Agreement
GooseFS-Lite
GooseFS-Lite 工具
实践教程
在 Kubernetes 中使用 GooseFS 加速 Spark 数据访问
使用 GooseFS 以原生 POSIX 语义访问存储桶
GooseFS Distributedload 调优实践
常见问题

应用场景

PDF
聚焦模式
字号
最后更新时间: 2025-07-17 17:42:48

开源生态数据湖

客户基于开源 Hadoop 生态构建大数据处理与分析,会面临计算资源与存储资源扩容速度不匹配、存储系统需对接多数据源的问题。

推荐产品

推荐数据加速器 GooseFS。

主要能力

计算存储分离 通过计算与存储分离,实现计算资源弹性伸缩,满足客户对计算资源的灵活调度。
多数据源支持 可对接多种数据源,允许存储任意规模的结构化、半结构化、非结构化数据。
高性能业务架构 通过数据加速器(Data Accelerator Goose FileSystem,GooseFS)、元数据加速器、AZ 加速器等多级加速服务,提升计算业务访问性能。

交互式查询数据湖

客户在对象存储(Cloud Object Storage,COS)中存储了多种数据源数据,包括实时计算数据,需要对其中的数据进行 OLAP 分析并进行数据可视化展示。

主要能力

多数据源支持 可对接多种数据源,允许存储任意规模的结构化、半结构化、非结构化数据。
性能加速 通过数据加速器、元数据加速器、AZ 加速器等多级加速服务,实现超越本地 HDFS 的性能。

机器学习数据湖

在经典机器学习场景中,训练数据量大,同时要求很大的内网带宽。

主要能力

超大带宽 可以提供超大的内网带宽,满足机器学习场景大带宽需求。
多数据源支持 可对接多种数据源,允许存储任意规模的结构化、半结构化、非结构化数据。
性能加速 通过数据加速器、元数据加速器、AZ 加速器等多级加速服务,实现超越本地 HDFS 的性能。

云原生数据湖

通过容器服务,结合 Flink、TensorFlow 等开源应用,搭建云原生数据 ETL 集群和分析集群,实现计算资源的弹性化;通过数据加速器、元数据加速器、AZ 加速器等多级加速服务,提升计算业务访问性能;通过对象存储服务作为数据湖存储底座,实现海量异构数据的低成本存储。

主要能力

计算存储分离 通过计算与存储分离,实现计算资源弹性伸缩,满足客户对计算资源的灵活调度。
高性能业务架构 通过数据加速器、元数据加速器、AZ 加速器等多级加速服务,提升计算业务访问性能。
丰富生态支持 可存储 Parquet、ORC 多种格式数据源,支持 Spark、Presto、Flink 等多种大数据插件。

帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈