tencent cloud

弹性 MapReduce

动态与公告
产品动态
产品公告
安全公告
产品简介
产品概述
产品优势
产品架构
产品功能
应用场景
约束与限制
技术支持范围
产品发行版
购买指南
EMR on CVM 计费说明
EMR on TKE 计费说明
EMR Serverless HBase 计费说明
快速入门
EMR on CVM 快速入门
EMR on TKE 快速入门
EMR on CVM 操作指南
规划集群
管理权限
配置集群
管理集群
管理服务
监控告警
智能管家
EMR on TKE 操作指南
EMR on TKE 简介
配置集群
管理集群
管理服务
监控运维
应用分析
EMR Serverless HBase 操作指南
EMR Serverless HBase 产品简介
配额与限制
规划实例
管理实例
监控告警
开发指南
EMR 开发指南
Hadoop开发指南
Spark 开发指南
HBASE开发指南
Phoenix on Hbase 开发指南
Hive 开发指南
Presto开发指南
Sqoop 开发指南
Hue 开发指南
Oozie 开发指南
Flume 开发指南
Kerberos 开发指南
Knox 开发指南
Alluxio 开发指南
Kylin 开发指南
Livy 开发指南
Kyuubi 开发指南
Zeppelin 开发指南
Hudi 开发指南
Superset 开发指南
Impala 开发指南
Druid 开发指南
Tensorflow 开发指南
Kudu 开发指南
Ranger 开发指南
Kafka 开发指南
Iceberg 开发指南
StarRocks 开发指南
Flink 开发指南
JupyterLab 开发指南
MLflow 开发指南
实践教程
EMR on CVM 运维实践
数据迁移实践
自定义伸缩实践教程
API 文档
History
Introduction
API Category
Cluster Resource Management APIs
Cluster Services APIs
User Management APIs
Data Inquiry APIs
Scaling APIs
Configuration APIs
Other APIs
Serverless HBase APIs
YARN Resource Scheduling APIs
Making API Requests
Data Types
Error Codes
常见问题
EMR on CVM常见问题
服务等级协议
联系我们

Alluxio 支持 COS 透明 URI

PDF
聚焦模式
字号
最后更新时间: 2025-01-03 14:56:32
Alluxio 用户通常具有通过现有应用程序访问其底层存储系统(Under-FileSystem),将 Alluxio 添加到现有的生态系统中需求,但现有应用程序必须更改是需要在应用程序使用 Alluxio 的 URI。透明 URI 功能允许用户访问现有存储系统,且无需在应用程序级别更改 URI。

支持版本与配置 URI

1. 服务组件支持版本:Alluxio2.8.0版本。
2. 产品版本:Hadoop3.x 标准版本 EMR-V3.4.0 版本。
3. 配置支持透明 URI。使用 Alluxio 透明 URI,需要配置新的 Hadoop 兼容文件系统客户端实现。只要将客户端配置为接收外部 URI,此新的 ShimFileSystem 就会替换现有的 FileSystem。Hadoop 兼容的计算框架--Hadoop FileSystem 接口定义了从 FileSystem 方案到 FileSystem 实现的映射。为了配置 ShimFileSystem,请确保 core-site.xml 中配置了以下配置项:
配置项
配置项值
fs.cosn.impl
alluxio.hadoop.ShimFileSystem
4. Alluxio 在兼容透明 URL Schema 时需要对其进行转换兼容,请确保 alluxio-site.properties 中配置了以下配置项:
配置项
配置项值
alluxio.master.uri.translator.impl
alluxio.master.file.uritranslator.AutoMountUriTranslator
alluxio.user.shimfs.bypass.ufs.impl.list
fs.cosn.impl:org.apache.hadoop.fs.cosnative.NativeCosFileSystem
说明
对 alluxio-site.properties 配置进行变更后需重启 Alluxio 服务。
一旦配置了 ShimFileSystem,master 将需要将外部存储系统本地的 URI 路由到 Alluxio 名称空间。这要求 cosn 已 mount 在 Alluxio 名称空间中。
关闭透明 URI 功能:只需回滚 core-site.xml中fs.cosn.impl 配置项。

mount

mount 命令可以说是 Alluxio 最有特色的命令之一。它类似于 Linux 里的 mount 命令---Linux 用户可以通过 Linux mount 把硬盘,SSD 等存储设备加载到这台 Linux 系统的本地文件系统中。而在 Alluxio 系统当中,mount 的概念进一步被扩展到了分布式系统一层:用户可以通过 Alluxio mount 把一个或多个其他的存储系统/云存储服务(例如 HDFS、COS 等), 挂载到 Alluxio 这个分布式文件系统当中去。从而运行在 Alluxio 上的分布式应用,例如 Spark、Presto 或者 MapReduce 等,不需要去适配甚至了解具体的数据访问协议和路径,而只需要知道数据对应在 Alluxio 文件系统的路径就已足够,从而极大的方便了应用的开发和维护。


EMR-Alluxio 默认使用 hdfs 作为根目录挂载点

在 EMR-Alluxio2.5.1+后,Alluxio 的 UFS 开始支持 COSN 协议,COS UFS 存在读写性能较差以及不稳定的问题,为了解决此类问题,社区贡献了 COSN UFS 底层文件系统。COS 和 COSN UFS 都是用于访问腾讯云对象存储,COSN 相对于 COS 做了深度优化,其读写性能较COS 成倍提升,同时带来了更好的稳定性,所以强烈推荐使用 COSN。COS UFS 将于 EMR-Alluxio2.6.0 版本后停止维护。 Mount COSN 示例:
alluxio fs mount --option fs.cosn.userinfo.secretId=xx \\
--option fs.cosn.userinfo.secretKey=xx \\
--option fs.cosn.bucket.region=ap-xx \\
--option fs.cosn.impl=org.apache.hadoop.fs.cosnative.NativeCosFileSystem \\
--option fs.AbstractFileSystem.cosn.impl=org.apache.hadoop.fs.CosN \\
--option fs.cosn.userinfo.appid=xx \\
/cosn cosn://COS_BUCKET/path
其中,--options 中配置 COS 的配置。
配置项名称
解释
fs.cosn.userinfo.secretId
cos scecret id
fs.cosn.userinfo.secretKey
cos secret key
fs.cosn.impl
固定值:org.apache.hadoop.fs.CosFileSystem
fs.AbstractFileSystem.cosn.impl
固定值:org.apache.hadoop.fs.CosN
fs.cosn.bucket.region cos region
名称,例如 ap-beijing
fs.cosn.userinfo.appid
用户主账号 AppID
COS_BUCKET COS BUCKET
名称。只要名称,不要带 AppID 后缀

帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈