tencent cloud

弹性 MapReduce

动态与公告
产品动态
产品公告
安全公告
产品简介
产品概述
产品优势
产品架构
产品功能
应用场景
约束与限制
技术支持范围
产品发行版
购买指南
EMR on CVM 计费说明
EMR on TKE 计费说明
EMR Serverless HBase 计费说明
快速入门
EMR on CVM 快速入门
EMR on TKE 快速入门
EMR on CVM 操作指南
规划集群
管理权限
配置集群
管理集群
管理服务
监控告警
智能管家
EMR on TKE 操作指南
EMR on TKE 简介
配置集群
管理集群
管理服务
监控运维
应用分析
EMR Serverless HBase 操作指南
EMR Serverless HBase 产品简介
配额与限制
规划实例
管理实例
监控告警
开发指南
EMR 开发指南
Hadoop开发指南
Spark 开发指南
HBASE开发指南
Phoenix on Hbase 开发指南
Hive 开发指南
Presto开发指南
Sqoop 开发指南
Hue 开发指南
Oozie 开发指南
Flume 开发指南
Kerberos 开发指南
Knox 开发指南
Alluxio 开发指南
Kylin 开发指南
Livy 开发指南
Kyuubi 开发指南
Zeppelin 开发指南
Hudi 开发指南
Superset 开发指南
Impala 开发指南
Druid 开发指南
Tensorflow 开发指南
Kudu 开发指南
Ranger 开发指南
Kafka 开发指南
Iceberg 开发指南
StarRocks 开发指南
Flink 开发指南
JupyterLab 开发指南
MLflow 开发指南
实践教程
EMR on CVM 运维实践
数据迁移实践
自定义伸缩实践教程
API 文档
History
Introduction
API Category
Cluster Resource Management APIs
Cluster Services APIs
User Management APIs
Data Inquiry APIs
Scaling APIs
Configuration APIs
Other APIs
Serverless HBase APIs
YARN Resource Scheduling APIs
Making API Requests
Data Types
Error Codes
常见问题
EMR on CVM常见问题
服务等级协议
联系我们

HDFS 联邦管理

PDF
聚焦模式
字号
最后更新时间: 2025-05-26 15:31:54

功能介绍

HDFS 联邦管理是基于 HDFS Federation 特性提供的 HDFS 联邦集群部署管理能力,包含 NameService 管理以及挂载表管理。在 Hadoop 集群类型 HA 模式下支持联邦管理,支持 ViewFS Federation 和 Router-based Federation 两种联邦类型选择,联邦类型选择后不可更改。Router 节点会用于新扩展的 NameNode 部署,用作 NameNode 部署后的 Router 节点不支持销毁和节点维度所有角色启停。
注意:
1. 当前 HDFS 联邦管理为白名单开放,如需要可 工单 联系我们开通。
2. EMR 所有产品版本均支持 ViewFs Federation 联邦类型;因 HDFS-2.9.0及以上支持 Router-based Federation 联邦类型,所以 EMR 仅 EMR-V3.x.x 及以上产品版本支持 Router-based Federation 联邦类型, EMR-V2.x.x 系列不支持。
3. 在角色管理页中,将联邦节点 NameNode 角色进程暂停时,会影响集群的扩容操作,需恢复 NameNode 角色进程后再执行扩容。

操作步骤

1. 登录 EMR 控制台,在集群列表中单击对应的集群 ID/名称进入集群详情页
2. 在集群详情页中单击集群服务,然后选择 HDFS 组件右上角操作>联邦管理,即可进入联邦管理页面。


3. 单击添加 NameService 即可进行 HDFS 联邦新建,需要输入 NameService 名称,选择联邦类型、NameNode 节点、DFSRouter 节点(Router-based Federation 选择)等。


4. 选择添加联邦节点 联邦节点采用集群中的 Router 节点,需先在资源管理页中扩容增加 Router 节点后,再将其设置为联邦节点;NameNode 进程需要选择2个节点,每个节点将会部署 NameNode 进程和 ZKFC 进程。 第一次新建联邦类型 Router-based Federation 时,部署 DFSRouter 进程需要选择至少2个节点;当再次新建联邦时 DFSRouter 节点可复用,节点数量可大于等于0。


注意:
HDFS-3.3.0以下的版本,在非首次新增 NameService 成功后且联邦类型为 Router-based Federation 时,需在角色管理页重启历史的 DFSRouter 进程(为保证业务正常建议在业务低峰期执行);HDFS-3.3.0版本及以上支持了热加载配置,无需此操作。
开启了 Kerberos 的集群,添加联邦 NameService 后,提交到 yarn 的任务如要用到新 NameService 上的文件,需要先重启 yarn 的 ResourceManager(为保证业务正常建议在业务低峰期执行)。
设置 NameService 名称后,不可修改也不可以删除且 NameService 名称不能为“nsfed”、“haclusterX”、“ClusterX”等系统关键词。
5. 添加挂载表 当新增 NameService 成功后,才能添加挂载表。为了避免配置复杂度过高,对当前集群目录进行映射,建议仅全局一级目录进行NameService 映射,例如挂载“/tmp”,“/user”,“/srv”等;可批量添加挂载路径。
路径:在 ViewFs 统一命名空间的路径名称,在 Router-based Federation 统一命名空间的路径名称,也称挂载点。
目标NameService:挂载点映射到真实路径对应的 NameService。
目标路径:在对应 NameService 上的真实路径,与全局路径的名字无需保持一致。

注意:
路径指向:
1.1 登录 NameNode 节点,执行 hdfs dfs -ls /指向的是这个 NameNode 所管理的 namespace 下的路径,对于 ViewFs 联邦需要用hdfs dfs -ls viewfs://ClusterX/ 才会指向全局路径,对于 Router-based 联邦需要用 hdfs dfs -ls hdfs://nsfed/ 才会指向全局路径。
1.2 登录其它节点,例如充当客户端的Router节点,hdfs dfs -ls / 指向的是全局路径。
各业务组件数据放在一级目录之下,不支持直接放在根目录下访问,根目录不支持挂载。
默认的 NameService 上是有/emr 目录,需要挂载。


帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈