在centos上配置hadoop分布式文件系统(hdfs)时,需要修改以下关键配置文件:
-
core-site.xml:
-
hdfs-site.xml:
-
mapred-site.xml:
- mapreduce.framework.name:指定MapReduce框架的名称,通常为 yarn。
-
yarn-site.xml:
- yarn.Resourcemanager.address:指定ResourceManager的地址。
- yarn.resourcemanager.scheduler.address:指定ResourceManager的调度器地址。
- yarn.resourcemanager.resource-tracker.address:指定ResourceManager的资源跟踪器地址。
- yarn.nodemanager.aux-services 和 yarn.nodemanager.aux-services.mapreduce_shuffle.class:指定NodeManager的辅助服务。
- yarn.nodemanager.vmem-check-enabled 和 yarn.nodemanager.disk-health-checker.max-disk-utilization-per-disk-percentage:配置NodeManager的内存和磁盘检查。
在修改这些配置文件后,通常需要执行以下步骤:
- 格式化NameNode:hdfs namenode –format
- 启动HDFS服务:./sbin/start-dfs.sh
- 停止HDFS服务:./sbin/stop-dfs.sh
请注意,具体的配置步骤和文件路径可能会根据Hadoop版本和具体需求有所不同。建议参考官方文档或相关教程以确保配置的正确性。