本文阐述如何在Debian系统上配置hadoop的资源分配策略,主要关注yarn(Yet Another Resource Negotiator)的配置,因为YARN是Hadoop资源管理和调度的核心。
YARN资源管理器配置:
关键配置参数包括:
- yarn.nodemanager.resource.memory-mb:每个节点管理器可分配的物理内存总量(MB),默认8192MB(8GB)。
- yarn.nodemanager.vmem-pmem-ratio:虚拟内存与物理内存的使用比例,默认2.1。
- yarn.nodemanager.resource.cpu-vcore:每个节点管理器可分配的虚拟CPU核心数,默认8。 可根据CPU性能差异调整,将一个物理CPU核心划分为多个虚拟核心。
Hadoop核心配置文件:
- core-site.xml:配置hdfs(Hadoop分布式文件系统)位置及其他属性。
- hdfs-site.xml:配置HDFS数据副本数量、NameNode元数据存储位置等。
- mapred-site.xml:配置mapreduce运行环境。
- yarn-site.xml:配置YARN资源管理器和调度器。
资源调度策略选择:
Hadoop YARN提供多种资源调度器:
请注意,以上配置适用于Hadoop 2.x和3.x版本,具体配置需根据实际Hadoop版本、集群规模和资源情况进行调整和优化。 实际应用中,需要根据工作负载和集群资源情况选择合适的调度器并微调参数。