Hello! 欢迎来到小浪云!


Debian上Hadoop开发环境如何搭建


avatar
小浪云 2025-03-26 12

Debian上Hadoop开发环境如何搭建

本指南详细介绍如何在Debian系统上搭建hadoop开发环境。

一、安装Java开发套件(JDK)

首先,安装OpenJDK:

sudo apt update sudo apt install openjdk-11-jdk -y

配置JAVA_HOME环境变量:

sudo nano /etc/environment

在文件末尾添加(根据实际JDK版本调整路径):

JAVA_HOME="/usr/lib/jvm/java-11-openjdk-amd64"

保存并退出,然后执行:

source /etc/environment

验证安装:

java -version

二、安装Hadoop

下载Hadoop 3.3.6 (或其他版本):

wget https://www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-3.3.6/hadoop-3.3.6-src.tar.gz

验证下载完整性:

wget https://downloads.apache.org/hadoop/common/hadoop-3.3.6/hadoop-3.3.6-src.tar.gz.sha512 sha256sum -c hadoop-3.3.6-src.tar.gz.sha512

创建目录并解压:

sudo mkdir /opt/hadoops sudo tar -xzvf hadoop-3.3.6-src.tar.gz -C /opt/hadoops --strip-components 1

三、配置Hadoop环境变量

编辑/etc/profile文件,添加:

export HADOOP_HOME="/opt/hadoops/hadoop-3.3.6" export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

刷新环境变量:

source /etc/profile

四、配置Hadoop核心配置文件

编辑core-site.xml

sudo nano $HADOOP_HOME/etc/hadoop/core-site.xml

添加:

<configuration>   <property>     <name>fs.defaultFS</name>     <value>hdfs://localhost:9000</value>   </property> </configuration>

编辑hdfs-site.xml:

sudo nano $HADOOP_HOME/etc/hadoop/hdfs-site.xml

添加:

<configuration>   <property>     <name>dfs.replication</name>     <value>1</value>   </property>   <property>     <name>dfs.namenode.name.dir</name>     <value>/opt/hadoops/hdfs/namenode</value>   </property> </configuration>

编辑mapred-site.xml:

sudo nano $HADOOP_HOME/etc/hadoop/mapred-site.xml

添加:

<configuration>   <property>     <name>mapreduce.framework.name</name>     <value>yarn</value>   </property> </configuration>

编辑yarn-site.xml:

sudo nano $HADOOP_HOME/etc/hadoop/yarn-site.xml

添加:

<configuration>   <property>     <name>yarn.nodemanager.aux-services</name>     <value>mapreduce_shuffle</value>   </property> </configuration>

五、设置ssh无密码登录

生成SSH密钥:

sudo su - hadoop ssh-keygen -t rsa -P ""

复制公钥:

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

测试连接:

ssh localhost

六、格式化NameNode

hdfs namenode -format

七、启动Hadoop服务

start-dfs.sh start-yarn.sh

八、验证Hadoop安装

检查集群状态:

hdfs dfsadmin -report

访问NameNode Web界面:http://localhost:9870

完成以上步骤后,您的Debian系统上的Hadoop开发环境就搭建完成了。 请根据实际情况调整路径和Hadoop版本。

相关阅读