当前位置:首页 > 技术 > 正文内容

CentOS 7上Hadoop 3的二进制部署方法

访客 技术 2026年6月14日 1

Hadoop核心架构解析

Hadoop 3架构包含三大基础组件:

  • HDFS:分布式存储系统,支持海量数据持久化
  • YARN:资源调度框架,实现集群资源动态分配
  • MapReduce:分布式计算模型,处理大规模数据集

集群架构特性

Hadoop集群采用主从架构,包含两个逻辑独立的子系统:

  • HDFS集群(名称节点/数据节点)
  • YARN集群(资源管理器/节点管理器)

物理部署上,部分服务可共存于同一节点,但功能模块相互隔离。

系统预配置

节点角色分配

节点映射关系如下:

192.168.1.131 hdp01.dialev.com
192.168.1.132 hdp02.dialev.com
192.168.1.133 hdp03.dialev.com

免密登录配置

echo "StrictHostKeyChecking no" > ~/.ssh/config
ssh-copy-id -i 192.168.1.13{1..3}

时间同步设置

yum install -y ntpdate
ntpdate ntp.aliyun.com
echo '*/5 * * * * ntpdate ntp.aliyun.com' | crontab -

JDK环境部署

tar xf jdk-8u65-linux-x64.tar.gz -C /usr/local/
ln -sv jdk1.8.0_65 /usr/local/java
echo 'export JAVA_HOME=/usr/local/java' >> /etc/profile.d/java.sh
source /etc/profile.d/java.sh

Hadoop部署流程

安装包解压

tar xf hadoop-3.1.4.tar.gz -C /usr/local/
ln -sv hadoop-3.1.4 /usr/local/hadoop

目录结构说明:

  • bin:执行脚本目录
  • etc:配置文件存储位置
  • lib:运行时依赖库
  • sbin:管理脚本存放路径

环境变量配置

export JAVA_HOME=/usr/local/java
export HADOOP_HOME=/usr/local/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

HDFS基础配置

<configuration>
  <property>
    <name>fs.defaultFS</name>
    <value>hdfs://hdp01.dialev.com:8020</value>
  </property>
  <property>
    <name>hadoop.tmp.dir</name>
    <value>/Hadoop/tmp</value>
  </property>
</configuration>

YARN参数调整

<configuration>
  <property>
    <name>yarn.resourcemanager.hostname</name>
    <value>hdp01.dialev.com</value>
  </property>
  <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
  </property>
</configuration>

节点列表配置

hdp01.dialev.com
hdp02.dialev.com
hdp03.dialev.com

集群启动与验证

名称节点初始化

hdfs namenode -format
# 初始化成功日志示例:
# Storage directory /Hadoop/name has been successfully formatted.

服务启动命令

cd /usr/local/hadoop/sbin
start-dfs.sh
start-yarn.sh

验证操作

Web界面访问

  • HDFS管理界面:http://192.168.1.131:50070
  • YARN管理界面:http://192.168.1.131:8088

数据操作测试

hadoop fs -mkdir /test
hadoop fs -put test.txt /test

基准测试

hadoop jar hadoop-mapreduce-examples-3.1.4.jar pi 2 4
标签: Hadoop配置

相关文章

Linux crontab 详解

1) crontab 是什么cron 是 Linux 的定时任务守护进程;crontab 是用来编辑/查看“按时间周期执行命令”的表(cron table)。常见两类:用户 crontab:每个用户一份(crontab -e 编辑)系统级 crontab / cron.d:可指定执行用户(/etc/crontab、/etc/cron.d/*)2) crontab 时间...

富文本里可以允许的 HTML 属性

一、所有标签默认允许的安全属性(极少)class        (可选)id           (通常建议禁用)title️ 注意:id 容易被滥用做锚点注入,很多系统直接禁用class 允许的话最好只允许固定前缀(如 editor-*)二、a 标签允许属性<a href="" t...

Mac 安装 Node.js 指南

方法一:通过官网安装包(最简单,适合初学者)如果你只是想快速安装并开始使用,这是最直接的方法。访问 Node.js 官网。页面会显示两个版本:LTS (Recommended For Most Users):长期支持版,最稳定。建议选这个。Current:最新特性版,包含最新功能但可能不够稳定。下载 .pkg 安装包并运行。按照安装向导点击“下一步”即可完成。方法二:使用 Homebrew 安装(...

Dom\HTML_NO_DEFAULT_NS 的副作用:自动加闭合标签

在使用Dom\HTMLDocument时,Dom\HTML_NO_DEFAULT_NS 将禁止在解析过程中设置元素的命名空间, 此设置是为了与DOMDocument向后兼容而存在的。当使用它时,已知的一个副作用就是:自动加闭合标签例如 </img> 为什么会这样?当你使用:Dom\HTML_NO_DEFAULT_NS文档会变成 无命名空间模式,此时内部更接近 XML...

Laravel 事件和监听器创建

在 Laravel 中,使用 Artisan 命令创建 Events(事件) 和 Listeners(监听器) 是非常高效的。你可以通过以下几种方式来实现:1. 手动创建单个 Event如果你只想创建一个事件类,可以使用 make:event 命令:Bashphp artisan make:event UserRegistered执行后,文件将生成在 app/Even...

自定义域名解析神器 dnsmasq

什么是 dnsmasq?dnsmasq 是一个轻量级、功能强大的网络服务工具,专为小型和中等规模网络设计。它是一个综合的网络基础设施解决方案[1]。dnsmasq 能做什么?功能说明应用场景DNS 转发与缓存将 DNS 查询转发到上游服务器(ISP、Google DNS 等),并在本地缓存结果加快 DNS 查询速度,减少外部 DNS 流量本地 DNS解析本地网络设备的主机名,无需编辑&n...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。