大数据学习五-Hadoop分布式环境部署_hadoop分布式适合在以下哪种场景进行部署-程序员宅基地

Hadoop分布式环境部署

一. Linux规划

准备三台虚拟机，ip、hostname分别为
192.168.59.223 bigdata-training02.hpsk.com
192.168.59.224 bigdata-training03.hpsk.com
192.168.59.225 bigdata-training04.hpsk.com

/etc/hosts配置
这里写图片描述
配置完成后重启网络服务

 $ service network restart

之后主机名、ip均可以互相ping通即为配置正确。下面就可以正式开始Hadoop分布式环境部署了。
Hadoop分布式环境部署要求每一台虚拟机的配置都一样，所以这里以一台虚拟机为例，不一样的地方再另作说明，安装部署好一台之后再将配置部署分发给另外两台即可。

二.分布式部署

Linux环境配置
(1). ip、主机名、本地映射（/etc/hosts）,DNS（按照前面规划进行配置）
(2). 关闭防火墙，selinux
(3)在Linux中创建统一的用户，统一的目录（我使用的huadian/huadian）
(4)修改句柄数
(5)ssh免密钥登
-每台机器为自己创建公私钥

$ cd /home/huadian/
$ ssh-keygen -t rsa

之后的提示一直“Enter”即可出现如下结果即为成功
这里写图片描述
-将自己以及其他机器的公钥拿过来

 $ ssh-copy-id bigdata-hpsk02.huadian.com
 $ ssh-copy-id bigdata-hpsk03.huadian.com
 $ ssh-copy-id bigdata-hpsk04.huadian.com

这里写图片描述
我这里是使用bigdata-hpsk02拿公钥，所以bigdata-hpsk02切换到其他机器时不需要密码了，而其他机器切换还需要密码，想要互切都免密，需要在另外的机器上也配置一遍。
2. NTP时间同步
通过ntp服务实现每台机器的时间一致
实现时间同步的方式有多种
(1). 通过Linux crontab实现
(2).直接使用ntp服务同步外网时间服务器
(3).选择一台机器作为中间同步服务A，A与外网进行同步，B,C同步A
这里我选择的是（3）
配置bigdata-hpsk02.huadian.com sudo vim /etc/ntp.conf
删除默认配置：
这里写图片描述
添加
配置A允许哪些机器与我同步

配置A跟谁同步

配置本地同步

启动ntp服务

sudo service ntpd start

配置B,C同步

sudo vim /etc/ntp.conf
server 192.168.59.223

手动同步

sudo ntpdate 192.168.59.223

开启ntp服务

sudo service ntpd start

时间同步可能会比较慢，一段时间后可以使用查看是否成功（开始后可以不用管它，继续后续操作）
这里写图片描述
3. 部署Hadoop
（1）节点分布：

node1   datanode    nodemanager     namenode(工作)
node2   datanode    nodemanager     
node3   datanode    nodemanager     resourcemanager（工作）

（2）安装jdk
Linux系统有自带的jdk但最好重新安装一下，关于jdk的卸载安装在前面的博客中有详细介绍，详情请参考
https://blog.csdn.net/singularity_muzi/article/details/80076015
我的jdk版本
这里写图片描述
（3）安装hadoop
- 下载解压安装（这一步在我前面的博客中有详细的过程，就不过多说明）
- 修改配置文件
首先，我们需要了解的是配置文件都有其不一样的功能，我们可以通过其后缀名进行简单的区分，知道了其配置功能就可以根据自己的需求找到对应文件进行配置。
-》env.sh：配置环境变量
-》site.xml：配置用户自定义需求
-》yarn-site：用于配置yarn的属性
-》slaves：配置所有从节点的地址

下面开始修改配置文件

env.sh-》配置JAVA_HOME，每个文件对应位置都会有“JAVA_HOME”关键字及模板格式的提醒，我们只需要找到对应位置修改或添加即可。
hadoop-env.sh

mapred-env.sh

yarn-env.sh
site.xml：配置用户自定义需求
core-site：配hadoop全局的一些属性

hdfs-site：配置hdfs的属性

mapred-site：用于配置MapReduce的属性
在配置mapred-site.xml的时候我们会发现系统中并没有这个文件，而是有一个mapred-site.xml.template文件，“.template”为后缀的文件是模板文件，我们只需要复制一个重命名或者直接重命名为xml文件即可。

yarn-site：用于配置yarn的属性

slaves：配置所有从节点的地址

分发：不要忘掉
分发可以有两种方法：

 1. 本机传给其他主机
scp -r hadoop-2.7.3 hpsk@bigdata-hpsk03.huadian.com:/opt/modules/
 2. 其他主机到本机下载   
scp -r hpsk@bigdata-hpsk04.huadian.com:/opt/modules/hadoop-2.7.3 /opt/modules/

注意：我这里是将整个/opt/modules文件都传了过去，里面包括jdk和hadoop，而jdk的环境变量配置在每一台主机上都要进行一次。

启动测试
-格式化文件系统（重点强调，格式化只能在配置完成之后执行一次，之后就不要在重复执行了）

bin/hdfs namenode -format

-启动对应的进程

1.hadoop的启动方式
（1）.单个进程启动：用于启动

sbin/hadoop-daemon.sh start namenode

（2）分别启动yarn和hdfs：用于关闭

sbin/start-dfs.sh
    -》namenode
    -》datanode
    -》secondarynamenode
sbin/start-yarn.sh
    -》resourcemanager
    -》所有的nodemanager

（3）一次性启动所有进程

sbin/start-all.sh

本文链接：https://blog.csdn.net/singularity_muzi/article/details/80135106

原作者删帖不实内容删帖广告或垃圾文章投诉

智能推荐

18个顶级人工智能平台-程序员宅基地

文章浏览阅读1w次，点赞2次，收藏27次。来源：机器人小妹　　很多时候企业拥有重复，乏味且困难的工作流程，这些流程往往会减慢生产速度并增加运营成本。为了降低生产成本，企业别无选择，只能自动化某些功能以降低生产成本。　　通过数字化..._人工智能平台

electron热加载_electron-reloader-程序员宅基地

文章浏览阅读2.2k次。热加载能够在每次保存修改的代码后自动刷新 electron 应用界面，而不必每次去手动操作重新运行，这极大的提升了开发效率。安装 electron 热加载插件热加载虽然很方便，但是不是每个 electron 项目必须的，所以想要舒服的开发 electron 就只能给 electron 项目单独的安装热加载插件[electron-reloader]:// 在项目的根目录下安装 electron-reloader，国内建议使用 cnpm 代替 npmnpm install electron-relo._electron-reloader

android 11.0 去掉recovery模式UI页面的选项_android recovery 删除部分菜单-程序员宅基地

文章浏览阅读942次。在11.0 进行定制化开发，会根据需要去掉recovery模式的一些选项就是在device.cpp去掉一些选项就可以了。_android recovery 删除部分菜单

mnn linux编译_mnn 编译linux-程序员宅基地

文章浏览阅读3.7k次。https://www.yuque.com/mnn/cn/cvrt_linux_mac基础依赖这些依赖是无关编译选项的基础编译依赖• cmake（3.10 以上）• protobuf (3.0 以上)• 指protobuf库以及protobuf编译器。版本号使用 protoc --version 打印出来。• 在某些Linux发行版上这两个包是分开发布的，需要手动安装• Ubuntu需要分别安装 libprotobuf-dev 以及 protobuf-compiler 两个包•..._mnn 编译linux

利用CSS3制作淡入淡出动画效果_css3入场效果淡入淡出-程序员宅基地

文章浏览阅读1.8k次。CSS3新增动画属性“@-webkit-keyframes”，从字面就可以看出其含义——关键帧，这与Flash中的含义一致。利用CSS3制作动画效果其原理与Flash一样，我们需要定义关键帧处的状态效果，由CSS3来驱动产生动画效果。下面讲解一下如何利用CSS3制作淡入淡出的动画效果。具体实例可参考刚进入本站时的淡入效果。1. 定义动画，名称为fadeIn@-webkit-keyf_css3入场效果淡入淡出

计算机软件又必须包括什么,计算机系统应包括硬件和软件两个子系统，硬件和软件又必须依次分别包括______？...-程序员宅基地

文章浏览阅读2.8k次。计算机系统应包括硬件和软件两个子系统，硬件和软件又必须依次分别包括中央处理器和系统软件。按人的要求接收和存储信息，自动进行数据处理和计算，并输出结果信息的机器系统。计算机是脑力的延伸和扩充，是近代科学的重大成就之一。计算机系统由硬件(子)系统和软件(子)系统组成。前者是借助电、磁、光、机械等原理构成的各种物理部件的有机组合，是系统赖以工作的实体。后者是各种程序和文件，用于指挥全系统按指定的要求进行..._计算机系统包括硬件系统和软件系统软件又必须包括

随便推点

进程调度（一）——FIFO算法_进程调度fifo算法代码-程序员宅基地

文章浏览阅读7.9k次，点赞3次，收藏22次。一定义这是最早出现的置换算法。该算法总是淘汰最先进入内存的页面，即选择在内存中驻留时间最久的页面予以淘汰。该算法实现简单，只需把一个进程已调入内存的页面，按先后次序链接成一个队列，并设置一个指针，称为替换指针，使它总是指向最老的页面。但该算法与进程实际运行的规律不相适应，因为在进程中，有些页面经常被访问，比如，含有全局变量、常用函数、例程等的页面，FIFO 算法并不能保证这些页面不被淘汰。这里，我_进程调度fifo算法代码

mysql rownum写法_mysql应用之类似oracle rownum写法-程序员宅基地

文章浏览阅读133次。rownum是oracle才有的写法，rownum在oracle中可以用于取第一条数据，或者批量写数据时限定批量写的数量等mysql取第一条数据写法SELECT * FROM t order by id LIMIT 1;oracle取第一条数据写法SELECT * FROM t where rownum =1 order by id;ok，上面是mysql和oracle取第一条数据的写法对比，不过..._mysql 替换@rownum的写法

eclipse安装教程_ecjelm-程序员宅基地

文章浏览阅读790次，点赞3次，收藏4次。官网下载下载链接：http://www.eclipse.org/downloads/点击Download下载完成后双击运行我选择第2个，看自己需要（我选择企业级应用，如果只是单纯学习java选第一个就行）进入下一步后选择jre和安装路径修改jvm/jre的时候也可以选择本地的（点后面的文件夹进去），但是我们没有11版本的，所以还是用他的吧选择接受安装中安装过程中如果有其他界面弹出就点accept就行..._ecjelm

Linux常用网络命令_ifconfig 删除vlan-程序员宅基地

文章浏览阅读245次。原文链接：https://linux.cn/article-7801-1.htmlifconfigping <IP地址>:发送ICMP echo消息到某个主机traceroute <IP地址>：用于跟踪IP包的路由路由：netstat -r: 打印路由表route add ：添加静态路由路径routed：控制动态路由的BSD守护程序。运行RIP路由协议gat..._ifconfig 删除vlan

redux_redux redis-程序员宅基地

文章浏览阅读224次。reduxredux里要求把数据都放在公共的存储区域叫store里面，组件中尽量少放数据，假如绿色的组件要给很多灰色的组件传值，绿色的组件只需要改变store里面对应的数据就行了，接着灰色的组件会自动感知到store里的数据发生了改变，store只要有变化，灰色的组件就会自动从store里重新取数据，这样绿色组件的数据就很方便的传到其它灰色组件里了。redux就是把公用的数据放在公共的区域去存..._redux redis

linux 解压zip大文件(解决乱码问题)_linux 7za解压中文乱码-程序员宅基地

文章浏览阅读2.2k次，点赞3次，收藏6次。unzip版本不支持4G以上的压缩包所以要使用p7zip：Linux一个高压缩率软件wget http://sourceforge.net/projects/p7zip/files/p7zip/9.20.1/p7zip_9.20.1_src_all.tar.bz2tar jxvf p7zip_9.20.1_src_all.tar.bz2cd p7zip_9.20.1make && make install 如果安装失败，看一下报错是不是因为没有下载gcc 和 gcc ++(p7_linux 7za解压中文乱码