大数据-学习实践-2Hadoop
迪丽瓦拉
2025-05-28 17:36:03
0

大数据-学习实践-2Hadoop

(大数据系列)

文章目录

  • 大数据-学习实践-2Hadoop
    • 1知识点
    • 2具体内容
      • 2.1Hadoop介绍
      • 2.2两种安装方式
        • 2.2.1伪分布集群安装部署
        • 2.2.2 分布式集群安装
        • 2.2.3客户端节点
    • 3待补充
    • 4Q&A
    • 5code
    • 6参考

1知识点

  • Hadoop介绍
    • 分布式存储+分布式计算
    • Yarn
  • 两种安装部署
    • 伪分布式
    • 分布式
    • 客户端节点

2具体内容

2.1Hadoop介绍

  • 分布式存储+分布式计算

    • 选择CDH或HDP,方便运维管理
      在这里插入图片描述
    • 2.0:YARN拆出来,资源管理平台
    • 3.0:Jaca支撑8及以上;支撑纠删码;支持多个NameNode;MR任务级本地优化;多重服务默认端口变更
  • 三大核心组件

    • HDFS,分布式存储
    • MapReduce,分布式计算
    • Yarn ,集群资源管理及调度

2.2两种安装方式

2.2.1伪分布集群安装部署

在这里插入图片描述
官网下载hadoop,可使用镜像
安装:

  1. 设置静态ip
vi /etc/sysconfig/network
#确认ip参数
service network restart
#重启生效
ip addr
hostname bigdata01#设置临时主机名
vi /etc/hostname #设置永久主机名
  1. 关防火墙
#临时关闭
stop firewalld 
#查看防火墙状态
systemctl status firewalld
#开机关闭-永久
systemctl disable firewalld
  1. ssh免密登录
ssh bigdata01
#需要输入密码
ssh-keygen -t rsa
#公钥位置
ll ~/.ssh/ 
#把公钥拷贝到免密登录机器
cat ~/.ssh/id_rda.pub >> ~/.ssh/authorized_keysssh bigdata01
  1. 安装JDK
    复制-解压-改名-修改环境变量-重启source

  2. 安装hadoop

1复制-解压-修改环境变量-重启source
在这里插入图片描述
2 修改hadoop配置文件

  • hadoop-env.sh
vi hadoop-env.sh 
#增加
export JAVA_HOME=/data/soft/jdk1.8
export HADOOP_LOG_DIR=/data/hadoop_repo/logs/hadoop
  • core-site.xml
    vi core-site.xml
    增加:
    在这里插入图片描述

  • hdfs-site.xml
    vi hdfs-site.xml
    增加:
    在这里插入图片描述

  • mapred-site.xml
    在这里插入图片描述- yarn-site.xml
    在这里插入图片描述- workers

vi workersbigdata01
  1. 格式化hadoop
cd /data/soft/hadoop-3.2.0bin/hdfs namenode -format
  1. 启动,成功后访问
sbin/start-all.sh
stop-all.sh
jps#验证是否已启动
namenodes
datanodes
secondary namenodes
nodemanagers
resourcemanager
...
  • 也可以浏览器验证
  • HOSTS文件(C:\Windows\System32\drivers\etc)增加ip 主机名的对应关系,访问的时候写主机名:端口号也可
  • hdfs:ip(主机名):9870
  • yarn:ip(主机名):8088

2.2.2 分布式集群安装

在这里插入图片描述

  • 每个机器均需配置
  • 网络ip、主机名
  • 关闭防火墙
  • 免密登录
  • JDK-1.8
  • 环境变量,source
  • 部署

2.2.3客户端节点

3待补充

4Q&A

5code

6参考

  • 大数据课程资料

相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...