Linux下Hadoop 2.7.3 安裝搭建過程

Posted on 2021-11-30 by WalkonNet

Linux Hadoop 2.7.3 安裝搭建

Hadoop實現瞭一個分佈式文件系統（Hadoop Distributed File System），簡稱HDFS。

HDFS有高容錯性的特點，並且設計用來部署在低廉的（low-cost）硬件上；而且它提供高吞吐量（high throughput）來訪問應用程序的數據，適合那些有著超大數據集（large data set）的應用程序。HDFS放寬瞭（relax）POSIX的要求，可以以流的形式訪問（streaming access）文件系統中的數據。

Hadoop的框架最核心的設計就是：HDFS和MapReduce。HDFS為海量的數據提供瞭存儲，則MapReduce為海量的數據提供瞭計算。

Hadoop解決哪些問題？

海量數據需要及時分析和處理

海量數據需要深入分析和挖掘

數據需要長期保存

海量數據存儲的問題：

磁盤IO稱為一種瓶頸，而非CPU資源

網絡帶寬是一種稀缺資源

硬件故障成為影響穩定的一大因素

安裝流程

安裝JAVA 1.8

下載：

http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

Java 環境安裝配置 /etc/profile：

export JAVA_HOME=/usr/jdk/jdk1.8.0_112
export JRE_HOME=/usr/jdk/jdk1.8.0_112/jre
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib:$CLASSPATH
export PATH=$JAVA_HOME/bin:$PATH

安裝Hadoop2.7.3

下載：http://archive.apache.org/dist/hadoop/core/hadoop-2.7.3/

配置啟動Hadoop

1、修改hadoop 2.7.3/etc/hadoop/hadoop-env.sh 指定JAVA_HOME

# The java implementation to use.
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.171-8.b10.el6_9.x86_64

2、修改hdfs的配置文件

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://0.0.0.0:9000</value>
    </property>
    <!-- 指定hadoop運行時產生文件的存儲路徑 -->
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/tmp/hadoop</value>
    </property>
</configuration>

3、啟動

第一次啟動得先格式化

/usr/hadoop/bin/hdfs namenode -format

啟動hdfs

/usr/hadoop/sbin/start-dfs.sh

用jps命令查看啟動的Java進程

在這裡插入圖片描述

預覽地址：http://127.0.0.1:50070/dfshealth.html

在這裡插入圖片描述

4、停止

/usr/hadoop/sbin/stop-dfs.sh

到此這篇關於Linux Hadoop 2.7.3 安裝搭建的文章就介紹到這瞭,更多相關Linux Hadoop安裝搭建內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet！

Linux下Hadoop 2.7.3 安裝搭建過程

Linux Hadoop 2.7.3 安裝搭建

Hadoop解決哪些問題？

海量數據存儲的問題：

安裝流程

配置啟動Hadoop

推薦閱讀：

發佈留言取消回覆

近期文章

Linux Hadoop 2.7.3 安裝搭建

Hadoop解決哪些問題？

海量數據存儲的問題：

安裝流程

配置啟動Hadoop

推薦閱讀：

發佈留言 取消回覆

近期文章

標籤

發佈留言取消回覆