Linux下Hadoop 2.7.3 安裝搭建過程

Linux Hadoop 2.7.3 安裝搭建

Hadoop實現瞭一個分佈式文件系統(Hadoop Distributed File System),簡稱HDFS。

HDFS有高容錯性的特點,並且設計用來部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)來訪問應用程序的數據,適合那些有著超大數據集(large data set)的應用程序。HDFS放寬瞭(relax)POSIX的要求,可以以流的形式訪問(streaming access)文件系統中的數據。

Hadoop的框架最核心的設計就是:HDFS和MapReduce。HDFS為海量的數據提供瞭存儲,則MapReduce為海量的數據提供瞭計算。

Hadoop解決哪些問題?

海量數據需要及時分析和處理

海量數據需要深入分析和挖掘

數據需要長期保存

海量數據存儲的問題:

磁盤IO稱為一種瓶頸,而非CPU資源

網絡帶寬是一種稀缺資源

硬件故障成為影響穩定的一大因素

安裝流程

安裝JAVA 1.8

下載:

http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

Java 環境安裝配置 /etc/profile:

export JAVA_HOME=/usr/jdk/jdk1.8.0_112
export JRE_HOME=/usr/jdk/jdk1.8.0_112/jre
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib:$CLASSPATH
export PATH=$JAVA_HOME/bin:$PATH

安裝Hadoop2.7.3

下載:http://archive.apache.org/dist/hadoop/core/hadoop-2.7.3/

配置啟動Hadoop

1、修改hadoop 2.7.3/etc/hadoop/hadoop-env.sh 指定JAVA_HOME

# The java implementation to use.
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.171-8.b10.el6_9.x86_64

2、修改hdfs的配置文件

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://0.0.0.0:9000</value>
    </property>
    <!-- 指定hadoop運行時產生文件的存儲路徑 -->
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/tmp/hadoop</value>
    </property>
</configuration>

3、啟動

第一次啟動得先格式化

/usr/hadoop/bin/hdfs namenode -format

啟動hdfs

/usr/hadoop/sbin/start-dfs.sh

用jps命令查看啟動的Java進程

在這裡插入圖片描述

預覽地址:http://127.0.0.1:50070/dfshealth.html

在這裡插入圖片描述

4、停止

/usr/hadoop/sbin/stop-dfs.sh

到此這篇關於Linux Hadoop 2.7.3 安裝搭建的文章就介紹到這瞭,更多相關Linux Hadoop安裝搭建內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: