Linux下Hadoop 2.7.3 安裝搭建過程
Linux Hadoop 2.7.3 安裝搭建
Hadoop實現瞭一個分佈式文件系統(Hadoop Distributed File System),簡稱HDFS。
HDFS有高容錯性的特點,並且設計用來部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)來訪問應用程序的數據,適合那些有著超大數據集(large data set)的應用程序。HDFS放寬瞭(relax)POSIX的要求,可以以流的形式訪問(streaming access)文件系統中的數據。
Hadoop的框架最核心的設計就是:HDFS和MapReduce。HDFS為海量的數據提供瞭存儲,則MapReduce為海量的數據提供瞭計算。
Hadoop解決哪些問題?
海量數據需要及時分析和處理
海量數據需要深入分析和挖掘
數據需要長期保存
海量數據存儲的問題:
磁盤IO稱為一種瓶頸,而非CPU資源
網絡帶寬是一種稀缺資源
硬件故障成為影響穩定的一大因素
安裝流程
安裝JAVA 1.8
下載:
http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html
Java 環境安裝配置 /etc/profile:
export JAVA_HOME=/usr/jdk/jdk1.8.0_112 export JRE_HOME=/usr/jdk/jdk1.8.0_112/jre export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib:$CLASSPATH export PATH=$JAVA_HOME/bin:$PATH
安裝Hadoop2.7.3
下載:http://archive.apache.org/dist/hadoop/core/hadoop-2.7.3/
配置啟動Hadoop
1、修改hadoop 2.7.3/etc/hadoop/hadoop-env.sh 指定JAVA_HOME
# The java implementation to use. export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.171-8.b10.el6_9.x86_64
2、修改hdfs的配置文件
<configuration> <property> <name>fs.defaultFS</name> <value>hdfs://0.0.0.0:9000</value> </property> <!-- 指定hadoop運行時產生文件的存儲路徑 --> <property> <name>hadoop.tmp.dir</name> <value>/tmp/hadoop</value> </property> </configuration>
3、啟動
第一次啟動得先格式化
/usr/hadoop/bin/hdfs namenode -format
啟動hdfs
/usr/hadoop/sbin/start-dfs.sh
用jps命令查看啟動的Java進程
預覽地址:http://127.0.0.1:50070/dfshealth.html
4、停止
/usr/hadoop/sbin/stop-dfs.sh
到此這篇關於Linux Hadoop 2.7.3 安裝搭建的文章就介紹到這瞭,更多相關Linux Hadoop安裝搭建內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- 新手Hadoop安裝 環境搭建
- Linux下安裝Hadoop集群詳細步驟
- Windows下使用IDEA搭建Hadoop開發環境的詳細方法
- Linux下Hbase安裝配置教程
- Hadoop源碼分析四遠程debug調試