Spark源碼包的編譯

日期：2017/2/28 14:24:21 编辑：Linux教程

Spark源碼包的編譯和部署生成，其本質只有兩種：Maven和SBT （Simple Build Tool）, 只不過針對不同的場景而已：

Maven編譯

SBT編譯

IntelliJ IDEA編譯（可采用Maven或者SBT插件編譯），適用於開發人員

包部署生成（內嵌Maven編譯），使用維護人員

編譯的目的是生成特定環境下運行Spark本身或者開發Spark Application的JAR包，本次編譯的目的生成運行在Hadoop2.5.2上的Spark JAR包，缺省編譯所支持的Hadoop環境是Hadoop1.0.4

SBT編譯

將源碼包復制到指定的目錄下，然後進入該目錄，運行：

SPARK_HADOOP_VERSION=2.5.2 SPARK_YARN=true sbt/sbt assembly

Maven 編譯

事先安裝好Maven3.3.2或者Maven3.0.5，並設置環境變量MAVEN_HOME,將MAVEN_HOME/bin加入到PATH變量。然後將源代碼復制到指定的目錄下，然後進入該目錄，先設置Maven參數

export MAVEN_OPTS="-Xmx2g -XX:MaxPermSize=512M -XX:ReservedCodeCacheSize=512m"

再運行

mvn -Pyarn -Dhadoop.version=2.5.2 -Dyarn.version=2.5.2 -DskipTests clean package

--------------------------------------分割線 --------------------------------------

Spark1.0.0部署指南 http://www.linuxidc.com/Linux/2014-07/104304.htm

CentOS 6.2(64位)下安裝Spark0.8.0詳細記錄 http://www.linuxidc.com/Linux/2014-06/102583.htm

Spark簡介及其在Ubuntu下的安裝使用 http://www.linuxidc.com/Linux/2013-08/88606.htm

安裝Spark集群(在CentOS上) http://www.linuxidc.com/Linux/2013-08/88599.htm

Hadoop vs Spark性能對比 http://www.linuxidc.com/Linux/2013-08/88597.htm

Spark安裝與學習 http://www.linuxidc.com/Linux/2013-08/88596.htm

Spark 並行計算模型 http://www.linuxidc.com/Linux/2012-12/76490.htm

--------------------------------------分割線 --------------------------------------

Spark 的詳細介紹：請點這裡
Spark 的下載地址：請點這裡

上一頁:VirtualBox修改虛擬機磁盤VDI的大小
下一頁:分享有用的 bash 別名和函數

Linux教程

Linux x86-32模式下分析內存映射流程
前言虛擬內存機制已經成為了現代操作系統所不可缺少的一部分，不

OpenCV在Ubuntu下的安裝

優化Linux系統的硬盤解決磁盤碎片化

linux系統入門學習（82）

Linux負載均衡軟件LVS配置篇

Linux索引節點及值

Linux下Sed命令的用法

60,000毫秒內對Linux的性能診斷

RedHat Enterprise 5.4 X64位Linux很卡--解決方法

Linux教程網

Linus Torvalds因內核注解標點格式發飙
Linus Torvalds因內核注解標點格式發飙Linus Torvalds因內核注解標點格式發飙Linus

Linux下配置rsync 同步數據

CentOS虛擬機橋接模式

linux音頻制作播放不完全指南(mp3，mpc，ape）

Python起步之print & input用法總結

Java中的Fork/Join框架

BruteXSS：XSS暴力破解神器

[Linux]Mandrake9.0安

Linux下的sniffer工具--Tcpdump的安裝和使用