编译前所注意事项:
首先,尽可能阅读官网编译文档 Building Apache Spark
源码下载推荐git clone 或者 wget 。
编译前确保网络良好。
下载所需要的软件(注意版本)
· Spark-2.4.2.tgz
· Hadoop-2.7.6
· Scala-2.11.12
· jdk1.8.0_191
· apache-maven-3.6.x
· git
注意:其中spark是源码,其他是可运行包
解压安装并配置环境变量(过程略)
配置完,注意测试。其中,maven配置本地库,镜像地址设置为阿里云地址。
1 | 创建本地仓库文件夹 |
部分代码:
1 | <!-- localRepository |
修改脚本make-distribution.sh
编译不使用mvn这个命令,直接用make-distribution.sh脚本,但是需要修改该脚本
1 | spark-2.4.2文件夹下 |
修改源码包spark-2.4.2下的pom.xml
1 | <repositories> |
开始编译
1 | ./dev/make-distribution.sh \ |
编译大概需要半小时以上,耐心等待就行。编译过程中如果报错,一般有error字样。
出现以下字样,代表编译完成:
编译后包所在位置,源码包spark-2.4.2根目录下:
至此,编译完!
v1.5.2