从源码编译Intel BigDL深度学习库

BigDL-Build from Source Code

下载BigDL源码

可以从github下载BigDL的源码,可以根据需要选择对应的版本.

git clone https://github.com/intel-analytics/BigDL.git

设置编译环境

在进行编译之前,需要先设置编译环境,包括Java环境,maven环境和Scala环境.这里使用的是JDK1.8,maven3和Scala2.11.12.
在环境变量中设置如下

export M2_HOME=/opt/maven
export PATH=$PATH:${M2_HOME}/bin
# 如果直接使用mvn编译则需要设置此参数;使用BigDL提供的make-dist.sh
# 脚本进行build则可以不设置此参数,因为脚本中会进行设置
# export MAVEN_OPTS="-Xmx2g -XX:ReservedCodeCacheSize=512m"

export JAVA_HOME=/home/hadoop/sparkEnv/jdk1.8.0_181
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib:$CLASSPATH
export PATH=${PATH}:$JAVA_HOME/bin:$JRE_HOME/lib
export JAVA_OPTS='-Xms512m -Xmx8g'

export SCALA_HOME=/home/hadoop/sparkEnv/scala
export PATH=$PATH:$SCALA_HOME/bin

Build

编译过程中所需要的依赖都在BigDL/pom.xml中进行了配置.远程仓库为

<url>https://repo1.maven.org/maven2</url>
<url>https://repository.apache.org/content/repositories/releases</url>
<url>https://repository.jboss.org/nexus/content/repositories/releases</url>
 <url>https://oss.sonatype.org/content/groups/public/</url>

有时候因为访问速度比较慢或者某些仓库不能访问可能会导致相关依赖下载不下来,对于这种情况可以修改pom.xml,增加国内的仓库,比如aliyun的maven仓库,在pom.xml中的repositories选项下增加如下内容:

 <repositories>
       <repository>
        <id>central-ali</id>
        <name>aliyun maven</name>
        <url>http://maven.aliyun.com/nexus/content/groups/public</url>
        <releases>
            <enabled>true</enabled>
        </releases>
        <snapshots>
            <enabled>false</enabled>
        </snapshots>
        </repository>
    </repositories>

修改后保存,然后就可以开始编译了.

# build for spark 2.0 and above
# 注意下面的spark_2.x中的x不需要替换成具体的版本号,直接使用spark_2.x即可
bash make-dist.sh -P spark_2.x

# build for scala 2.10 or 2.11
bash make-dist.sh -P scala_2.10
# or bash make-dist.sh -P scala_2.11

# build with maven
mvn clean package -DskipTests
# 可以传递参数
# -P spark_2.x
# -P full-build 
# -P scala_2.10 or scala_2.11

在make-dist.sh脚本中运行的编译命令实际上为:

mvn clean package -DskipTests $*

编译完成之后会在当前目录下生成一个dist目录,这里包含了运行BigDL程序所需的所有文件.

dist/bin/bigdl.sh
dist/bin/other-files
dist/lib/bigdl-VERSION-jar-with-dependencies.jar
dist/lib/bigdl-VERSION-python-api.zip
dist/conf/spark-bigdl.conf
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • Maven概述 Maven定义Maven是一个项目管理和整合,统一管理jar包的工具;Maven为开发者提供了一套...
    THQ的简书阅读 4,206评论 0 0
  • 前言什么是 POMQuick Overview POM 常用元素 pom.xml 完整注释 参考 0 前言 什么是...
    阿父阅读 14,327评论 1 36
  • Maven编译代码的相关命令 第一、main目录下的主代码编写完毕后,使用Maven进行编译,在项目根目录下运行命...
    加油小杜阅读 5,174评论 0 2
  • maven是一款优秀的服务构建工具,基于约定优于配置原则,提供标准的服务构建流程。maven的优点不仅限于服务构建...
    zhipingChen阅读 9,411评论 0 4
  • Maven使用入门 1. Maven概述 Maven是什么?Maven项目对象模型(POM),可以通过一小段描述信...
    小小韩_小小红阅读 7,639评论 2 28

友情链接更多精彩内容