Zeppelin实战(一)—— zeppelin 0.9.0 源码编译

一、环境准备

1.1 安装GIT (略)
1.2 安装JDK 1.8 (151+)(略)
1.3 安装MAVEN 3.1.x +
具体步骤自行百度,这里配置阿里源,如下为具体配置
<mirrors>
    <mirror>
        <id>alimaven</id>
        <mirrorOf>central</mirrorOf>
        <name>aliyun maven</name>
        <url>http://maven.aliyun.com/nexus/content/repositories/central/</url>
    </mirror>
 
 
    <!-- 中央仓库1 -->
    <mirror>
        <id>repo1</id>
        <mirrorOf>central</mirrorOf>
        <name>Human Readable Name for this Mirror.</name>
        <url>http://repo1.maven.org/maven2/</url>
    </mirror>
 
 
    <!-- 中央仓库2 -->
    <mirror>
        <id>repo2</id>
        <mirrorOf>central</mirrorOf>
        <name>Human Readable Name for this Mirror.</name>
        <url>http://repo2.maven.org/maven2/</url>
    </mirror>
    <!-- mirror
     | Specifies a repository mirror site to use instead of a given repository. The repository that
     | this mirror serves has an ID that matches the mirrorOf element of this mirror. IDs are used
     | for inheritance and direct lookup purposes, and must be unique across the set of mirrors.
     |
    <mirror>
      <id>mirrorId</id>
      <mirrorOf>repositoryId</mirrorOf>
      <name>Human Readable Name for this Mirror.</name>
      <url>http://my.repository.com/repo/path</url>
    </mirror>
     -->
  </mirrors>

二、下载源码解压,并修改部分内容

wget https://mirrors.tuna.tsinghua.edu.cn/apache/zeppelin/zeppelin-0.9.0/zeppelin-0.9.0.tgz
tar -zxf zeppelin-0.9.0.tgz
# 修改spark部分内容
cd zeppelin-0.9.0/spark
## 修改 pom 文件,注释部分内容
    <modules>
        <module>interpreter</module>
        <module>spark-scala-parent</module>
<!--        <module>scala-2.10</module> -->
        <module>scala-2.11</module>
<!--        <module>scala-2.12</module>-->
        <module>spark-dependencies</module>
        <module>spark-shims</module>
<!--        <module>spark1-shims</module> -->
        <module>spark2-shims</module>
<!--        <module>spark3-shims</module> -->
    </modules>

#修改flink版本号,并修改资源URL
cd zeppelin-0.9.0/flink
# 编辑pom文件,修改flink版本

    <properties>
        <flink1.10.version>1.10.3</flink1.10.version>
        <flink1.11.version>1.11.3</flink1.11.version>
        <flink1.12.version>1.12.2</flink1.12.version>
    </properties>
# 修改下载URL
cd zeppelin-0.9.0/flink/interpreter
#修改pom 中 flink.bin.download.url 值,如下所示
https://mirrors.tuna.tsinghua.edu.cn/apache/flink/flink-${flink.version}/flink-${flink.version}-bin-scala_${scala.binary.version}.tgz</flink.bin.download.url>

三、编译

  • 第一次编译
cd  zeppelin-0.9.0
mvn clean package -Dspark.version=2.3.2 -Pscala-2.11 -Dhbase.version=2.1.6 -Dhadoop.version=3.1.1.3.1.5.0-152 -Pvendor-repo -DskipTests
  • 第一次报错
[ERROR] error reading /home/luke/.m2/repository/org/bouncycastle/bcprov-jdk15on/1.52/bcprov-jdk15on-1.52.jar; error in opening zip file
[ERROR] error reading /home/luke/.m2/repository/org/bouncycastle/bcprov-jdk15on/1.52/bcprov-jdk15on-1.52.jar; error in opening zip file
1617847260(1).jpg
  • 解决方案
怀疑jar包下载不完整,删除之后重新编译
rm -f /home/luke/.m2/repository/org/bouncycastle/bcprov-jdk15on/1.52/bcprov-jdk15on-1.52.jar
  • 第二次编译
mvn clean package -Dspark.version=2.3.2 -Pscala-2.11 -Dhbase.version=2.1.6 -Dhadoop.version=3.1.1.3.1.5.0-152 -Pvendor-repo -DskipTests -rf :r
  • 第二次报错
[ERROR] 
org.apache.http.ConnectionClosedException: Premature end of Content-Length delimited message body (expected: 290239990; received: 10206892
1617850829(1).jpg
  • 解决方案
flink资源下载失败重试
  • 第三次编译
mvn clean package -Dspark.version=2.3.2 -Pscala-2.11 -Dhbase.version=2.1.6 -Dhadoop.version=3.1.1.3.1.5.0-152 -Pvendor-repo -DskipTests -rf :zeppelin-flink
  • 第三次报错
fatal: unable to access 'https://github.com/sachinchoolur/ngclipboard.git/': Empty reply from server\n"
1617868829(1).jpg
  • 解决方案
是因为国内访问github的问题,对git做如下配置即可
git config --global url."git://".insteadOf=https://
  • 第四次编译
mvn clean package -Dspark.version=2.3.2 -Pscala-2.11 -Dhbase.version=2.1.6 -Dhadoop.version=3.1.1.3.1.5.0-152 -Pvendor-repo -DskipTests -rf :zeppelin-web
  • 第四次报错
[INFO] 
[INFO] Zeppelin: web Application .......................... SUCCESS [06:25 min]
[INFO] Zeppelin: Server ................................... FAILURE [03:23 min]
[INFO] Zeppelin: Plugins Parent ........................... SKIPPED
[INFO] Zeppelin: Plugin S3NotebookRepo .................... SKIPPED
[INFO] Zeppelin: Plugin GitHubNotebookRepo ................ SKIPPED
[INFO] Zeppelin: Plugin AzureNotebookRepo ................. SKIPPED
[INFO] Zeppelin: Plugin GCSNotebookRepo ................... SKIPPED
[INFO] Zeppelin: Plugin ZeppelinHubRepo ................... SKIPPED
[INFO] Zeppelin: Plugin FileSystemNotebookRepo ............ SKIPPED
[INFO] Zeppelin: Plugin MongoNotebookRepo ................. SKIPPED
[INFO] Zeppelin: Plugin OSSNotebookRepo ................... SKIPPED
[INFO] Zeppelin: Plugin Kubernetes StandardLauncher ....... SKIPPED
[INFO] Zeppelin: Plugin Flink Launcher .................... SKIPPED
[INFO] Zeppelin: Plugin Docker Launcher ................... SKIPPED
[INFO] Zeppelin: Plugin Cluster Launcher .................. SKIPPED
[INFO] Zeppelin: Plugin Yarn Launcher ..................... SKIPPED
[INFO] Zeppelin: Packaging distribution ................... SKIPPED
[INFO] ------------------------------------------------------------------------
[INFO] BUILD FAILURE
[INFO] ------------------------------------------------------------------------
[INFO] Total time:  09:49 min
[INFO] Finished at: 2021-04-08T16:19:57+08:00
[INFO] ------------------------------------------------------------------------
[ERROR] Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.8.1:compile (default-compile) on project zeppelin-server: Compilation failure: Compilation failure: 
[ERROR] /home/luke/zeppelin/zeppelin-0.9.0/zeppelin-server/src/main/java/org/apache/zeppelin/realm/kerberos/KerberosUtil.java:[41,58] package org.apache.directory.server.kerberos.shared.keytab does not exist
[ERROR] /home/luke/zeppelin/zeppelin-0.9.0/zeppelin-server/src/main/java/org/apache/zeppelin/realm/kerberos/KerberosUtil.java:[42,58] package org.apache.directory.server.kerberos.shared.keytab does not exist
[ERROR] -> [Help 1]
[ERROR] 
[ERROR] To see the full stack trace of the errors, re-run Maven with the -e switch.
[ERROR] Re-run Maven using the -X switch to enable full debug logging.
[ERROR] 
[ERROR] For more information about the errors and possible solutions, please read the following articles:
[ERROR] [Help 1] http://cwiki.apache.org/confluence/display/MAVEN/MojoFailureException
[ERROR] 
[ERROR] After correcting the problems, you can resume the build with the command
[ERROR]   mvn <args> -rf :zeppelin-server
  • 报错原因及解决方案
经过反复测试是因为指定的 HDP HADOOP 版本的原因,没办法只能剩下的 module 逐个单独编译,在编译 zeppelin-server 时,将特定HADOOP 版本取消,采用zeppelin默认,其他模块仍然指定 HDP 的HADOOP版本进行编译

据我判断应该是, hadoop 3.1.1.3.1.5.0-152 和zeppelin 默认的 hadop 2.7.7 的 keytab有关源码,有差别,导致 zeppelin-server无法引用,应该可以通过修改源码去解决,这里暂时不考虑这种方案
  • 第五次编译
# 编译zeppelin-server module
cd zeppelin-server/
 mvn clean package -Dspark.version=2.3.2 -Pscala-2.11 -Dhbase.version=2.1.6 -Pvendor-repo -DskipTests
# 编译 zeppelin-plugins module
cd zeppelin-plugins/
mvn clean package -Dspark.version=2.3.2 -Pscala-2.11 -Dhbase.version=2.1.6 -Dhadoop.version=3.1.1.3.1.5.0-152 -Pvendor-repo -DskipTests
# 编译 zeppelin-distribution
cd zeppelin-distribution
mvn clean package -Pbuild-distr -Dspark.version=2.3.2 -Pscala-2.11 -Dhbase.version=2.1.6 -Dhadoop.version=3.1.1.3.1.5.0-152 -Pvendor-repo -DskipTests
  • 编译成功

[INFO] Building tar: /home/luke/zeppelin/zeppelin-0.9.0/zeppelin-distribution/target/zeppelin-0.9.0.tar.gz
[INFO] ------------------------------------------------------------------------
[INFO] BUILD SUCCESS
[INFO] ------------------------------------------------------------------------
[INFO] Total time:  03:49 min
[INFO] Finished at: 2021-04-08T17:14:10+08:00
[INFO] ------------------------------------------------------------------------

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,233评论 6 495
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,357评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,831评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,313评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,417评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,470评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,482评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,265评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,708评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,997评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,176评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,827评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,503评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,150评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,391评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,034评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,063评论 2 352

推荐阅读更多精彩内容