现在 BAT 都在走向 开源社区,确实 大家从 商业或者个人实现上来看,开源运动 分享 是一门非常棒的好的Business
腾讯现在专门 开设很多流量 做开源分享,仅仅今年 腾讯各方面开源的组件有十多余件
Angel 是腾讯开源的一个机器学习平台 ,说实话 很亲民,非常适合国内的互联网场景,而且对动不动就上亿维特征的数据来说是个非常不错的训练容器。
首先还是老样子 我们要先安装他,在Angel的github 中有详细的编译安装步骤 ,按道理不算难,Angel 依赖 jdk protobuf maven ,这些 比较好安装 ,jdk maven 记得配置环境变量和path
本来 protobuf 我在 python pip 安装了 protobuf的3.0,发现好像 在环境变量没有配置,不管了在编译 angel 报错 意思是protobuf没有安装,我就 又重新安装的protobuf 2.5 版本的,要先安装 bzip2,来解压 protobuf的 tar.bz2包,不然报错,没有安装 protobuf
Cannot execute 'protoc': Cannot run program "protoc": error=2, No such file
另外 下载可能 会被墙,建议使用迅雷先下载好了,在scp 传到服务器上
$ yum -y install bzip2
$ wget https://protobuf.googlecode.com/files/protobuf-2.5.0.tar.bz2
$ tar jxvf protobuf-2.5.0.tar.bz2
$ ./configure
$ make
$ make install
$ protoc --version
libprotoc 2.5.0
angel 编译安装 https://github.com/Tencent/angel/blob/master/docs/deploy/source_compile.md
`
编译环境依赖
Jdk >= 1.8
Maven >= 3.0.5
Protobuf >= 2.5.0 需要和hadoop环境自带的protobuf版本保持一致。目前hadoop官方发布包使用的是2.5.0版本,所以推荐使用2.5.0版本,除非你自己使用更新的protobuf版本编译了hadoop。
源码下载
git clone https://github.com/Tencent/angel
编译
进入源码根目录,执行命令:
mvn clean package -Dmaven.test.skip=true
编译完成后,在源码根目录dist/target目录下会生成一个发布包:angel-1.0.0-bin.zip
发布包
发布包解压后,根目录下有四个子目录:
bin:Angel任务提交脚本
conf:系统配置文件
data:简单测试数据
lib:Angel jar包 & 依赖jar包
`
其中 mvn package 打包需要一些时间,完事就可以使用了 angel单例模式了,不过Angel 分布式 还没有找到可行模式,等我 找到后 在补更