蓝鲸运维平台4.0正式上线,通过资料的查看,发现对于运维来说简直就是神器。该平台大部分架构采用的是
django
开发的,顺便记录下我对蓝鲸运维平台的理解。
- 蓝鲸运维平台是一个Paas集成框架,,如果想不通过开发的手段对自身公司的业务进行深度契合是不可能的。
- 蓝鲸平台集成框架中,通过一步一步可以将自带cmdb,任务调度job,agent信息采集,bkdata日志大数据(
elk
),自愈平台,网络管理功能。 - 可以理解为蓝鲸集成框架就是一套精简微服务框架,通过http等api进行远程调用,通过日志的抓取,进行故障分析处理等等。
- 通过蓝鲸官方的django框架可以进行对公司自身业务的契合快速开发,并且通过集成平台进行快速部署上线。
该平台使用很多第三方软件及框架进行处理,情况如下:
蓝鲸运维平台集成框架的细节如下:
- 集成框架平台Paas
- 该平台包含账户调用,应用调度,快速开发部署等等功能。
- 目前包含django应用
login
,ESB
,paas
,appenging
。 -
第三方服务需求,
废话不多说,安装要求,由于是在自己的电脑上安装平台进行自身的开发测试。
vmware虚拟化的需求,至少4G内存,低于4G别装啦,卡到你想砸电脑,还有就是最好是固态硬盘,普通硬盘也吃不消。
直接通过官方的安装文档,相当简单http://bk.tencent.com/document/bkbuild/000417.html
安装过程中遇到的问题如下:
我这边用的是centos7,最小化安装。
关闭防火墙
systemctl disable firewalld.service
systemctl stop firewalld.service
配置selinux
修改/etc/selinux/config 文件
将SELINUX=enforcing改为SELINUX=disabled
配置好 yum 源,包括 EPEL 仓库(通过yum info nginx测试一下)
yum makecache
yum -y install epel-release
yum install net-tools.x86_64
通过上面的完成以后,进行直接安装即可。
出现的安装问题如下:
脚本存在问题,安装JOB调度平台的时候MQ数据库的时候会报错,因为脚本改动啦系统的主机名,导致无法启动MQ数据库,所以中断啦,
解决如下:
直接hostname localhost,直接新建一个命令行。
直接手工启动/sbin/service rabbitmq-server start
查看状态rabbitmqctl status。如果未出现Error: unable to connect to node rabbit@xxx: nodedow
,则正常。
正常后,重新运行脚本安装,全部安装完成。
由于nginx只认域名访问,需要修改自己访问主机的hosts文件,添加虚拟机的IP地址192.168.20.210 paas.blueking.com
安装完成后可以正常使用,重启虚拟机后结果发现通过./bkcec start paas
,结果连浏览器访问异常,这个是因为重启后其他第三方服务都没有启动。
启动流程如下:
## 启动paas
./bkcec start mysql
./bkcec start license
./bkcec start redis
./bkcec start nginx
./bkcec start paas
---------------------------------------------------------------------------------------------------------
[192.168.20.210] open_paas appengine RUNNING pid 3650, uptime 0:18:21
[192.168.20.210] open_paas esb RUNNING pid 3649, uptime 0:18:21
[192.168.20.210] open_paas login RUNNING pid 3648, uptime 0:18:21
[192.168.20.210] open_paas paas RUNNING pid 3647, uptime 0:18:21
启动cmdb
./bkcec start mongodb
./bkcec start zk
./bkcec start gse
./bkcec start cmdb
[192.168.20.210] server cmdb_adminserver RUNNING pid 4964, uptime 0:16:34
[192.168.20.210] server cmdb_apiserver RUNNING pid 4955, uptime 0:16:34
[192.168.20.210] server cmdb_auditcontoller RUNNING pid 4954, uptime 0:16:34
[192.168.20.210] server cmdb_datacollection RUNNING pid 4963, uptime 0:16:34
[192.168.20.210] server cmdb_eventserver RUNNING pid 4962, uptime 0:16:34
[192.168.20.210] server cmdb_hostcontroller RUNNING pid 4948, uptime 0:16:34
[192.168.20.210] server cmdb_hostserver RUNNING pid 4949, uptime 0:16:34
[192.168.20.210] server cmdb_objectcontroller RUNNING pid 4951, uptime 0:16:34
[192.168.20.210] server cmdb_proccontroller RUNNING pid 4965, uptime 0:16:34
[192.168.20.210] server cmdb_procserver RUNNING pid 4953, uptime 0:16:34
[192.168.20.210] server cmdb_toposerver RUNNING pid 4950, uptime 0:16:34
[192.168.20.210] server cmdb_webserver RUNNING pid 4952, uptime 0:16:34
启动job调度平台
./bkcec start rabbitmq
hostname localhost
/sbin/service rabbitmq-server start
./bkcec start job
#启动开发者agent平台
./bkcec start appo
[192.168.20.210] paas_agent(O) paas_agent RUNNING pid 9206, uptime 0:01:15
[192.168.20.210] nginx: RUNNING
最后,通过第三方平台下载saas应用,比如agent自动安装平台,主机监控平台.
部署上线后正常,但重启vm失效,解决方案,安装完成后通过ps -ef|grep uwsgi,查看应用平台的启动方式。
#bk_monitor,主机性能分析
/data/bkce/paas_agent/apps/Envs/bk_monitor/bin/uwsgi --ini /data/bkce/paas_agent/apps/projects/bk_monitor/conf/bk_monitor.ini
#bk_agent_setup自动部署
/data/bkce/paas_agent/apps/Envs/bk_agent_setup/bin/uwsgi --ini /data/bkce/paas_agent/apps/projects/bk_agent_setup/conf/bk_agent_setup.ini
完成,现在可以很happy的从官方下载django模块进行定制化开发工作啦。
公司准备部署8节点的正式环境使用,有空把遇到的问题写出来。