登录注册写文章

爬虫监控系统demo-阿里云部署详解

缘木求鱼的鱼

爬虫监控系统demo-阿里云部署详解

阿里云

优点:方便、弹性伸缩、减少运维成本(有没有被不靠谱运维坑过的经历...)
缺点:毕竟数据放在人家服务器上(阿里也不会偷窥你的数据,哈哈...),对于数据安全较高的公司不太适合.比如我的前公司,做征信,各种跳板机,堡垒机,数据当然要放在自建服务器上.

阿里云服务器搭建

百度一下,立马搞定
如果只是搭建个人服务器,试验自己的ideas建议使用阿里的学生优惠版(不是学生,已经毕业了? 弟弟妹妹上大学的借个学生证咯...) 传送门

爬虫监控系统demo简介

源码请参考github
demo体验测试账号: marilyn@jayo.biz 密码:123456

技术栈:
- Flask 轻量级的python后端服务框架
- MySQL 数据库
- Scrapy 爬虫框架
- Reids 爬虫消息队列
- gentelella 前端框架
部署
- 采用gunicorn作为wsgi服务
- supervisor监控gunicorn进程(挂掉自动拉起)
  例如,supervisor配置文件:
```
[program:ScrapyMonitorPlatform]
command=/.../ENV/flask/bin/python  /.../ENV/flask/bin/gunicorn -w 4 -b 127.0.0.1:5001 --worker-class=gevent --chdir /home/zhuangshui/flask/ wsgi:app_scrapy
 autostart=true
autorestart=true
startsecs=5
priority=1
stopasgroup=true
killasgroup=true
```
- command命令解释:
  * /.../ENV/flask/bin/python -- python虚拟环境下的python解释器位置
  * /.../ENV/flask/bin/gunicorn -- python虚拟环境下的gunicorn位置
  * -w 4 -- 启了4个worker
  * -b 127.0.0.1:5001 -- 绑定IP 127.0.0.1 端口5001,因此外网无法直接访问,需要 nginx反向代理转发一下
  * --worker-class=gevent -- 按gevent 方式运行协程模式,提高并发处理能力
  * --chdir /home/zhuangshui/flask/ -- 切换到工程目录
  * wsgi:app_scrapy -- 运行wsgi.py文件中的app_scrapy

最后编辑于：2018.03.16 17:19:16

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

Python--Flask Django等常用库总结
# Python 资源大全中文版我想很多程序员应该记得 GitHub 上有一个 Awesome - XXX 系列...
aimaile阅读 26,625评论 6赞 427
Python 资源大全中文版
Python 资源大全中文版 awesome-python[https://github.com/vinta/aw...
万色星辰阅读 9,817评论 0赞 255
Python 资源大全中文版
Python 资源大全中文版我想很多程序员应该记得 GitHub 上有一个 Awesome - XXX 系列的资...
Clemente阅读 3,284评论 0赞 54
[转]Python 资源大全中文版
原文链接: http://www.jianshu.com/p/9c6ae64a1bd7 GitHub 上有一个 A...
李绍俊阅读 6,137评论 0赞 92
节后试笔
玉在池中莲出水，污染不能绝方比。大家如是苦承当，洞庭一夜秋风起。佛印玄禅师诗孤云将野鹤，岂向人间住？莫买沃洲山，...
大气浩然阅读 304评论 0赞 0

50赞51赞

赞赏

手机看全文