Python爬虫进阶:搭建属于自己的美少女图片站

关注我的你应该已经学会了:爬取妹子图整站数据(教程已下架)

于是有人不禁会问:拿几十G的图片有什么用呢?

有什么用呢?我也自问。于是下面这个网站就诞生了......

小姐姐 ( 施工重地,闲人免入!女生请绕道~)

如果你想通过爬虫自动采集数据(比如:mm131、mmjpg、妹子图等各大美女图片站),并与前端网页对接,将采集到的数据自动呈现到网页上,从而搭建一个属于自己的图片站。那么,以下内容就是为你准备的!按着步骤来一定可以实现你想要的,当你对这个项目有了自己的认知后,就可以考虑二次开发精进创作~

(以下操作默认你已经拥有域名、服务器,安装了宝塔面板以及能通过Xshell连接,我也写了一篇小白教程帮你解决这些问题)

准备好就开始吧!

解析域名

(以我在用的GoDaddy域名为例)

  • 访问GoDaddy官网并登录
  • 打开域名管理器-DNS管理-添加记录
    类型:A
    主机:随意(比如:mm)
    指向:填入服务器的ip地址
    TTL:1/2小时

创建站点

  • 进入宝塔面板,添加站点
    设置根目录为:/root/94imm,同时创建MySQL数据库,PHP版本设置为纯静态

  • 进入网站根目录,上传源代码文件
    修改silumz文件夹下settings.py文件中的数据库配置,将程序目录下的silumz.sql文件导入数据库

DATABASES = {
    'default': {
        'ENGINE': 'django.db.backends.mysql',
        'NAME': '数据库名',
        'USER': '数据库用户名',
        'PASSWORD': '数据库密码',
        'HOST': '127.0.0.1',
        'PORT': '3306',
    }
}

启动项目

  • 打开Xshell,进入程序目录
    安装所需的Python第三方库:pip3 install -r requirements.txt
  • 执行启动命令:uwsgi --ini uwsgi.ini

反向代理

  • 进入宝塔面板,管理创建的站点
  • 设置反向代理,目标URL为:http://127.0.0.1:8000

到这一步,项目网站就搭建好了,但此时网站还没有数据,需要运行爬虫程序爬取。爬虫程序位于crawler目录下,每一个文件都是独立的,可单独执行。第一次运行时,可修改爬虫参数采集全站,之后修改参数为采集第一页,配合定时任务,实现自动采集和发布

自动采集和发布

(以crawler_mm131.py爬虫程序为例)

  • 修改程序中的数据库配置
dbhost = {
    "host": "127.0.0.1",
    "dbname": "数据库名",
    "user": "数据库用户名",
    "password": "数据库密码"
}
  • 打开Xshell,进入程序目录
    启动爬虫:python3 crawler_mm131.py
  • 配合宝塔面板设置自动采集


  • 重启网站:sh /root/94imm/restart.sh
    完成采集后清空cache文件或重启网站就能生效哦~

进阶技巧

1.网站采集数据后,如果点击图集无法跳转,则需要在数据库中手动添加图片分类

  • 进入宝塔面板,找到相应的数据库,点击“管理”
  • 点击“images_type”-“插入”-在字段id和type的对应框中输入数字和图片类型


    在爬虫文件中可以找到需要输入的信息,比如crawler_mm131.py中有性感美女和清纯妹子两个分类,分类id分别为1和3


2.发布本地图片

  • 进入爬虫程序目录crawler,运行AutoPost.py,根据提示输入本地图片所在路径,输入自动发布时间

3.图片压缩

  • 部分网站可能未对图片进行压缩,一张图1M甚至几M,既降低传输速度又占空间
  • 进入爬虫程序目录crawler,运行Compress.py,根据提示输入,默认10个线程压缩,如果服务器配置高可适当增加,只压缩图片质量,尺寸不变

4.删除图集

  • 进入爬虫程序目录crawler,运行delete_img.py,根据提示输入图集链接“/article/59885/”中的数字59885即可,会同时删除数据库记录和采集的图片

5.下载采集未完成的图片

  • 进入爬虫程序目录crawler,运行down_img.py,自动查找数据库中存在但static/images目录中不存在的记录重新下载。并删除只有采集记录没有图片的数据
项目源码

https://pan.baidu.com/s/1Gj7UJ0XWuh2bI9IIZnv4ZA 提取码:72oo

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,324评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,356评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,328评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,147评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,160评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,115评论 1 296
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,025评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,867评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,307评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,528评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,688评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,409评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,001评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,657评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,811评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,685评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,573评论 2 353

推荐阅读更多精彩内容