240 发简信
IP属地:上海
  • Linux常用命令

    Linux常用命令 查看系统信息常用命令 常用命令-关机或重启命令 命令前结构

  • python基础一

    变量及类型 类型: Numbers(数字): int(有符号整型) long(长整型) float(浮点型) complex(复数) Boolean(布尔): Ture Fa...

  • Scrapy-Redis分布式爬虫组件

    Scrapy-Redis分布式爬虫组件 Scrapy是一个框架,他本身是不支持分布式的。如果我们想要做分布式的爬虫,就需要借助一个组件叫做Scrapy-Redis,这个组件正...

  • Scrapy框架架构

    Scrapy框架架构 Scrapy框架介绍: 写一个爬虫,需要做很多的事情。比如:发送网络请求、数据解析、数据存储、反反爬虫机制(更换ip代理、设置请求头等)、异步请求等。这...

  • Django中的Ajax

    一、原生Ajax 二、Jquery中的Ajax 1、$.ajax():type为POST时,表示发送数据,type为GET时,表示接收数据 2、$.post():发送数据 3...

  • 120
    Ubuntu18.04配置及美化

    Ubuntu18.04已经发布,它以Gnome为图形桌面环境,适当的配置可以让它变得更美观一些。 建议在安装的时候选最小安装,一些不用的软件就不会安装了,当然需要用的软件就要...

  • 120
    Python 3 入门,最全面的基础看这篇就够了!

    基础语法 运行 Python 交互式解释器 在命令行窗口执行python后,进入 Python 的交互式解释器。 exit()或Ctrl + D组合键退出交互式解释器。 命令...

  • 图形验证码识别技术

    图形验证码识别技术: 阻碍我们爬虫的。有时候正是在登录或者请求一些数据时候的图形验证码。因此这里我们讲解一种能将图片翻译成文字的技术。将图片翻译成文字一般被成为光学文字识别(...

  • 多线程爬虫

    多线程爬虫 有些时候,比如下载图片,因为下载图片是一个耗时的操作。如果采用之前那种同步的方式下载。那效率肯会特别慢。这时候我们就可以考虑使用多线程的方式来下载图片。 多线程介...

  • 动态网页数据抓取

    动态网页数据抓取 什么是AJAX: AJAX(Asynchronouse JavaScript And XML)异步JavaScript和XML。过在后台与服务器进行少量数据...

  • redis教程

    redis教程: 概述 redis是一种支持分布式的nosql数据库,他的数据是保存在内存中,同时redis可以定时把内存数据同步到磁盘,即可以将数据持久化,并且他比memc...

  • json文件处理和 csv文件处理

    json文件处理: 什么是json: JSON(JavaScript Object Notation, JS 对象标记) 是一种轻量级的数据交换格式。它基于 ECMAScri...

  • 正则表达式和re模块

    正则表达式和re模块: 什么是正则表达式: 通俗理解:按照一定的规则,从某个字符串中匹配出想要的数据。这个规则就是正则表达式。标准答案:https://baike.baidu...

  • Python爬虫面试总结

    1. 写一个邮箱地址的正则表达式? 2. 谈一谈你对 Selenium 和 PhantomJS 了解 Selenium 是一个Web 的自动化测试工具,可以根据我们的指令,让...

  • BeautifulSoup4库

    BeautifulSoup4库 和 lxml 一样,Beautiful Soup 也是一个HTML/XML的解析器,主要的功能也是如何解析和提取 HTML/XML 数据。lx...