爬虫手册(一):python快速入门

因为工作的原因一直在做爬虫的工作,最近就想写一个关于爬虫的系列,一边好好回顾一下自己所学习到的知识,整理一下自己的知识体系,一边也是想分(xuan)享(yao)一下自己多年的经验和心得,方便一下初学者们。
初学爬虫,使用什么语言是第一个选择。因为我是使用python的,这里就以python语言作为这个系列的基础语言。

(一)安装python

先打开终端,输入 python,看看电脑是否已经安装python,通常mac已经安装了,但是是2.7版本。
windows的话就应该没有,windows用户可以去官网下载python。
python现在有两个版本,2.x版本和3.x版本,两个版本都能使用,但语法和工具库上是有区别的,据说2.x版本要在2020年停止维护,所以最好使用3.x版本,直接使用最新版的就好了(我使用的时候是3.7版本)。
下载的时候最好把pip 这个工具下载了。
mac用户如果想安装python3:
1.安装xcode(去app store上下载), 然后安装Xcode command line tool,在终端输入xcode-select --install
2.安装homedrew
ruby-e"$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"
在终端验证一下是否安装成功brew doctor
接着就通过 brew install python3 安装python3
最后通过homebrew

(二)pip的使用

打开终端,输入python -m pip --version ,看看电脑是否已经安装了pip,如果没有,windows用户请去Python官网上下载Windows版本pip安装包,苹果用户就下载mac版本(注意要分清楚你需要的是2.x版本还是3.x版本,pip也分2和3哦)。通常苹果用户是会用然后解压,进入解压后的文件夹至可执行目录,如下图所示:

image

在地址栏那里回车,输入cmd,进入控制台然后输入python setup.py install就可以安装了。

pip是python专用的安装工具,许多第三方库都是通过pip下载的,但要注意,2和3有些库的名字是有区别的,想要下载某个库时需要搜清楚要下载的是2还是3,有些库在3中是不存在或者和2的名字不一样的。
语法:
pip install xxx 安装库使用
pip install xxx==x.x.x(版本号) 安装某个库的某个版本时,在后面加上版本后就好了
pip install -U xxx 更新库
pip uninstall xxx 删除库

easy_install是python的另一种安装工具,有时候使用pip安装不成功时,使用easy_install 就有可能安装成功
easy_install xxx 安装包
easy_install -U xxx 更新包

通过easy_install 安装的包要卸载非常困难,不建议卸载。

(三)python3简单语法

#!/usr/bin/python
# -*- coding: <encoding name> -*-   
#python3默认字符是utf-8,所以可以不加这两句

import xxx  #引入第三方库
from xxx import xxx   #从第三方库映入某个类
input(5)   #输入数字5
print(5)    #print 是python的输出符号,在python2中可以不加(),但python3中加入了必须加
#for 循环
for i in range(1,5):
    print(i)
'''
特殊的 for 循环
i是代表位置,data是list中这个位置的数据
这是python中的特殊语法,可以同时获得位置和数据
'''
for i,data in enumerate(a_list):
    print(i)
    print(data)

if  a > b:
    print('ok')
'''
关于if判断语句的用法,python是使用缩进来判断的,和java是不一样的,没有花括号,多了个“:”。

对了,夹杂点私货,我是个空格党,在sublime text3 里早早设定了tab键=4个空格。
至于其他的,好像没什么要说了,python是门以简单为哲学的语言,很多麻烦的概念都没有

四 编辑器(IDE)

有哪些比较常用的ide呢?
pycharm,sublime text,vs code,vim等等。
有时候在需要大量使用数据分析的工具的时候,使用ipython也是很不错的(一个库?可以在终端使用的编辑器)
我个人比较习惯使用sublime text或者是vi,自己舒服着用就好。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,776评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,527评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,361评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,430评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,511评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,544评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,561评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,315评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,763评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,070评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,235评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,911评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,554评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,173评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,424评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,106评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,103评论 2 352

推荐阅读更多精彩内容