Python爬虫学习之变量和字符串(基础了解篇)

1、变量

python中通过等号直接将某值直接赋值给某变量:
例1:a = 1 #即将数值1赋值于变量
▶python中语句结束不需要以分号,变量不需要提前定义。
例2:现尝试对a、b两变量进行赋值,再对其值进行调换:

a=1
b=2
t=a
a=b
b=t
print(a、b)
#result 2 1
2、字符串中的“加法”和“乘法”

由于Python进行爬虫的过程中,对象大部分回事文本的形式,所以字符串的用法也就显得尤为重要。
在Python中,字符串由双引号或单引号以及引号中的字符组成。接下来,我们分别对字符串的“加法”和“乘法”进行举例演示:
1)加法:

a="hello"
b=' world'
print(a+b)
#result hello world

▶当我们在爬虫的过程中会经常需要用到URL,此时我们就可以通过文本的形式将网址链接的几个部分进行连接,从而形成完整的网页地址的链接。
2)乘法:

a=' hello world'
print(a*3)
#result  hello world hello world hello world

▶将字符串乘以某一数值,意思就是将字符串复制出该数字所对应的份数。

3、字符串的切片和索引

字符串中的每个元素都有其对应的位置编号,通过定位的方式获取单个元素信息或部分元素的信息以达到索引和切片的效果。
例:

a='hello world'
print(a[0])
# result  h
print(a[0:5])
# result  hello
print(a[-1])
# result  d

▶Python中对于位置索引的编号从左往右是从0开始,依次累加;而倒过来的排序是从-1开始依次累加。如下图:


字符串索引及切片示例

▶由操作结果可知:a[0:5]中5所标识的元素并未被打印出来,其中是因为,该切片范围是首位是闭区间,末尾是开区间的原理,末位是不会被包含到范围中的。
▶在爬虫实战中,经常会通过字符串的切片和索引,提取需要的部分,剔除一些不需要的部分。

4、字符串的方法

这里只额外介绍几个爬虫过程中会用到的方法,如:

1.split()方法
a='www.baidu.com'
print(a.split('.'))
# result  ['www', 'baidu', 'com']

split()通过给定的分隔符(上例的分隔符是‘ . ’),将一个字符串分割为一个列表。
▶如果没有提供任何分隔符,程序会把所有的空格作为分隔符(空格、制表、换行等)。

2.replace()方法
a='There  is  apples'
b=a.replace('is' , 'are')
print(b)
# result     There  are  apples
3.strip()方法
a='  python  is  cool'
print(a.strip())
#  result   python  is  cool

▶strip()方法返回的结果是去除两侧(不包括内部)空格的字符串,也可以指定需要去除的字符,将它们列入到参数中即可。
例:

a=" ***python *is * good*** "
print(a.strip("*!"))
#  result   python *is *good

▶strip()是针对字符串两侧的字符进行去除的处理,在我们进行爬虫操作的过程中,常会遇到爬取到的文本中,文本的两侧有多余的空格,我们便可以用这种方法来将字符串两侧多余的空格给去除掉。

4.format()方法
a=" {} is my love".format('python')
print(a)
#  result  python  is  my  love

▶字符串格式化符就像是做选择题,留了空给做题者选择,在爬虫的过程中有些网页的链接的部分参数是可变的,这时使用字符串格式化符可以减少代码的使用量。
例:

content=input("请输入搜索内容:")
url_path="https://www.pexels.com/search/{}/".format(content)
print(url_path)
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,001评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,210评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,874评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,001评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,022评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,005评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,929评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,742评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,193评论 1 309
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,427评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,583评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,305评论 5 342
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,911评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,564评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,731评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,581评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,478评论 2 352

推荐阅读更多精彩内容