001 去除特定字符/以特定字符分割
str.split() # 可以去除字符串“两端”的空格
str.replace(' ', '') # 可以去除字符串“中间”的空格
str.split('/') # 将字符串通过/进行分割
示例
movie = '''
1994 / 美国 / 犯罪 剧情
'''
movie = movie.strip()
# 得到得结果就是1994 / 美国 / 犯罪 剧情
movie = movie.replace(' ', '')
# 得到的结果就是1994/美国/犯罪剧情
movie = movie.split('/')
# 这一行表示将字符串通过/进行分割,得到的是一个列表
# 得到的结果是['1994', '美国', '犯罪剧情']
002 startswith / endswith 内容判断
可以判断一个字符串是否以特定的字符开始。例如,在爬虫中,需要拼接url,但是有的url带了https://www.zhihu.com
,有的却不带。
origin_url = 'https://www.zhihu.com'
url_list = ['/question/36539555/answer/595275293', '/question/308663552/a
nswer/577063117', 'https://www.zhihu.com/special/20743868']
for i in range(len(url_list)):
if not url_list[i].startswith('http'):
# 这一行表示如果url_list[i]不是以http开头的话,那么就执行if内部的语句
url_list[i] = origin_url + url_list[i]
print(url_list)
# 得到的最终结果是
['https://www.zhihu.com/question/36539555/answer/595275293', \
'https://www.zhihu.com/question/308663552/answer/577063117', \
'https://www.zhihu.com/special/20743868']
当然有startswith
,自然而然会有endswith
。
url_list = ['https://pic2.zhimg.com/50/v2‐5502c54842dceeb2e8901e884407a7f
d_fhd.jpg', 'https://www.zhihu.com/special/20743868']
for url in url_list:
if url.endswith('jpg'):
# 这一行表示如果url是以jpg结尾的话,就执行if内部的语句
url_list.remove(url)
print(url_list)
# 最终结果是['https://www.zhihu.com/special/20743868']
003 文字拼接
将一堆字符串按照规定连接符拼接起来
dining_list = ['酱香排骨', '鸡蛋饼', '东坡肉']
tag = '-'.join(dining_list)
# 这一行表示用'-'符号将tag这个列表中的每个值连接起来,得到的是一个字符串
# 最终结果是'酱香排骨-鸡蛋饼-东坡肉'
持续更新...