在用python爬荔枝数据时:
这里我打算试验取出1到2页的目标href的其中数字:如图
打算进行对字符串切片时切掉前后的俩个// ,但是始终遍历不出来这些字符串,它们始终存在一个列表中,后来debug下,发现doc.xpath返回的就是一个列表,里面包含了这些字符串,而我以为返回的href是单独的字符串,所以切片总是切这个列表。
下面就可以对目标切片了。
在用python爬荔枝数据时:
这里我打算试验取出1到2页的目标href的其中数字:如图
打算进行对字符串切片时切掉前后的俩个// ,但是始终遍历不出来这些字符串,它们始终存在一个列表中,后来debug下,发现doc.xpath返回的就是一个列表,里面包含了这些字符串,而我以为返回的href是单独的字符串,所以切片总是切这个列表。
下面就可以对目标切片了。