附上近期在家学习的一段代码,可以爬取网络数据:
import urllib.request
向指定的url地址发起请求,并返回服务器响应的数据(文件的对象)#
utf-8可以更好的翻译出代码#
response=urllib.request.urlopen("http://www.baidu.com")
读取文件的全部内容,会把读取到的数据赋值给一个字符串变量#
data=response.read()
print(data)
print(type(data))#元素类型#
print(len(data))#计算字符串的长度/计算列表元素的个数/计算字典的总长度/计算元组元素的个数#
print(type(data[100]))#第100个数据的类型#
print(type(data[100].decode("utf-8")))#转换成字符串处理#
网页存到文件里,字符串或者二进制文件用wb,文本文件用w#
with open("文件保存路径", "wb") as f:
f.write(date)