本关学习两个功能:
一、定时爬虫
二、定时邮件
总体上可以将程序分为三个功能块:【爬虫】+【邮件】+【定时】
如何查看网页编码:网页右键——查看网页源代码——会弹出新的标签页——搜索‘charset’后查看编码方式
如何发送邮件:smtplib和email库
import smtplib
from email.mime.text import MIMEText
from email.header import Header
#引入smtplib、MIMETex和Header
mailhost='smtp.qq.com'
#把qq邮箱的服务器地址赋值到变量mailhost上,地址应为字符串格式
qqmail = smtplib.SMTP()
#实例化一个smtplib模块里的SMTP类的对象,这样就可以调用SMTP对象的方法和属性了
qqmail.connect(mailhost,25)
#连接服务器,第一个参数是服务器地址,第二个参数是SMTP端口号。
#以上,皆为连接服务器。
account = input('请输入你的邮箱:')
#获取邮箱账号,为字符串格式
password = input('请输入你的密码:')
#获取邮箱密码,为字符串格式
qqmail.login(account,password)
#登录邮箱,第一个参数为邮箱账号,第二个参数为邮箱密码
#以上,皆为登录邮箱。
receiver=input('请输入收件人的邮箱:')
#获取收件人的邮箱。
content=input('请输入邮件正文:')
#输入你的邮件正文,为字符串格式
message = MIMEText(content, 'plain', 'utf-8')
#实例化一个MIMEText邮件对象,该对象需要写进三个参数,分别是邮件正文,文本格式和编码
subject = input('请输入你的邮件主题:')
#输入你的邮件主题,为字符串格式
message['Subject'] = Header(subject, 'utf-8')
#在等号的右边是实例化了一个Header邮件头对象,该对象需要写入两个参数,分别是邮件主题和编码,然后赋值给等号左边的变量message['Subject']。
#以上,为填写主题和正文。
try:
qqmail.sendmail(account, receiver, message.as_string())
print ('邮件发送成功')
except:
print ('邮件发送失败')
qqmail.quit()
#以上为发送邮件和退出邮箱。
定时:time\datetime\schedule库
import schedule
import time
#引入schedule和time
def job():
print("I'm working...")
#定义一个叫job的函数,函数的功能是打印'I'm working...'
schedule.every(10).minutes.do(job) #部署每10分钟执行一次job()函数的任务
schedule.every().hour.do(job) #部署每×小时执行一次job()函数的任务
schedule.every().day.at("10:30").do(job) #部署在每天的10:30执行job()函数的任务
schedule.every().monday.do(job) #部署每个星期一执行job()函数的任务
schedule.every().wednesday.at("13:15").do(job)#部署每周三的13:15执行函数的任务
while True:
schedule.run_pending()
time.sleep(1)
#15-17都是检查部署的情况,如果任务准备就绪,就开始执行任务。
将三个代码块进行封装
import requests
from bs4 import BeautifulSoup
#引入requests和beautifulsoup库
import smtplib
from email.mime.text import MIMEText
from email.header import Header
#引入 smtplib,MIMEText,Header库
import schedule
import time
#引入schedule和time模块
account = input('请输入你的邮箱:')
password = input('请输入你的密码:')
#获取邮箱账号和密码,皆为字条串格式
receiver = input('请输入收件人邮箱')
#获取收件人邮箱
def weather_spider():
headers = {'user-agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36'}
#封装headers
url = 'http://www.weather.com.cn/weather/101280601.shtml'
#将网址赋值给变量
res = requests.get(url,headers=headers)
#发送requests请求,并把响应内容赋值给变量res中
res.encoding = 'utf-8'
#将编码转换为utf-8格式
res_soup = BeautifulSoup(res.text,'html.parser')
res_h1s = res_soup.find(class_='t clearfix').find_all('h1')
res_weas = res_soup.find(class_='t clearfix').find_all(class_="wea")
res_tems = res_soup.find(class_='t clearfix').find_all(class_="tem")
res_h1 = res_h1s[0].text
res_wea = res_weas[0].text
res_tem = res_tems[0].text
return res_h1,res_wea,res_tem
def send_email(res_h1,res_wea,res_tem):
mailhost = 'smtp.qq.com'
#将qq邮箱服务器地址赋值给变量mailhost,字符串格式
qqmail = smtplib.SMTP()
#实例化smtplib模块SMTP类的对象,这样就可以调用SMTP对象的方法和属性了
qqmail.connect(mailhost,25)
#连接服务器,第一个参数为服务器地址,第二个参数是SMTP的端口号
#以上,皆为连接服务器
qqmail.login(account,password)
#登录邮箱
content = '亲爱的,今天的天气是:'+res_h1+res_wea+res_tem
#输入邮件正文,字符串格式
message = MIMEText(content,'plain','utf-8')
#实例化一个MIMEText邮件对象,三个参数,分别是邮件正文,文本格式和编码
subject = '今日天气预报'
message['Subject'] = Header(subject,'utf-8')
#等号右边是实例化了一个Header邮件头对象,两个参数,分别是邮件主题和编码,赋值给左边变量message['Subject']
#以上为填写主题和正文
try:
qqmail.sendmail(account,receiver,message.as_string())
print('邮件发送成功')
except:
print('邮件发送失败')
qqmail.quit()
#以上为发送邮件和退出邮箱
def job():
print('开始一次任务')
res_h1,res_wea,res_tem = weather_spider()
send_email(res_h1,res_wea,res_tem)
print('任务完成')
schedule.every().day.at('16:10').do(job)
while True:
schedule.run_pending()
time.sleep(1)