能用代码解决的就尽量不要用人工去完成。我就是这么爱折腾!
作为@IT专题主编,虽然文章收录量不大(欢迎踊跃来稿哈!),但也每天固定时间收稿、拒稿。第一时间读到好文章的心情跟上首页也差不多了。
遇到好的文章,需要与作者增加联系,怎么办?当然是发简信。遇到文章比较好,但暂时不符合收录要求,怎么办?发简信。还有拒稿要说明原因和建议,怎么办?发简信。
我有这么多发简信的需求和应用场景,能不能打造一款简信助手?她就是简爱(V0.1),其实是简AT。
开始干!
一、简书的登录问题
简书的登录采用了滑块,这点对于Python实现模拟登录比较麻烦。Python实现滑块登录我还没有好的思路。不过之前做过使用Cookie实现模拟登录。简单方便。
Cookie在这里,注意这里用的是Request Headers中的Cookie
构造headers(包含Cookie),直接粘贴过来好了。
header = {
'Accep': '*/*;q=0.5, text/javascript, application/javascript, application/ecmascript, application/x-ecmascript',
'Accept-Encoding': 'gzip, deflate',
'Accept-Language': 'zh-CN,zh;q=0.8',
'Connection': 'keep-alive',
'Content-Length': '269', #这个是你要发送的简信的长度
'Content-Type': 'application/x-www-form-urlencoded; charset=UTF-8',
'Cookie': 'default_font=font2; Hm_lvt_0c0e9d9b1e7d617b3e6842e85b9fb068=1467858560,1467861595,1468075266,1469509744; gr_user_id=52af1783-5e41-4ce9-affa-2cc2c633f19e; read_mode=day; __utmt=1; __utma=194070582.1916883934.1464907276.1470908183.1470917177.603; __utmb=194070582.76.10.1470917177; __utmc=194070582; __utmz=194070582.1470908183.602.28.utmcsr=baidu|utmccn=(organic)|utmcmd=organic; __utmv=194070582.|2=User%20Type=Member=1; gr_session_id_81aa392bc97abf45=ad1edfc4-8fd6-4a3e-8884-49fbb62b3f78; _session_id=UUVJNzVUQ1hRUW5BWUJUZmkwUGhHYUxadFA2YnVQMlJzRG9VZ1hMOGVCZ3VZc3NYMFhNMmJYUXJOUHk2SldFU1NYT1ZTQmhLQ0xEc3BMcm56Um5oTlJyM29KWkwxZHVWY0Y0dGJ6VlJzS2lFNUpORENoZTdHTUltZzg5MHo4RjVhT0NuVjJxdUpaZnFsUGp3MVExTks5SDUyL29aaFBBSkNReFp5TDh6Qnl3clJBblBxUllaaldpV0JMak0yMjFxTjRFdloxbCsxYjY3M2dJS1YvaUVqL1VZbVBlRTlxRmU2elErUkVHS3BtSmdoY3F4YktpbEtCeEZreWQ5WStWMS9SSFV6bmJhMW9WWGp0enRYMmNTakNrQ2E0YUs2SkYrdjRpV0MzNUwwTC9SSWpoeFZvYk5UNUFvalFtUUJaNGJlRWFIczhwcTNIbW1ScGlCblVrK0M1S25YS0FMVDFoRDVuWHpQSW9IcXlmenRIY1J4Z0dHcVBCWExCSXdUdEw5ZndjbEhhRUxvOFJUTVBFTCtySk9ubXVSRlg5YjZuNWxNY1NZWXpCdW9FR0xVYm5rNE5wVXdnaDJFVzg3Y3o0Y0xpL2xDcHJVVTEwWHNMWFdDNEdlYnNZSmw3Wlg4Vzh3enVEVVhtamRRTG1YcUcreTNlcE1CMHNZOVphMjhtZE5ZSFUrVWRHaGFiMXdZOXNBKytacnExVGlkTjZUQ1kzcndDMm5GY3JydTJKWFdENFQwVlpQL2dLZ21mN0ZrNjg3N3c4OGV1R25tYzBuSzZwSjFsZ2gzZnU1ZGFpMmNBb3l6RnNJSXEwYjROT0ZKU0hML0lGV2V6QStqVEFQKzJjMi0tK1h6ZkdYSTRqOWtHTDQ5ZUhCUEpqdz0911--4f2a5f9c7061d39eb40d072e9fd6804d881476b2',
'Host': 'www.jianshu.com',
'Origin': 'http://www.jianshu.com',
'Referer':'http://www.jianshu.com/chats/new?mail_to=1813433',
'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36',
'X-CSRF-Token':'eTbi1v6ofCJspoSBGEk7aPfpZ5k8eTNpj6HocN47GrtjzQRxADcibc1Q1/V5CFJ2rsclhWtsYH8zlh6NYe3SqA==',
'X-Requested-With':'XMLHttpRequest'
}
二、提交简信表单URL及表单字段
发送一条简信,使用Chrome审查元素的Elements, Network 找到发送简信提交的URL和表单数据。
/chats/4753687/chat_message
中间的数字就是发往的简书用户ID
简信的表单字段:
chat_message[content] ,utf8, commit
构造发送的简信表单数据:
data = {
'chat_message[content]':content,
'utf8':'✓',
'commit':'发送'
}
三、发送简信的代码
一行代码:
requests.post(url, data=data, headers=header)
至此,简书登录发送简信的功能完成。然后是收录文章的用户检索,拒稿不同类型,发件不同内容简信。
关于使用Cookie实现验证登录,参见文章 Scrapy用Cookie实现模拟登录