如果你有想要特别关注的微博账号,但是又没有装手机微博(或者说关闭了微博的垃圾消息提醒)又不是很喜欢刷微博的人,想要第一时间获取关心的微博消息怎么办呢。
或许你可以试试这样,利用爬虫每隔一小段时间间隔就重新获取一次关注账号的微博,比对是否有新消息,如果有则发送到你的微信账号上,当然也可以发送到你的邮箱,不过微信更及时更友好点。
这个想法最早在一个python课程(很抱歉记不得是哪个课程了,记忆力太差。。)里看到,这里简单实现下。
爬虫部分利用requests库和BeautifulSoup库很容易完成爬取和解析。实现时间间隔就用最简单的睡眠(time.sleep
)。发送到微信使用itchat库发送到自己的文件助手就好了,很简单。
当然电脑端同一微信账号登录只能有一个,也就是不能同时使用该账号的电脑版微信了,解决方案是采用登录微信小号发送给大号的形式,这样消息提醒也更明确,不容易忽略。
这里打包好的可执行程序只是发送文件助手的方案。
链接:http://pan.baidu.com/s/1kVvCpvh 密码:cxza
代码github
效果图,以segmentfault微博账号为例
使用方法
获取你的微博账户cookie
获取用户uid
代码
# 使用pyinstaller 一键生成可执行文件 位于dist目录下
# pyinstaller weibohelper.py --onefile
from bs4 import BeautifulSoup
import time
import requests
from requests.packages.urllib3.exceptions import InsecureRequestWarning
requests.packages.urllib3.disable_warnings(InsecureRequestWarning)
print('请输入cookie:')
cookie = input()
print('请输入uid:')
uid = input()
uids = (uid, )
headers = {
"Cookies": cookie,
"User-Agent":'Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143 Safari/601.1'
}
r = requests.session()
r.headers.update(headers)
# 获取某条微博的评论
def get_comments_from_one_weibo(id):
try:
json = r.get(
('https://m.weibo.cn/api/comments/show?'
'id={0}&page=1').format(id),
verify=False,
).json()
if json['ok'] == 1:
comments = []
for c in json['data']:
comments.append(BeautifulSoup(c['text'], 'lxml').text)
comments.append(c['user']['screen_name'])
comments.reverse()
return comments
else:
return ()
except:
return ()
# 根据用户uid获取该用户第一页的微博消息
def get_single_user_fisrt_weibo(uid):
page_num = 1
nickname = None
weibo = None
try:
json = r.get(
('https://m.weibo.cn/api/container/getIndex?'
'is_search[]=0&'
'visible[]=0&'
'is_all[]=1&'
'is_tag[]=0&'
'profile_ftype[]=1&'
'page={0}&'
'jumpfrom=weibocom&'
'sudaref=weibo.com&'
'type=uid&'
'value={1}&'
'containerid=107603{1}').format(page_num, uid),
verify=False,
).json()
except:
return None, None
if json['ok'] == 0:
print('sth wrong')
return None, None
else:
for card in json['cards']:
if card['card_type'] == 9:
weibo = [
card['mblog']['created_at'],
BeautifulSoup(
card['mblog']['text'], 'lxml'
).text.replace(' \u200b\u200b\u200b', ''),
*get_comments_from_one_weibo(
card['mblog']['id']),
]
nickname = card['mblog']['user']['screen_name'] + ' '
break # 取第一个即可
print('success for', nickname, ' - time', time.ctime())
return nickname, weibo
# 使用itchat登录网页版微信
import itchat
itchat.auto_login()
# 以小号登录形式,要先找到大号的账户
# username = itchat.search_friends(name='xx')[0]['UserName']
username = 'filehelper'
import json
from collections import defaultdict
records = defaultdict(lambda : (None, None))
while 1:
for uid in uids:
nickname, weibo = get_single_user_fisrt_weibo(uid)
try_times = 5
while nickname == None:
nickname, weibo = get_single_user_fisrt_weibo(uid)
try_times -= 1
if try_times == 0:
break
if try_times == 0:
continue
if records[nickname][1:] != weibo[1:]:
# print('发现新微博:', weibo)
itchat.send(
'\n---\n'.join((nickname, *weibo)),
toUserName=username)
records[nickname] = weibo # 记录当前微博信息
with open('data.json', 'w', encoding='utf-8') as f:
json.dump(records, f, ensure_ascii=False)
else:
print('没有新消息', time.ctime())
pass
time.sleep(120)