临近高考季,这里做了个辅助志愿填报的QQ群机器人,记录下具体实现过程。
实现的效果如下:
本文为系列文章,如需完整复现,请按照以下次序依次阅读:
环境
本文使用的环境如下:
需求分析
机器人应该具备的功能如下:
- 用户输入学校名返回院校基本信息
- 用户输入分数返回一分一段信息
- 用户输入分数返回对应的往年的等位分
- 用户输入学校名返回院校分数线
- 用户输入学校名返回学校招生专业
- 用户输入学校名+专业名返回该学校专业分数线
- 用户输入分数推荐院校(进阶功能)
- 用户输入分数+专业推荐院校(进阶功能)
对应这些功能,需要的数据如下:
- 学校基本信息
- 一分一段信息
- 学校招生专业
- 学校分数线
- 学校专业分数线
本文仅记录前三个功能的实现,后续实现见下一篇文章
数据获取
院校基本信息获取
见之前的文章:爬虫实战2——大学院校专业分数线信息数据库爬取构建
一分一段数据获取
直接到这个网站上下载Excel附件,下载完成后手动打开复制数据到一张表格即可
程序实现
QQ机器人框架实现
这里使用了yes酱这个开源的机器人,在其基础上进行二次开发而成,具体实现见之前的文章:Python开发QQ聊天机器人——Yes酱的部署与调教
数据库实现
这里使用Navicat将上一步得到的数据导入到数据库中。
-
首先,新建数据库,名字随便取就行:
-
然后在
表
那里鼠标右键,选择导入向导
:
-
选择对应的文件格式:
-
然后选择导入的数据文件,一直默认下一步即可,直到该页面,修改图中的字符长度,使其满足数据条件之后再点下一步:
-
之后依然无脑操作,最后点开始即可,导入完毕点击关闭,双击表即可看到已经成功导入:
一分一段信息导入同理,需要注意的是,该信息导入后,对数据执行sql语句进行处理:
UPDATE table_name SET type='文科' WHERE type='文'
接口实现
-
首先在yes酱的源码
send_message
文件夹中的文件talk_to_user.py
中添加接口:
然后在
send_message
文件夹中的文件word_detect.py
中添加对应的函数:
def college_data(msg):
pass
def score2grade_data(msg):
pass
- 封装数据库的操作,以方便后续函数调用:
def searchDatabase(sql):
conn = pymysql.connect(
host = '127.0.0.1',
port = 3306,
user = 'root',
password = 'password',
charset = 'utf8',
db = 'database_name'
)
cur = conn.cursor()
cur.execute(sql)
result = cur.fetchone()
cur.close()
conn.close()
return result
院校信息接口实现
接下来对上一步新建的接口进行功能完善:
对于用户发送的数据,搜索数据库中对应的大学信息:
sql = "SELECT * FROM table_name WHERE collegeName='{name}'".format(name=msg)
result = searchDatabase(sql)
如果有信息返回,则对信息进行拼接:
returnStr = "【{name}】\n简称:{jiancheng}\n隶属部门:{department}\n院校代码:{collegeCode}\n\n\U0001F4CD 学校地址\n{address}\n\n\U0001F338 学校特色\n{collegeFeatures}\n\n\U0001F335 学校简介\n{theSummary}\n\n具体信息详见:https://baike.baidu.com/item/{urlname}".format(name=msg, department=result[3], jiancheng=result[7] if result[7]!=' ' else '无', collegeFeatures=result[10].replace('\\n', '\n').replace('\n\n', '\n') if result[10]!=' ' else '无', theSummary=result[13].replace('\\n', '\n'), collegeCode=result[12], address=result[11].replace('\\n', '\n') if result[11]!=' ' else result[4], urlname=quote(msg))
其中有个小trick,那就是对返回的数据加上了emoji表情,这里参考了这篇博客,用到的emoji代码可以在这个网站上找到,其中的+
号用相应数量的0
补齐即可
然后按照yes酱的方式return即可:
return [True, returnStr]
一分一段+等位分接口实现
- 首先,对用户发送的数据进行处理:
msgList = msg.split('科')
if len(msgList)==2:
try:
theType = msgList[0] + '科'
theScore = int(msgList[1])
然后构建sql语句查询最新的一分一段信息:
sql = "SELECT * FROM table_name WHERE score='{score}' AND year='{year}' AND type='{theType}'".format(score=theScore, year=currentYear, theType=theType)
result = searchDatabase(sql)
针对返回的信息,使用其位次信息进行二次查询:
sql2 = "SELECT * FROM table_name WHERE type='{type}' AND year={currentYear} AND ABS(grade-{theGrade})=(SELECT MIN(ABS(grade-{theGrade})) FROM table_name WHERE type='{type}' AND year={currentYear})".format(type=theType, theGrade=theGrade, currentYear=(currentYear-1))
result2 = searchDatabase(sql2)
这里的sql语句用于搜索往年距离该位次最接近的位次,返回其全部信息
然后对两次sql语句的查询结果进行拼接并返回:
returnStr = "{theScore}分对应的位次为:【{grade}】\n和你同分的有【{counts}】人\n\n该位次对应往年的等位分为:\n年份 分数 位次 人数\n{dengweifen}".format(theScore=theType + str(theScore), grade=theGrade, counts=theCounts, dengweifen=dengweifenStr)
return [True, returnStr]
这里考虑到有的数据覆盖不全的情况,比如分值小于100分,数据库中没有对应的位次信息,使用sql语句单独搜索其最高分、最低分、最后一名的位次:
sql5 = "SELECT MAX(score), MIN(score), MAX(grade) FROM table_name WHERE year='{year}' AND type='{theType}'".format(year=currentYear, theType=theType)
result5 = searchDatabase(sql5)
如果用户输入的值大于最高分,则认为其是第一名;反之,若用户输入的值小于最低分,则认为其是最后一名:
if theScore >= result5[0]:
theGrade = 1
elif theScore <= result5[1]:
theGrade = result5[2]
将该段代码添加到之前的代码中即可
实现效果
至此,该机器人的基础功能的前三项已经完全实现,最终的效果如图所示: