python开发QQ聊天机器人——高考志愿填报辅助机器人

临近高考季，这里做了个辅助志愿填报的QQ群机器人，记录下具体实现过程。
实现的效果如下：

等位分查询

院校信息查询

本文为系列文章，如需完整复现，请按照以下次序依次阅读：

环境

本文使用的环境如下：

Python 3.7
Sublime Text 3
go-cqhttp
Yes酱
MYSQL
Navicat for MYSQL

需求分析

机器人应该具备的功能如下：

用户输入学校名返回院校基本信息
用户输入分数返回一分一段信息
用户输入分数返回对应的往年的等位分
用户输入学校名返回院校分数线
用户输入学校名返回学校招生专业
用户输入学校名+专业名返回该学校专业分数线
用户输入分数推荐院校（进阶功能）
用户输入分数+专业推荐院校（进阶功能）

对应这些功能，需要的数据如下：

学校基本信息
一分一段信息
学校招生专业
学校分数线
学校专业分数线

本文仅记录前三个功能的实现，后续实现见下一篇文章

数据获取

院校基本信息获取

见之前的文章：爬虫实战2——大学院校专业分数线信息数据库爬取构建

一分一段数据获取

直接到这个网站上下载Excel附件，下载完成后手动打开复制数据到一张表格即可

程序实现

QQ机器人框架实现

这里使用了yes酱这个开源的机器人，在其基础上进行二次开发而成，具体实现见之前的文章：Python开发QQ聊天机器人——Yes酱的部署与调教

数据库实现

这里使用Navicat将上一步得到的数据导入到数据库中。

首先，新建数据库，名字随便取就行：

新建数据库
然后在表那里鼠标右键，选择导入向导：

导入向导
选择对应的文件格式：

选择文件格式
然后选择导入的数据文件，一直默认下一步即可，直到该页面，修改图中的字符长度，使其满足数据条件之后再点下一步：

设置数据
之后依然无脑操作，最后点开始即可，导入完毕点击关闭，双击表即可看到已经成功导入：

成功导入

一分一段信息导入同理，需要注意的是，该信息导入后，对数据执行sql语句进行处理：

UPDATE table_name SET type='文科' WHERE type='文'

接口实现

首先在yes酱的源码send_message文件夹中的文件talk_to_user.py中添加接口：

添加入口
然后在send_message文件夹中的文件word_detect.py中添加对应的函数：

def college_data(msg):
  pass
def score2grade_data(msg):
  pass

封装数据库的操作，以方便后续函数调用：

def searchDatabase(sql):
    conn = pymysql.connect(
        host = '127.0.0.1',
        port = 3306,
        user = 'root',
        password = 'password',
        charset = 'utf8',
        db = 'database_name'
    )
    cur = conn.cursor()
    cur.execute(sql)
    result = cur.fetchone()
    cur.close()
    conn.close()
    return result

院校信息接口实现

接下来对上一步新建的接口进行功能完善：

对于用户发送的数据，搜索数据库中对应的大学信息：

sql = "SELECT * FROM table_name WHERE collegeName='{name}'".format(name=msg)
result = searchDatabase(sql)

如果有信息返回，则对信息进行拼接：

returnStr = "【{name}】\n简称：{jiancheng}\n隶属部门：{department}\n院校代码：{collegeCode}\n\n\U0001F4CD 学校地址\n{address}\n\n\U0001F338 学校特色\n{collegeFeatures}\n\n\U0001F335 学校简介\n{theSummary}\n\n具体信息详见：https://baike.baidu.com/item/{urlname}".format(name=msg, department=result[3], jiancheng=result[7] if result[7]!=' ' else '无', collegeFeatures=result[10].replace('\\n', '\n').replace('\n\n', '\n') if result[10]!=' ' else '无', theSummary=result[13].replace('\\n', '\n'), collegeCode=result[12], address=result[11].replace('\\n', '\n') if result[11]!=' ' else result[4], urlname=quote(msg))

其中有个小trick，那就是对返回的数据加上了emoji表情，这里参考了这篇博客，用到的emoji代码可以在这个网站上找到，其中的+号用相应数量的0补齐即可

然后按照yes酱的方式return即可：

return [True, returnStr]

一分一段+等位分接口实现

首先，对用户发送的数据进行处理：

    msgList = msg.split('科')
    if len(msgList)==2:
        try:
            theType = msgList[0] + '科'
            theScore = int(msgList[1])

然后构建sql语句查询最新的一分一段信息：

sql = "SELECT * FROM table_name WHERE score='{score}' AND year='{year}' AND type='{theType}'".format(score=theScore, year=currentYear, theType=theType)
result = searchDatabase(sql)

针对返回的信息，使用其位次信息进行二次查询：

sql2 = "SELECT * FROM table_name WHERE type='{type}' AND year={currentYear} AND ABS(grade-{theGrade})=(SELECT MIN(ABS(grade-{theGrade})) FROM table_name WHERE type='{type}' AND year={currentYear})".format(type=theType, theGrade=theGrade, currentYear=(currentYear-1))
result2 = searchDatabase(sql2)

这里的sql语句用于搜索往年距离该位次最接近的位次，返回其全部信息

然后对两次sql语句的查询结果进行拼接并返回：

returnStr = "{theScore}分对应的位次为：【{grade}】\n和你同分的有【{counts}】人\n\n该位次对应往年的等位分为：\n年份    分数     位次     人数\n{dengweifen}".format(theScore=theType + str(theScore), grade=theGrade, counts=theCounts, dengweifen=dengweifenStr)
return [True, returnStr]

这里考虑到有的数据覆盖不全的情况，比如分值小于100分，数据库中没有对应的位次信息，使用sql语句单独搜索其最高分、最低分、最后一名的位次：

sql5 = "SELECT MAX(score), MIN(score), MAX(grade) FROM table_name WHERE year='{year}' AND type='{theType}'".format(year=currentYear, theType=theType)
result5 = searchDatabase(sql5)

如果用户输入的值大于最高分，则认为其是第一名；反之，若用户输入的值小于最低分，则认为其是最后一名：

                if theScore >= result5[0]:
                    theGrade = 1
                elif theScore <= result5[1]:
                    theGrade = result5[2]

将该段代码添加到之前的代码中即可

实现效果

至此，该机器人的基础功能的前三项已经完全实现，最终的效果如图所示：

院校信息查询

等位分查询