问答平台实习项目

从八月底到昨天,整整三个月,边看视频学技术栈边写代码,每天晚上挤时间完成了这个项目,还是想为明年实习做一个项目上的准备。最初是想做一个深度学习方面的项目,当时对这方面基础知识的储备还不够,如今也还在看视频和文档学习,因此选择了web项目。其实对于以后工作的方向到底是算法还是研发现在也说不清楚,等明年初根据自己的学习情况再做进一步的打算。

接下来学校的课越来越集中,各种考试也陆续而至,深度学习也还在继续学习,因此留给项目上的准备时间也捉襟见肘,但每天还是会坚持写算法题,相信明年会越来越好。

这个项目是以现在的知乎、牛客网这类问答平台为原型,基于springboot的SSM框架的Java web应用项目。数据库使用了redis和mysql,同时通过一个异步消息框架来实现事件的异步处理,并使用爬虫对网站进行数据填充。

目录

  • 项目的基本框架及配置
  • AOP和IOC
  • MySQL+MyBatis
  • 注册与登录的实现
  • 发表问题+敏感词过滤
  • 发表评论和站内信
  • Redis实现点赞和点踩功能
  • 异步消息机制
  • 关注+粉丝列表的实现
  • Timeline与新鲜事,推拉模式下的Feed流
  • 使用爬虫爬取数据,对网站进行数据填充
  • 功能扩展以及深度扩展

项目的基本框架及配置

创建git仓库,本地配置idea并测试pull和push。

创建springboot工程,导入web,velocity和aop的包。

生成maven项目,pom.xml包含上述依赖。

controller中使用注解配置,requestmapping,responsebody基本可以解决请求转发以及响应内容的渲染。responsebody自动选择viewresolver进行解析。

使用pathvariable和requestparam传递参数,使用velocity编写页面模板,注意其中的语法使用。常用!{}和{}。

使用http规范下的httpservletrequest和httpservletresponse来封装请求和相响应,使用封装好的session和cookie对象。

使用重定向的redirectview和统一异常处理器exceptionhandler。

AOP和IOC

IOC解决对象实例化以及依赖传递问题,解耦。

AOP解决纵向切面问题,主要实现日志和权限控制功能。

aspect实现切面,并且使用logger来记录日志,用该切面的切面方法来监听controller。

MySQL+MyBatis

使用mysql创建数据库和表。

加入mybatis和mysql的maven仓库,注意,由于现在版本的springboot不再支持velocity进而导致我使用较早版本的springboot,所以这里提供一可以正常运行的版本设置。

springboot使用1.4.0,mybatis-spring-boot-starter使用1.2.1,mysql-connector-java使用8.0.12。

注意mybatis的注解语法以及xml的配置要求,xml要求放在resource中并且与dao接口在相同的包路径下。

application.properties增加spring配置数据库链接地址。

两个小工具:

  • ViewObject:方便传递任何数据到
  • VelocityDateTool:velocity自带工具类

写好静态文件html css和js,并且注意配置。

  • spring.velocity.suffix=.html 保证跳转请求转发到html上
  • spring.velocity.toolbox-config-location=toolbox.xml

注册与登录的实现

新建数据表login_ticket用来存储ticket字段。该字段在用户登录成功时被生成并存入数据库,并被设置为cookie,下次用户登录时会带上这个ticket,ticket是随机的UUID字符串,有过期时间以及有效状态。

使用拦截器interceptor来拦截所有用户请求,判断请求中是否存在有效的ticket,如果有就将用户信息写入Threadlocal。所有线程的threadlocal都被存在一个叫做hostholder的实例中,根据该实例就可以在全局任意位置获取用户的信息。

该ticket的功能类似session,也是通过cookie写回浏览器,浏览器请求时再通过cookie传递,区别是该字段是存在数据库中的,并且可以用于移动端。

通过用户访问权限拦截器来拦截用户的越界访问,比如用户没有管理员权限就不能访问管理员页面。

配置了json工具类以及md5工具类,并且使用Java自带的盐生成api将用户密码加密为密文。保证密码安全。

数据安全性的保障手段:https使用公钥加密私钥解密,比如支付宝的密码加密,单点登录验证,验证码机制等。

发表问题+敏感词过滤

发布问题时检查标题和内容,防止xss注入,并且过滤敏感词。

防止xss注入直接使用HTMLutils的方法即可实现。

过滤敏感词首先需要建立一个字典树,并且读取一份保存敏感词的文本文件,然后初始化字典树。最后将过滤器作为一个服务,让需要过滤敏感词的服务进行调用即可。

发表评论和站内信

首先建立表comment和message分别代表评论和站内信。

评论的逻辑是每一个问题下面都有评论,显示评论数量,具体内容,评论人等信息。

消息的逻辑是,两个用户之间发送一条消息,有一个唯一的会话id,这个会话里可以有多条这两个用户的交互信息。通过一个用户id获取该用户的会话列表,再根据会话id再获取具体的会话内的多条消息。

逻辑清楚之后,再加上一些附加功能,比如显示未读消息数量,根据时间顺序排列会话和消息。

本节内容基本就是业务逻辑的开发,没有新增什么技术点,主要是前后端交互的逻辑比较复杂,前端的开发量也比较大。

Redis实现点赞和点踩功能

首先了解一下redis的基础知识,数据结构,jedis使用等。

编写list,string,hashmap,set,sortset的测试用例,熟悉jedis api。

开发点踩和点赞功能,在此之前根据业务封装好jedis的增删改查操作,放在util包中。

根据需求确定key字段,格式是 like:实体类型:实体id 和 dislike:实体类型:实体id 这样可以将喜欢一条新闻的人存在一个集合,不喜欢的存在另一个集合。通过统计数量可以获得点赞和点踩数。

一般点赞点踩操作是先修改redis的值并获取返回值,然后再异步修改mysql数据库的likecount数值。这样既可以保证点赞操作快速完成,也可保证数据一致性。

异步消息机制

在之前的功能中有一些不需要实时执行的操作或者任务,我们可以把它们改造成异步消息来进行发送。

具体操作就是使用redis来实现异步消息队列。代码中使用事件event来包装一个事件,事件需要记录事件实体的各种信息:一个异步工具类(事件生产者+事件消费者+eventHandler接口),让以后各种事件的实现类来实现这个接口。

事件生产者一般作为一个服务,由Controller中的业务逻辑调用并产生一个事件,将事件序列化存入redis队列中,事件消费者则通过一个线程循环获取队列里的事件,并且寻找对应的handler进行处理。

整个异步事件的框架开发完成,后面新加入的登录,点赞等事件都可以这么实现。

关注+粉丝列表的实现

新增关注功能,使用redis实现每一个关注对象的粉丝列表以及每一个用户的关注对象列表。通过该列表的crud操作可以对应获取粉丝列表和关注列表,并且实现关注和取关功能。

由于关注成功和添加粉丝成功时同一个事务里的两个操作,可以使用redis的事务multi来包装事务并进行提交。

除此之外,关注成功或者被关注还可以通过事件机制来生成发送邮件的事件,由异步的队列处理器来完成事件响应,同样是根据redis来实现。

对于粉丝列表,除了显示粉丝的基本信息之外,还要显示当前用户是否关注了这个粉丝,以便前端显示。

对于关注列表来说,如果被关注对象是用户的话,除了显示用户的基本信息之外,还要显示当前用户是被这个用户关注,以便前端显示。

Timeline与新鲜事,推拉模式下的Feed流

微博的新鲜事功能介绍:关注好友的动态(好友的点赞和发表的问题等),关注了某个问题,这些都是feed流的一部分。

在知乎中的feed流主要体现于:关注用户的评论行为,关注用户的关注问题行为。

feed流主要分为两种,推模式和拉模式。推模式主要是把新鲜事推送给关注该用户的粉丝,本例使用redis来存储某个用户接受的新鲜事id列表,这个信息流又称为timeline,根据用户的唯一key来存储;拉模式主要是用户直接找寻自己所有关注的人,并且到数据库去查找这些关注对象的新鲜事,直接返回。

推模式主要适合粉丝较少的小用户,因为他们的粉丝量少,使用推模式产生的冗余副本也比较少,并且可以减少用户访问的压力。

拉模式主要适合大v,因为很多僵尸粉和非活跃用户根本不需要推送信息,用推模式发给这些僵尸粉或者非活跃用户就是浪费资源。所以让用户通过拉模式请求,只需要一个数据副本即可。同时如果是热点信息,这些信息也可以放在缓存,让用户首先拉取这些信息,提高查询效率。

使用feedhandler异步处理上述的两个事件,当事件发生时,根据事件实体进行重新包装,构造一个新鲜事,因为所有新鲜事的格式是一样的。需要包括:日期,新鲜事类型,发起者,新鲜事内容,然后把该数据存入数据库,以便用户使用pull模式拉出。

为了适配推送模式,此时也要把新鲜事放到该用户所有粉丝的timeline里,这样的话就同时实现了推和拉的操作了。

使用爬虫爬取数据,对网站进行数据填充

安装python3.x并且配置环境变量。同时安装pycharm,安装pip。

安装好以后,先熟悉python的语法,写一些例子,比如数据类型,操作符,方法调用,以及面向对象的技术。

因为数据是要导入数据库的,所以这里安装MySQLdb的一个库,并且写一下连接数据库的代码,写一下简单的crud进行测试。

使用requests库作为解析http请求的工具,使用beautifulsoup作为解析html代码的工具,请求之后直接使用css选择器匹配。即可获得内容。

当然现在我们有更方便的工具pyspider,可以方便解析请求并且可以设置代理,伪装身份等,直接传入url并且写好多级的解析函数,程序便会迭代执行,直到把所有页面的内容解析出来。这里我们直接启动pyspider的web应用并且写好python代码,就可以执行爬虫了。

知乎:先找到问题,再把问题下所有的回答进行爬取,最后把问题和评论一起处理。

功能扩展以及深度扩展

功能扩展

  • 用户注册,邮箱激活流程
  • 管理员后台管理
  • timeline推拉结合
  • 个性化首页,timeline更多事件

深度扩展

  • 搜索结果排序打分
  • 爬虫覆盖用户,评论,内容去html标签
  • 个性化推荐
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,033评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,725评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,473评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,846评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,848评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,691评论 1 282
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,053评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,700评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,856评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,676评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,787评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,430评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,034评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,990评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,218评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,174评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,526评论 2 343