信息过滤与反垃圾

手段:

1.文本匹配

进行敏感词过滤,维护一个敏感词列表,用户发表的信息中含有敏感词,则进行消毒处理(将敏感词转换成特殊字符)或者拒绝发表

正则表达式

适合敏感词较少且文本较少的情况

Trie树

敏感词多,文本多,高并发

多级Hash表

处理速度快,但浪费空间

2.分类算法

对垃圾信息或者广告贴进行过滤,贝叶斯分类算法。

3.黑名单

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容