2018-09-07

MALICIOUS URL DETECTION USING CONVOLUTIONAL NEURAL NETWORK - 2017

这篇主要思想是先利用blacklist对URL进行过滤,blacklist里面有的URL直接输出为恶意,其他URL数据使用三种算法进行进一步判断,三种算法依次是:SVM、逻辑回顾、CNN,其中SVM使用TF-IDF特征,CNN使用word2vec特征。
数据集:https://github.com/faizann24/Using-machine-learning-to-detect-malicious-URLs/tree/master/data 恶意URL样本从网站上爬取,正常URL样本使用现有的,共420464个URL,其中恶意的有75643个。
结论:SVM和CNN的效果都略好于逻辑回归

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 目录|每一刻都是崭新的 上一章 文|于一潇 8、 柳婷的性子烈,在和许宜军的离婚大战中,她各种手段都使上了。到了最...
    于一潇阅读 388评论 11 12