2018-09-07

MALICIOUS URL DETECTION USING CONVOLUTIONAL NEURAL NETWORK - 2017

这篇主要思想是先利用blacklist对URL进行过滤，blacklist里面有的URL直接输出为恶意，其他URL数据使用三种算法进行进一步判断，三种算法依次是：SVM、逻辑回顾、CNN，其中SVM使用TF-IDF特征，CNN使用word2vec特征。
数据集：https://github.com/faizann24/Using-machine-learning-to-detect-malicious-URLs/tree/master/data 恶意URL样本从网站上爬取，正常URL样本使用现有的，共420464个URL，其中恶意的有75643个。
结论：SVM和CNN的效果都略好于逻辑回归

2018-09-07

MALICIOUS URL DETECTION USING CONVOLUTIONAL NEURAL NETWORK - 2017

推荐阅读更多精彩内容