假设我们要建立一个垃圾邮件分类器:

通过选择选好的单词,然后建立一个向量,向量的内容是对应于单词是否出现:

在实际中,我们通过选取词频最高的n个单词作为特征,然后用来做垃圾分类。
获取数据,“honeypot” project。
下面有几种垃圾邮件分类方案:

假设我们要建立一个垃圾邮件分类器:
通过选择选好的单词,然后建立一个向量,向量的内容是对应于单词是否出现:
在实际中,我们通过选取词频最高的n个单词作为特征,然后用来做垃圾分类。
获取数据,“honeypot” project。
下面有几种垃圾邮件分类方案: