什么样的特征是一个好特征

引言

特征是非常重要的——特征决定了模型的上限,而算法只是在逼近这个上限。

好特征的标准

1、模型角度
带有准确的独立的意义,即该特征含义非常明确,能够恰好表达这个含义。

2、数值角度
是经过了合理的归一化的;表示形式上与其他特征类似,易于进行concat等操作

如何得到一个好特征

1、含义上的仔细确认

2、选择合适的编码形式

3、选择合理的归一化方法

常见的处理办法

进化算法:Fitness function、Selection、Crossover、Mutation

统计方法:Feature significance hypothesis testing、Multiple testing procedure

机器学习方法:基于决策树的模型、learning to Rank

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 第一天, 我想你是知道是什么的第一天。 此刻的你会在想什么:想念如果会有声音,不愿那是悲伤的哭泣。 到如今与你相遇...
    维他柠檬茶阅读 211评论 0 0
  • 理论上来说,我们现在的小家庭生活还算可以,一切都还过得去,我和老婆大学2年级一起,毕业工作两年即买了房子,安家贵阳...
    贵阳琥珀阅读 623评论 0 0
  • 一直以来我被一只无形的大手使劲的推着,以至于我无法去欣赏路边的风景。朋友圈里消息不断,可都是什么内容,我也...
    茗馨正在输入中阅读 659评论 1 2