什么样的特征是一个好特征

引言

特征是非常重要的——特征决定了模型的上限,而算法只是在逼近这个上限。

好特征的标准

1、模型角度
带有准确的独立的意义,即该特征含义非常明确,能够恰好表达这个含义。

2、数值角度
是经过了合理的归一化的;表示形式上与其他特征类似,易于进行concat等操作

如何得到一个好特征

1、含义上的仔细确认

2、选择合适的编码形式

3、选择合理的归一化方法

常见的处理办法

进化算法:Fitness function、Selection、Crossover、Mutation

统计方法:Feature significance hypothesis testing、Multiple testing procedure

机器学习方法:基于决策树的模型、learning to Rank

推荐阅读更多精彩内容

  • 第一天, 我想你是知道是什么的第一天。 此刻的你会在想什么:想念如果会有声音,不愿那是悲伤的哭泣。 到如今与你相遇...
    维他柠檬茶阅读 65评论 0 0
  • 理论上来说,我们现在的小家庭生活还算可以,一切都还过得去,我和老婆大学2年级一起,毕业工作两年即买了房子,安家贵阳...
    贵阳琥珀阅读 195评论 0 0
  • 一直以来我被一只无形的大手使劲的推着,以至于我无法去欣赏路边的风景。朋友圈里消息不断,可都是什么内容,我也...
    茗馨正在输入中阅读 375评论 1 2