XGBOOST查看特征分数

    #y = bst.predict(sub_trainning_data)

    feature_score = bst.get_fscore()  
    feature_score = sorted(feature_score.items(), key=lambda x:x[1],reverse = True)  
    fs = []
    for (key,value) in feature_score:
         fs.append("{0},{1}\n".format(key,value))
    with open('../sub/submission.csv','w') as f:
         f.writelines("feature,fscore\n")
         f.writelines(fs)

    df = pd.DataFrame(feature_score , columns=['feature', 'fscore'])  
    df['fscore'] = df['fscore'] / df['fscore'].sum()  
    featp = df.plot(kind='barh', x='feature', y='fscore', legend=False, figsize=(6, 10))  
    plt.title('XGBoost Feature Importance')  
    plt.xlabel('relative importance')

最后编辑于：2017.12.07 03:41:44

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

Regression-房价预测-(2/4)-读入并查看数据特征
这是Regression-房价预测的第（2）篇笔记。介绍outline里的： Load data Data exp...
_藏九_阅读 2,607评论 0赞 0
基于python 的分类算法模板 -- 数据库索引、特征提取、分类、分类结果查看
我是用 jupyter notebook写的，各个功能模块清楚分明，顺便推荐给大家。以图片分类为例：主要依赖于...
vola_lei阅读 6,483评论 0赞 3

XGBoost特征重要性以及CV
1 feature importance gradient boosting 有一个优点是可以给出训练好的模型的特...
0过把火0阅读 13,232评论 0赞 6
读书| 怎么确定ta是对的人《Is He Mr Right?》
Is He Mr Right? : Everything you need to know before ...
奔跑吧Sheila阅读 5,510评论 1赞 9
成千上万个路口，总有一个人要先走（三）
矿泉水女孩被她妈拖着去街上买新衣服过年，七点钟就开始让她起床，九点过去了，还躲在被窝里，声称自己被床绑架了，哪也去...
熬粥煲汤阅读 2,286评论 0赞 0

赞1赞

赞赏

手机看全文