3 python 常用的库
itertools : itertools.products() 用于特征工程时精简 for 循环
collections : collections.Counter() 用于寻找出现次数最多的元素
emoji : emoji表情
sys : 设定参数
argparse : 更方便,规范的定义参数
logging : 自动打印日志
os : os.walk() 用于从文件夹读取文件
5 lightgbm,xgboost, catboost,stacking, 5_folds
6 kaggle riiid比赛里关于数据处理,时间空间优化的整理
9 target_encoding, label_count_encoding
11 二分类相关指标优化
12 回归相关指标优化
13 观察特征的库,深入分析
15论特征一把梭对于GBDT的影响,好文啊
15.1 对于造出的很多特征,如何做选择,ieee chris方案
15.2ieee code直达
18由几个特征去定位重复样本
18.1Home Credit Default Risk code直达
18.2Home Credit Default Risk对重复样本的利用
18.3砍手豪队1st方案,包括重复样本的定位