决策树对那些用来构建自己的数据表现地好,可能对新数据表现不好
因此出现了随机森林,它继承了决策树简洁的优点,同时还很灵活呢
随机森林 = bagging + decision tree
随机森林构建:1.构建一个bootstrapped dataset(见一幅图系列[1])
2.构建蓝色的判断模块时,只随机选取数据的部分特征
重复这一方法,就能构造出很多不同的树。测试时所有树都给一个结果来投票。
https://www.youtube.com/watch?v=J4Wdy0Wc_xQ&list=PLKXNhb-Z12V6pQncaPCHCneQPnHGyrfe_