我们在前几篇的分析中,重点研究了House Price回归类型的机器学习比赛项目。在Kaggle网站上与之并列的另外一个比赛项目比House Price 更为悠久,更为热门,它伴随更多人进入机器学习的实践道路。这就是泰坦尼克号的生存分类。
从2012年到2018年8月31日,有9657个团队,10101个参赛者,共计提交了59532个预测报告。可以说这是国际上参与人数最多,经历时间最长的机器学习比赛。
其得分平均指标是准确率ACCURACY。即输入旅客ID后,预测其生存与否的正确率。Accuracy =(TP+TN)/(TP+TN+FP+FN)
The accuracy is the proportion of true results (both true positives
and true negatives) among the total number of cases examined.
得分为1.0,准确率100%,说明该报告预测结果与实际结果全部相符。
与HOUSE PRICE回归竞赛一样,泰坦尼克比赛也有得分排行榜。但是,最大不同是,它只列出最近两个月的最好得分。超过两个月就从排行榜移除。有意思的是,这个排行榜最新的No1. 也是中国留学生,USC,在南加州大学,在2018年7月5日提交。(又是7月,在暑假!)

让我们一起来探索吧!
根据网站的RAW DATA,

Score=1.0满分共30名¶









[if !vml]
[endif]



