学习knn需要解决以下问题
1.什么是knn
k近临算法就是解决新来的成员应该归属哪个社区的问题。knn通过特征计算选择k个最近的邻居,根据邻居所属社区来决定新成员的归属。
2.knn属于有监督聚类
3.计算距离的特征需要标准化处理,为什么?
补充:如果社区有很多特征/属性,我们如何选择最合适的
4.计算距离的方法很多,包括欧式距离、眀式距离等,这需要考虑特征属于连续还是分类变量
5.多个特征计算距离需要考虑加权
6.r及python的实现方法
7.训练与检验需要考虑交叉验证
8.准确率,敏感性,特异性评估