机器学习分类方法小结

最近要开始做一个分类器，因此，参考了几篇文献，并在自己的数据上进行了测试，可用。
1. 数据
当然了，需要准备两个数据集合，一个数据集合作为训练集合（train_dat），另一个集合作为检验集合（test_dat），也可以准备多个验证集合。
2 分类器方法：
在我的数据集中训练集合中，sample 是标签列，且使用全部基因，因此，训练模型的时候，formula 基本都是sample~., ，废话不多说，开始上代码。

（1）决策树，使用的是rpart R包进行模型的构建

  fit<-rpart(sample~.,data=train_dat,method='class')
  predictRes<-predict(fit,test_dat,type="class")
  table(test_dat$sample, predictRes) ##可查看分类效果

（2）C4.5 决策树，是比较经典的方法

 fit<-ctree(as.factor(sample)~.,data=train_dat)
  predictRes<-predict(fit,newdata=test_dat)

（3）C5 tree

fit<-C5.0(as.factor(sample)~.,data=train_dat,trials=50)
  predictRes<-predict(fit,newdata=test_dat)

(4) 朴素贝叶斯

fit<-naiveBayes(sample~.,data=train_dat,)
 predictRes<- predict(fit, newdata = test_dat)

(5) kNN 聚类

  classifier_knn <- knn(train = train_dat[,-ncol(train_dat)],
                        test = test_dat,
                        cl = train_dat$sample,
                        k = n)

(6)随机森林

classifier_RF = randomForest(x = train_dat[,-ncol(train_dat)],y = as.factor(train_dat$sample),ntree = 500,type = "class")
  predictRes= predict(classifier_RF, newdata = test_dat,type = "class")

(7) 支持向量机这个需要自己选择内核函数

 classifier = svm(formula =as.factor(sample) ~ .,data = train_dat,type = 'C-classification',kernel = 'polynomial')
  predictRes = predict(classifier, newdata = test_dat)

就先到这里了，后面遇到其他模型会继续补充记录。。。
未完待续。。。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

禁止转载，如需转载请通过简信或评论联系作者。

机器学习分类方法小结

机器学习分类方法小结

相关阅读更多精彩内容

友情链接更多精彩内容