机器学习之R语言数据可视化

1、先导入一个formula包,训练模型使用

备注:先要完成数据的预处理(数据导入和分割,training_set, test_set)为分割好的数据

install.packages('Formula')

2、formula包 为数据喂养线性函数 Fitting Linear(formula:画线的方法,lm画线的模型)

datasets = read.csv('Salary_Data.csv')

#数据分割

#用

library(caTools)

#set.seed(123)里面有数据就是随机处理

set.seed(123)

split = sample.split(datasets$Salary, SplitRatio = 2/3)

training_set = subset(datasets, split == TRUE) #2/3

test_set = subset(datasets, split == FALSE) #1/3

#数据规范化(缩放)

#training_set[,2:3 ] = scale(training_set[, 2:3])

#test_set[,2:3 ] = scale(test_set[,2:3 ])

#导入formula包 为数据喂养线性函数 Fitting Linear(formula:画线的方法,lm画线的模型)

regression = lm(formula = Salary ~ YearsExperience, data = training_set)

解释:这张图下次解释,特别是“*”号


这图很重要,分析结果

3、查看模型预期结果

#预期结果

y_pred = predict(regression, newdata = test_set)

运行上面代码后,在控制台敲上y_pred,2:工作年限 37766.77:预测出来的Salary


预测的结果

4、数据可视化

(1)、导入包(相对勾选这是第二种方式)

#数据可视化

install.packages('ggplot2') #导包的第二种方式


导包的第二种方式

(2)、上数据可视化代码,这里于Python 有点差异,用“+”号 还有颜色用colour 

library(ggplot2)

ggplot() +

geom_point(aes( x = training_set$YearsExperience, y = training_set$Salary), colour = 'red')  + #画点,Colour 红色

geom_line(aes( x = training_set$YearsExperience, y = predict(regression, newdata = training_set)), colour = 'blue') +  #画线

ggtitle('Salary vs Experience') +

xlab ('Years of experience') +

ylab ('Salary')


用R语言画出来的可视化视图
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 姓名:巢环环 公司:宁波大发化纤有限公司 期数:第264期六项精进 组名:努力一组 【日精进打卡第25天】共25天...
    巢环环阅读 1,118评论 0 0
  • 亲爱的红嘴海鸥,每年你都会从遥远的西伯利亚准时来青岛赴约。或许,你已经爱上了青岛这个文艺清新的城市,也或许,...
    热评墙阅读 3,328评论 0 1
  • 东家最近开了个子公司, 所以需要申请邓白氏首先, 网上已经有个小伙伴, 写了关于申请苹果开发者账号的文章, 也很详...
    陈长见阅读 6,426评论 1 1
  • 安装EPEL Release,因为安装需要使用其他的repo源,所以需要EPEL支持 yum install -y...
    你说你要一场阅读 1,287评论 0 0
  • 欢迎赏光交流,打赏8元即量身为你的名字作诗,世上唯一的一首,水平杠杠的'。还有策划,金点子,为你的企业,事业腾飞助...
    才哥全才阅读 1,683评论 0 0