R语言中神经网络算法的使用

神经网络

leengsmile
2016年9月21日

神经网络

本文介绍R语言中神经网络的使用,并对西瓜数据集做分类预测。

为保证数据的可重复性,需要先设置随机数种子。

set.seed(1071)

首先读入西瓜数据集3.0

watermelon_3.0 <- read.csv("data/watermelon_3.0.csv", header = TRUE, 
                           fileEncoding = "UTF8", row.names = "编号")

head(watermelon_3.0)
##   色泽 根蒂 敲声 纹理 脐部 触感  密度 含糖率 好瓜
## 1 青绿 蜷缩 浊响 清晰 凹陷 硬滑 0.697  0.460   是
## 2 乌黑 蜷缩 沉闷 清晰 凹陷 硬滑 0.774  0.376   是
## 3 乌黑 蜷缩 浊响 清晰 凹陷 硬滑 0.634  0.264   是
## 4 青绿 蜷缩 沉闷 清晰 凹陷 硬滑 0.608  0.318   是
## 5 浅白 蜷缩 浊响 清晰 凹陷 硬滑 0.556  0.215   是
## 6 青绿 稍蜷 浊响 清晰 稍凹 软粘 0.403  0.237   是

由于有categorical变量,由于后面使用的neuralnet只是别数字型变量,因此构造one hot encoding的数据,将其变成数值型编码。

require(caret)
require(magrittr) # %>%
dummies <- dummyVars( ~ ., data = watermelon_3.0, levelsOnly = TRUE, fullRank = TRUE)
watermelon <- predict(dummies, newdata = watermelon_3.0) %>% as.data.frame()
#watermelon$好瓜 <- watermelon_3.0$好瓜

构建神经网络模型

require(neuralnet)

predictors <- setdiff(names(watermelon), "好瓜")
 
formula <- names(watermelon) %>% setdiff("是")  %>% paste(collapse = "+")
formula <- paste("是 ~", formula, sep = "") %>% as.formula()
nn <- neuralnet(formula = formula, data = watermelon, 
                hidden = c(3), err.fct = "ce", 
                linear.output = FALSE)

neuralnet中的参数formula表示将要拟合的模型,data是数据集。注意,neuralnetformula不支持"y ~ ."的形式,需要写出完整的公式形式。而hidden一个向量,表示每个隐藏层的神经元个数,向量的长度即为隐含层的层数。在上面的例子中,hidden = c(3)表示只有一个隐含层,该层含三个功能神经元。linear.output表明是需要回归 linear.output = TRUE 还是需要分类 linear.output = FALSE。[5]

训练的模型如下:

# Do NOT run this chunk
plot(nn)

Rmarkdown中运行plot函数时,并不能成功绘制神经网络的图,出现的是一系列的warning。

neuralnet.png

预测结果

require(dplyr)
pred <- neuralnet::compute(nn, dplyr::select(watermelon, -是))
result <- pred$net.result

对结果进行预测,用的是compute函数,而不是其他包中的predict函数。对原始西瓜数据的预测结果存放于result变量中,是[0, 1]之间的实数,类似于logistic regression中的概率,可以先对其进行处理。

predicted <- ifelse(result > 0.5, "是", "否")
table(watermelon_3.0$好瓜, predicted, dnn = c("真实值", "预测值"))
##       预测值
## 真实值 否 是
##     否  9  0
##     是  0  8

预测错误的情况有0。

参考

  1. http://amunategui.github.io/dummyVar-Walkthrough/
  2. http://stackoverflow.com/questions/33911358/using-neural-networks-neuralnet-in-r-to-predict-factor-values
  3. https://beckmw.wordpress.com/2013/11/14/visualizing-neural-networks-in-r-update/
  4. https://www.reddit.com/r/MachineLearning/comments/3y16vh/how_can_i_do_simultaneous_one_hot_encoding_in_r
  5. https://www.r-bloggers.com/fitting-a-neural-network-in-r-neuralnet-package/
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,047评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,807评论 3 386
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,501评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,839评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,951评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,117评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,188评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,929评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,372评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,679评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,837评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,536评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,168评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,886评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,129评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,665评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,739评论 2 351

推荐阅读更多精彩内容