这篇文章本来是要写进我上一篇关于Polynomial regression实现的文章里的,但一方面由于这个给散点图里添加拟合曲线和公式偏向画图,里面细节较多,相对上一节内容独立;另一方面,为了使篇幅不致过长,读者看起来辛苦,所以就分开成两篇文章。
本篇衔接上一篇,所以数据以及模型都是跟上一篇里一样的,这里不再赘述,读者可阅读我上一篇的内容,所以,这里只会涉及到如何在散点图里添加拟合的曲线以及公式。
先来看看我们最终的效果图:
(我直接截图的,坐标横轴是x,纵轴是y,这里被截掉了)
画图的代码:
#下面这个函数定义我们后面要添加的公式
[1] lm_eqn = function(df){
[2] m=lm(Num_complex ~ poly(k_value, 2), df) # 2rd degree polynomial
[3] eq <- substitute(italic(y) == a + b %.% italic(x) + c %.% italic(x)^2*","~~italic(r)^2~"="~r2,
[4] list(a = format(coef(m)[1], digits = 3),
[5] b = format(coef(m)[2], digits = 3),
[6] c = format(coef(m)[3], digits = 3),
[7] r2 = format(summary(m)$r.squared, digits = 3)))
[8] as.character(as.expression(eq))
[9] }
# 先创建一个散点图
[10] p <- ggplot(dat,aes(x=x,y=y)) + geom_point()
#
[11] p + stat_smooth(method='lm',formula = y~poly(x,2),colour='red') +
[12] scale_x_continuous(limits = c(1,19), breaks = c(seq(1,19,b=2))) +
[13] theme(axis.text=element_text(colour = 'black',size = 12), axis.title=element_text(size = 14)) +
[14] annotate("text", x=2, y=100, label=lm_eqn(dat), hjust=0, size=6,family="Times",parse=TRUE)
为了方便解释,我给上面代码加了行号。
首先,1-9 行这里定义了一个函数,函数最终返回的是一个强制字符转换的expression对象(eq)。而 eq则是由substitute函数产生的结果,是一个call类型(调用类型,或者叫未求值表达式类型),这里的概念都比较复杂,我暂时也搞不清楚,还是直接看看是怎么编辑这个表达式的吧。主要在第3行,%.% 这个符号是表示 “点乘”,italic(x) 表示斜体的 x平方,2 后面的星号是必需的,并不被解释,可能是用来分割字符和表达式的,“~”符号表示空格,一个代表一个空格。
然后是4~7行,这里是一个 list,里面列出了第三行表达式中要被替换的变量的值(比如a, b, c,等)。
第10行,画一个散点图,所有都是默认设置;
第11行,这里是为散点图根据二次多项式模型拟合一条平滑的曲线;
第12-13行是调节坐标轴及坐标轴文字的,这里就不多说了,比较简单,可以查看ggplot2 cookbook;
第14行,是添加公式的语句,"text" 表示添加的元素类型(这里是添加text),x 和 y 设定添加text到什么位置(坐标);label则是要添加的公式内容,这里调用前面(1-9行定义的表达式)定义的函数;parse这个设置我不知道怎么说,因为不太懂底层原理,但我测试了,必需加上,不然不会解析 前面定义的表达式。