很久之前就想做个公众号用来督促自己学习,拖延症晚期的我今天终于把备忘录开通了!!!万事开头难,希望今后能在这里一直坚持下去。
推送内容
内容的话应该会很杂,一般会发一些R语言学习经验和生态学、气象有关的最新文献报道,偶尔也会发些考研杂谈以及自己的生活记录哈哈哈。
先简单介绍下如何下载R吧。
先进入https://www.r-project.org/(或者直接百度R),点击download R,然后在China下面选择一个镜像进入后根据自己电脑类型的选择下载,再点击install R for the first time下载R的最新版本(历史版本请搜索https://cran.r-project.org/bin/windows/base/old/)。
R安装完成后建议大家安装Rstudio(https://www.rstudio.com/products/rstudio/download/),因为它很方便,嗯,很方便。
安装完成后大家就可以在Rstudio上操作啦~
分享一下昨天学到的小知识——如何插看缺失值的分布与数据类型
我们要用到vigsdat和tibble包
install.packages('visdat')
install.packages('tibble')
library(tibble)
library(visdat)
查看数据(这里的数据是我在某篇文献上下载的,大家可以用自己的数据试试)
setwd("D:/Example/PIECESEM")
aa<-read.csv("kelp.csv")
aa <- as_tibble(aa)
aa
这里简单介绍一下数据变量类型
integer 整数型
dbl-双精度浮点数、实数
character 字符型
numeric 数值型(double)
logical 逻辑型
NULL
NA 缺失值
dttm-日期+时间
lgl-逻辑型变量,仅包括TRUE和FALSE
fctr-因子,R中用因子表示具有固定数目的值的分类。
date-日期型变量
对数据结构和缺失值作图
vis_dat(aa)###展示数据结构
vis_miss(aa)###展示缺失值
其中observations是数据的行数,上面是数据的变量名称以及类型,不同的类型由不同的颜色表示。
最后一张图中黑色代表缺失值,灰色则不是缺失值。