学习小组Day6-小乐

Day6

今天学习的是R语言最重要的内容,R包,包括镜像的配置,R包的安装及使用,走着

镜像的配置准备

  • 查看镜像
options()$repos
options()$BioC_mirror
  • 运行结果


    查看结果

    分别对应清华源和中科大源,没问题

设置镜像源,应修改profile文件,在Rstudio中打开,并将以下两句保存在文件中,文件位置在/R/etc中

options("repos"=c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")

R包的安装

install.packages(“要安装的包名称”)    #安装R包
install.packages("名称", repos = "https://mirrors.ustc.edu.cn/CRAN/")    #指定镜像地址
library("包名")    #使用前要先载入R编译环境
detach("package:包名")    #将R包移除环境,但可以重新载入
remove.packages("包名")    #卸载R包,彻底抹杀
  • 注意,用detach("package:包名")并不是卸载,只是移出了环境,用library()后仍可继续使用

神器dplyr的基础函数使用

  • 新增列mutate(test, new = Sepal.Length * Sepal.Width)
    为test新增加一列,名为new,值为Sepal.Length和Sepal.Width相乘
    运行结果
  • 数据选择select()
    select(test,2)选择test的第二列
    运行结果

    select(test,Petal.Width)筛选test中名为Petal.Width的这一列
    运行结果
  • 数据筛选filter()
    与筛选行大同小异,可以按行数,名称,以及数据的特性来筛选
  • 数据重新排序arrange()
    arrange(test,Sepal.Width)对test以Sepal.Width这一列数据进行排序,默认为从小到大
    运行结果

    arrange(test,desc(Sepal.Width))带上desc为从大到小排序
    运行结果
  • 对数据进行汇总summarise()
    summarise(test, mean(Sepal.Length), sd(Sepal.Length))计算test中Sepal.Length这一列的平均数和标准差(也可以用来求极值,求和,平均数,出现次数等,配合group_by进行分组可以实现更多功能)
    运行结果

神器dplyr的实用操作

  • 管道函数%>%
    含义为直接将前一步的数据结果作为参数直接传递给下一步,省略了许多赋值过程
    test%>%group_by(Species)%>%summarise(mean(Sepal.Length),sd(Sepal.Length))如这里即为将test中的Species分组,再求平均数和标准差
    运行结果
  • 统计各种数据出现的次数count
    count(test,Species)统计test数据的Species列中,有哪些数据,各出现了几次
    运行结果

神器dplyr中数据的连接关系

  • 先生成两个数据集t1和t2
    t1 <- data.frame(x = c('a','b','c','x'), y = c("1","B","3",'D'))
    t2 <- data.frame(x = c('a','b','c','d','e','f'), z = c(1,2,3,4,5,6))
    两个数据集
  • 对数据集进行左连接left_join(t1,t2,by='x')因为是左连接,只会保留t1拥有的x对应的y值和z值,而在t2中不存在x与z的关系,找不到对应z值,则为NA
    运行结果
  • 对数据集进行左连接right_join(t1,t2,by='x')因为是右连接,只会保留t2拥有的x对应的y值和z值,而在t1中不存在d、e、f与y的关系,找不到对应y值,则为NA
    运行结果
  • 对数据集进行内连接inner_join(t1,t2,by='x')相当于交集,只会保留t1与t2均拥有的x与其所对应的y值和z值
    运行结果
  • 对数据集进行全连接full_join(t1,t2,by='x')相当于并集,将会保留所有的x于其对应的y值和z值,不存在的为NA
    运行结果
  • 对数据集进行半连接semi_join(t1,t2,by='x')半连接也是取交集,与内连接的不同在于,半连接只是筛选出t1与t2均拥有的x,但并不输出t2的z值,只在t1内部进行筛选
    运行结果
  • 对数据集进行反连接anti_join(t1,t2,by='x')与半连接相反,输出t2中不存在的x值于其对应的y值关系
    运行结果

相同点:半连接与反链接均只对前者进行筛选,不输出后者的数据

  • 数据集的合并
    bind_rows(t1,t2) #要求数据集有相同的列数,不存在的仍输出NA
    bind_cols(t1,r1) #要求数据集有相同的行数
    运行结果

初步学习,还有太多不懂的地方,笔记内有任何问题或错误都欢迎大家批评指出!

今天就到这里,明天继续加油!
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,451评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,172评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,782评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,709评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,733评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,578评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,320评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,241评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,686评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,878评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,992评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,715评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,336评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,912评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,040评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,173评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,947评论 2 355

推荐阅读更多精彩内容