R语言学习.5-数据读写

数据读写练习是生信技能树生信爆款入门课程R语言部分Day5的讲到的一个重要知识点。
为加深理解，现在做下练习巩固。

Last compiled on 01/10/21

rm(list = ls())

1.读取ex1.txt

a <- read.table('ex1.txt')
dim(a)
## [1] 75  6
head(a)
##                                                                               V1
## 1                                                                          title
## 2    Illumina Sentrix Array Matrix (SAM) - GoldenGate Methylation Cancer Panel I
## 3         Illumina HumanMethylation27 BeadChip (HumanMethylation27_270596_v.1.2)
## 4           Illumina HumanMethylation450 BeadChip (HumanMethylation450_15017482)
## 5 GE Healthcare/Amersham Biosciences CodeLink鈩\xa2   ADME Rat 16-Assay Bioarray
## 6                                       [AG] Affymetrix Arabidopsis Genome Array
##         V2                           V3             V4                   V5
## 1      gpl                 bioc_package   manufacturer             organism
## 2 GPL15380     GGHumanMethCancerPanelv1       Illumina         Homo sapiens
## 3  GPL8490  IlluminaHumanMethylation27k Illumina, Inc.         Homo sapiens
## 4 GPL13534 IlluminaHumanMethylation450k Illumina, Inc.         Homo sapiens
## 5  GPL2898                    adme16cod  GE Healthcare    Rattus norvegicus
## 6    GPL71                           ag     Affymetrix Arabidopsis thaliana
##               V6
## 1 data_row_count
## 2           1536
## 3          27578
## 4         485577
## 5           1280
## 6           8297

2.读取ex2_B cell receptor signaling pathway.csv

ex2 <- read.csv('ex2_B cell receptor signaling pathway.csv',
                row.names = 1)
dim(ex2)
## [1]  18 168
ex2[1:4,1:4]
##         TCGA.06.0238.01A TCGA.06.0171.02A TCGA.28.5218.01A TCGA.06.0130.01A
## NCKAP1L         10.96088         13.67818         11.69558         12.41409
## SYK             10.64797         12.99044         11.07856         11.88787
## PTPRC           10.61789         13.49278         11.26111         12.33504
## PTPN6           10.49375         12.35558         10.58999         11.66260

3.读取GSE32575_series_matrix.txt，赋值给gse。

gse <- read.table('GSE32575_series_matrix.txt',
                  comment.char = '!',
                  header = T,
                  row.names = 1)

dim(gse)
## [1] 336  48
gse[1:4,1:4]
##               GSM807339  GSM807340  GSM807341  GSM807342
## ILMN_1343289 19525.4400 20503.6100 18821.2200 17943.6300
## ILMN_1343290 20599.1000 21696.7000 16206.9200 18101.9800
## ILMN_1343291 25829.9200 24742.1800 23758.1200 24592.3600
## ILMN_1343292   383.6296   353.3019   303.2715   375.0452

4.描述gse的属性

#View(gse)
as.matrix(gse)[1:4,1:4]
##               GSM807339  GSM807340  GSM807341  GSM807342
## ILMN_1343289 19525.4400 20503.6100 18821.2200 17943.6300
## ILMN_1343290 20599.1000 21696.7000 16206.9200 18101.9800
## ILMN_1343291 25829.9200 24742.1800 23758.1200 24592.3600
## ILMN_1343292   383.6296   353.3019   303.2715   375.0452
class(gse)
## [1] "data.frame"

5.将gse导出为新的txt和csv文件。

write.table(gse,'z.txt')
write.csv(gse,'zz.csv')

6.将gse保存为Rdata并加载。

save(gse,file = 'ex.Rdata')#file = 必须写
rm(list = ls())
load('ex.Rdata')

练习4-1：

1.读取complete_set.txt（已保存在工作目录）

a <- read.table('complete_set.txt')
#先 dim
dim(a)
## [1] 51 20
a[1:4,1:4]
##                   V1                 V2                V3                 V4
## 1              geneA              geneB             geneC              geneD
## 2 -0.635020187971398  -0.49728008811353 0.514896730700242  -1.01508182502931
## 3   0.91605661780324 -0.545381308500589  1.20238322656491  0.956212067289626
## 4  0.805995294157758 -0.315914513323816  0.27825197143441 -0.727119736260533
# 读入之后 要先查看数据 是必经步骤
# 需要header= T
# 否则列名被改变了,可以看出列名多了V1
a <- read.table('complete_set.txt',header = T)
dim(a)
## [1] 50 20
a[1:4,1:4]
##        geneA       geneB      geneC      geneD
## 1 -0.6350202 -0.49728009  0.5148967 -1.0150818
## 2  0.9160566 -0.54538131  1.2023832  0.9562121
## 3  0.8059953 -0.31591451  0.2782520 -0.7271197
## 4  0.5380081 -0.06739211 -0.6237648 -1.6250202
#正确
#先 dim

2.查看有多少行、多少列

dim(a)
## [1] 50 20

3.获取行名和列名

rownames(a)
##  [1] "1"  "2"  "3"  "4"  "5"  "6"  "7"  "8"  "9"  "10" "11" "12" "13" "14" "15"
## [16] "16" "17" "18" "19" "20" "21" "22" "23" "24" "25" "26" "27" "28" "29" "30"
## [31] "31" "32" "33" "34" "35" "36" "37" "38" "39" "40" "41" "42" "43" "44" "45"
## [46] "46" "47" "48" "49" "50"
colnames(a)
##  [1] "geneA" "geneB" "geneC" "geneD" "geneE" "geneF" "geneG" "geneH" "geneI"
## [10] "geneJ" "geneK" "geneL" "geneM" "geneN" "geneO" "geneP" "geneQ" "geneR"
## [19] "geneS" "geneT"

4.导出为csv格式

write.csv(a,'a.csv')

5.保存为Rdata

save(a,file = 'a.Rdata')

6.加载class.Rdata,查看数据类型

load('class.Rdata')
#环境变量出现了y的数据
#在环境变量里面  可以看出都是字符型chr
class(y[2])#从一行一列也可以看出数据类型
## [1] "character"
y#从矩阵也可以看出
##      gene1 gene2 gene3 gene4 gene5 gene6 grouplist
## GSM1 "40"  "15"  "22"  "600" "25"  "123" "control"
## GSM2 "20"  "45"  "77"  "544" "33"  "124" "control"
## GSM3 "51"  "12"  "26"  "350" "30"  "55"  "control"
## GSM4 "46"  "11"  "20"  "390" "45"  "334" "treat"  
## GSM5 "38"  "12"  "24"  "260" "20"  "543" "treat"  
## GSM6 "49"  "10"  "25"  "220" "33"  "239" "treat"
class(y)#
## [1] "matrix" "array"
#字符和数字的数据框 转为矩阵 就会这样

高阶数据读取指南https://www.jianshu.com/p/4ea320c0dcc6

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 214,658评论 6赞 496
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 91,482评论 3赞 389
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 160,213评论 0赞 350
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 57,395评论 1赞 288
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 66,487评论 6赞 386
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 50,523评论 1赞 293
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 39,525评论 3赞 414
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,300评论 0赞 270
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 44,753评论 1赞 307
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,048评论 2赞 330
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,223评论 1赞 343
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 34,905评论 5赞 338
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 40,541评论 3赞 322
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,168评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,417评论 1赞 268
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,094评论 2赞 365
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,088评论 2赞 352

R语言学习.5-数据读写

1.读取ex1.txt

2.读取ex2_B cell receptor signaling pathway.csv

3.读取GSE32575_series_matrix.txt，赋值给gse。

4.描述gse的属性

5.将gse导出为新的txt和csv文件。

6.将gse保存为Rdata并加载。

练习4-1：

1.读取complete_set.txt（已保存在工作目录）

2.查看有多少行、多少列

3.获取行名和列名

4.导出为csv格式

5.保存为Rdata

6.加载class.Rdata,查看数据类型

推荐阅读更多精彩内容