写在前面的一些碎碎念。。。。
1.虽然高考去的是理科基地班,但是读了几年博士发现自己完全不是个理科生,又被实验的benchworking折磨了几年,发现科学研究真的是细节决定成败,机会多坑也多。坦率的说我是被AI、精准医学的概念糊到生物信息学这个方向来的;前一阵看了清华自动化吴军博士的《数学之美》以后,才觉得敲击代码乃世界上最最销魂的声音,黑色背景下跳动的光标乃最性感的文字。加上日常的工作涉及到的数据处理,都是利用试剂公司提供的软件包或一站式服务,而作为职场fresh就是那么爱折腾,想搞清楚后台的运作;再然后就是因为也要晋升职称呀(人在屋檐下不得不低头的那种,没文章怎么行?数据挖掘或许能做一点有意思的小工作吧。
2.在关注到jimmy大神的生信技能树这个优质ip资源之前,我一个毕业的生物博士是跟着几个热情爆满的学弟学妹上过偏实用的数据挖掘课程,因为我本身的生物学背景和基础比较扎实,对于那些课程的上手还比较快。也于是就很清楚的知道当时文章补实验的数据,公司是怎么一个套路分析出来的? 而国内近几年大神的文章(CXT BXW et.al),又是怎么从RNA-seq+IP-MS+CHIP-seq,或者是scRNA-seq+ATAC-seq中获得实验线索和最大创新点的。事实上我对那些代码的感触就是即学即用:根据课题背景选择几个geo,rna-seq数据集编号,看一下对应的分组,选择几个常规的数据差异分析套路,R语言跑的飞起。可是呢,那些代码还是冰冷的。这感觉就是像大师兄带着你告诉要做哪些实验,但是你还是不会自己设计课题。
3.后来和同样喜欢研究R的朋友交楼(有些还不止是生物领域)才知道自学的人都是高度自律的,再看看jimmy的坚持,让我想起不知道是不是比尔盖茨说的一句:“我们往往会高估自己一年的变化,却低估自己坚持十年的成就”。然后在闲话的末尾立个flag吧~以后可以和做实验生物学的人比生信水平,和做生信的人比我的实验水平(感觉我的前面的话已经超过了”简书“主旨,好吧我就是那种传说中的无志者常立志的人)
今天正事就少说点,还得先把遗传代谢的文章写了。
入门学者推荐观看:
在这篇中有对R初级应用环境的模型总结并设置了相应的小作业R语言练习题-初级 | 生信菜鸟团 ,目的是为了对基本的R元素和数据结构的概念进行梳理GitHub - jmzeng1314/R_bilibili这里有相应的答案,虽然思路很多,不过我觉得真正bible在这里啊~就像我们学单词从头掌握发音拼写,我觉得basic-r,basic-R 就是很好的积木,搭建了房屋的结构(如下图)。
其余的可以慢慢的参照理解和练习
但是为了更好地理解计算机语言的逻辑,或者说对数据的本质有一定的逻辑认识,还是应该在Linux框架上进行脚本的撰写和分析,今天就被老师讲的sed,awk搞得有点懵,然后在mac和win版中切换的时候还出现了bug ,导致稀里糊涂的把编辑语言vim下的bashrc默认内容篡改了,然后在非严格模式下思绪飘走了好一阵,不过好在最后将miniconda的时候又给拽回来了。
赶紧把小助手老师教我的方式复盘在这:造成上述现象的原因是由于错误的编辑,导致了swp文件的产生首先选择E(edit anyway),然后会出现下面的图片
依次往下看了一下也没有看到明显的错误,加上了调整为vim模式的操作方法,insert=i,也没有发现哪里有大的问题,主要看下“psi"那段文字在不在?(见下图高量部分)
到这里重点来了,为啥还是会报错呢?按esc,再加:wq,推出后激活bashrc(source .bashrc)发现问题还是存在,但是有了提示?
原来错误在第121行多了一个“;”,再次回到vim编辑模式,把多的删掉,再重复执行上面的source模式,发现问题没有了,同时在进入vim模式时候删掉bashrc.swp文件选择D即可。