学习笔记

grep提取信息

grep使用正则表达式搜索文本,并把匹配的行打印

  • 根据文件内容递归查找目录
#在当前目录搜索带'test'行的文件
# grep ‘test’ *           
#在当前目录及其子目录下搜索'test'行的文件
# grep -r ‘test’ *        
#在当前目录及其子目录下搜索'test'行的文件,但是不显示匹配的行,只显示匹配的文件
# grep -l -r ‘test’ *    
  • grep与正规表达式
    通过使用定位字符让特殊符号在特定位置出现
grep -n '^the' test.txt

例如,通过grep抓取基因组文件的序列名

grep  '^>' GCF_014698905.1_ASM1469890v1_genomic.fna

修改环境变量

  • 通过echo命令
echo 'export PATH=~/软件包路径/bin:$PATH' >> ~/.bashrc
  • 通过nano编辑bashrc文本文件
nano ./bashrc
#在文件尾行增加环境变量
export PATH="$PATH:/软件路径

修改后利用source命令,执行修改后的环境变量

source ./bashrc
  • source命令通常用于重新执行刚修改的初始或文件,使之立即生效,而不必注销或重新登录

下载文件

apesra下载

安装aspera后,直接从ENA数据库搜索SRR编号,复制fastq ftp的链接地址,即为ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR138/046/SRR13883846/SRR13883846_1.fastq.gz

ascp -v -k 1 -QT -l 300m -P 33001 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk/vol1/fastq/SRR138/046/SRR13883846/SRR13883846_1.fastq.gz ./

将下载文件输出到根目录

prefetch下载

利用prefetch下载sra文件只需要输入SRA ID 即可开始下载

prefetch SRR13883846

安装aspera时,prefetch会优先使用ascp协议下载


screen将单终端分成多个会话

参数说明

-A  将所有的视窗都调整为目前终端机的大小。
-d<作业名称>  将指定的screen作业离线。
-h<行数>  指定视窗的缓冲区行数。
-m  即使目前已在作业中的screen作业,仍强制建立新的screen作业。
-r<作业名称>  恢复离线的screen作业。
-R  先试图恢复离线的作业。若找不到离线的作业,即建立新的screen作业。
-s<shell>  指定建立新视窗时,所要执行的shell。
-S<作业名称>  指定screen作业的名称。
-v  显示版本信息。
-x  恢复之前离线的screen作业。
-ls或--list  显示目前所有的screen作业。
-wipe  检查目前所有的screen作业,并删除已经无法使用的screen作业

  • 创建screen终端
screen
  • 离开screen终端
    在screen页面下,同时按下Ctrl+A+D键
  • 重新连接离开的screen终端
screen -ls     #显示所有已经创建的screen终端
screen -r  screen_ID    #连接到screen_ID的screen终端

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容