grep提取信息
grep使用正则表达式搜索文本,并把匹配的行打印
- 根据文件内容递归查找目录
#在当前目录搜索带'test'行的文件
# grep ‘test’ *
#在当前目录及其子目录下搜索'test'行的文件
# grep -r ‘test’ *
#在当前目录及其子目录下搜索'test'行的文件,但是不显示匹配的行,只显示匹配的文件
# grep -l -r ‘test’ *
- grep与正规表达式
通过使用定位字符让特殊符号在特定位置出现
grep -n '^the' test.txt
例如,通过grep抓取基因组文件的序列名
grep '^>' GCF_014698905.1_ASM1469890v1_genomic.fna
修改环境变量
- 通过echo命令
echo 'export PATH=~/软件包路径/bin:$PATH' >> ~/.bashrc
- 通过nano编辑bashrc文本文件
nano ./bashrc
#在文件尾行增加环境变量
export PATH="$PATH:/软件路径
修改后利用source命令,执行修改后的环境变量
source ./bashrc
- source命令通常用于重新执行刚修改的初始或文件,使之立即生效,而不必注销或重新登录
下载文件
apesra下载
安装aspera后,直接从ENA数据库搜索SRR编号,复制fastq ftp的链接地址,即为ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR138/046/SRR13883846/SRR13883846_1.fastq.gz
ascp -v -k 1 -QT -l 300m -P 33001 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk/vol1/fastq/SRR138/046/SRR13883846/SRR13883846_1.fastq.gz ./
将下载文件输出到根目录
prefetch下载
利用prefetch下载sra文件只需要输入SRA ID 即可开始下载
prefetch SRR13883846
安装aspera时,prefetch会优先使用ascp协议下载
screen将单终端分成多个会话
参数说明
-A 将所有的视窗都调整为目前终端机的大小。
-d<作业名称> 将指定的screen作业离线。
-h<行数> 指定视窗的缓冲区行数。
-m 即使目前已在作业中的screen作业,仍强制建立新的screen作业。
-r<作业名称> 恢复离线的screen作业。
-R 先试图恢复离线的作业。若找不到离线的作业,即建立新的screen作业。
-s<shell> 指定建立新视窗时,所要执行的shell。
-S<作业名称> 指定screen作业的名称。
-v 显示版本信息。
-x 恢复之前离线的screen作业。
-ls或--list 显示目前所有的screen作业。
-wipe 检查目前所有的screen作业,并删除已经无法使用的screen作业
- 创建screen终端
screen
- 离开screen终端
在screen页面下,同时按下Ctrl+A+D键 - 重新连接离开的screen终端
screen -ls #显示所有已经创建的screen终端
screen -r screen_ID #连接到screen_ID的screen终端