
image.png

image.png

image.png
182  conda activate chipseq
 183  history | grep prefetch
 184  which prefetch
 185  prefetch -h
 186  mkdir chipseq
 187  cd chipseq/
 188  mkdir {sra,raw,clean,align,peaks,motif,qc}
 189  vim
 190  vim acc.txt
 191  cat acc.txt
 192  prefetch --option-file acc.txt 
 193  nohup prefetch --option-file acc.txt -O ./sra &
 194  cd sra
 195  ls
 196  cd ..
 197  cat nohup.out 
 198  cd sra
 199  ls
 200  lsls
 201  ls
 202  cat nohup.out 
 203  cat ../nohup.out 
 204  history
 205  history | grep prefetch
 206  ls
 207  cd ../
 208  ls
 209  cat nohup.out 
 210  cat acc.txt 
 211  prefetch SRR391032 -O ./sra
 212  cd ../../

image.png

image.png
ps-ef 命令:
一、基础概念
指令: ps
作用: 主要是查看服务器的进程信息
选项含义:
-e:等价于 ‘-A’ ,表示列出全部的进程
-f:显示全部的列(显示全字段)
二、执行结果

image.png
列的含义说明:
UID: 该进程执行的用户id
PID: 进程id
PPID: 该进程的父级进程id,如果一个程序的父级进程找不到,该程序的进程被称为僵尸进程
C: cpu的占用率,形式是百分数(%)
STIME: 进程的启动时间
TTY: 终端设备,发起该进程的设备识别符号,如果显示‘ ?’表示该进程并不是由终端发起
TIME: 进程的执行时间
CMD: 该进程的名称或对应的路径
三、常用组合命令
命令:ps -ef | grep 进程名称

image.png
注意:执行该命令至少有一个进程(搜索该命令的进程)
例如:查看火狐浏览器的进程

image.png
其实是因为网络的问题一直下载不了数据,你可以自己的电脑登陆下载了上传到服务器上,你可以自己的电脑登陆下载了上传到服务器上。
  287  history
  288  conda avtivate chipseq
  289  conda activate chipseq
  290  ls
  291  cd chipseq/sra
  292  ls
  293  cd ..
  294  ls
  295  mv sra/* raw  #把sra文件夹下所有的文件移动到raw文件夹下
  296  cd raw
  297  ls
  298  fastqc -h
  299  fastqc -o fastqc -t 20 *gz
  300  mkdir fastqc
  301  fastqc -o fastqc -t 20 *gz #raw下所有的gz 文件进行fastqc,输出到fastqc文件夹下,线程数为20
  302  cd fastqc
  303  ls

image.png

image.png
会在fastqc文件夹下生成fastqc.zip 和 html报告
  304  cd ..
  305  ls
  306  trim_galore -h
  307  trim_galore --help
  308  trim_galore -q 20 -o ../clean SRR391033.fastq.gz
这个时候选择trim_galore软件进行过滤,过滤条件:测序得到的原始序列含有接头序列或低质量序列,为了保证信息分析的准确性, 需要对原始数据进行质量控制,得到高质量序列(即Clean Reads),原始序列质量控制的标准为:
①去除含接头的reads;
②过滤去除低质量值数据,确保数据质量;
③去除含有N(无法确定碱基信息)的比例大于5%的reads;

image.png
309  cd ../clean
  310  ls

image.png
  311  less SRR391033.fastq.gz_trimming_report.txt
  312  history