登录注册写文章

RNA seq上游分析（简洁版）

RNA seq上游分析（简洁版）

环境配置

conda create -n rna python=3.9
conda activate rna
conda install -y multiqc trim-galore subread hisat2

质检

fastqc *.fastq.gz
multiqc *.zip

去接头

vim fastq_list.txt ### 构建自己的文件列表
cat fastq_list.txt | while read id; 
do (trim_galore -q 20 \
--phred33 --stringency 3 \
--length 20 -e 0.1 \
--paired  ${id}_L002_R1_001.fastq.gz ${id}_L002_R2_001.fastq.gz \
--gzip -o ./clean ); done

比对

mkdir aligned
cat ./fastq_list.txt | while read id; 
do (hisat2 -t -p 20 -x ~/ref/hg38/genome \
-1 ./clean/${id}_L002_R1_001_val_1.fq.gz -2 ./clean/${id}_L002_R2_001_val_2.fq.gz \
-S ./aligned/${id}.sam); done

得到count值

mkdir counts
cat ./fastq_list.txt | while read id; 
do (featureCounts -T 5  \
-t exon \
-g gene_id \
-a ~/ref/Homo_sapiens.GRCh38.107.chr.gtf \
-o ./counts/${id}_counts.txt \
./aligned/${id}.sam); done

最终会在目标文件夹下面获得两个文件，counts.txt和counts.txt.summary。在R中进行ID转换即可。

最后编辑于：2022.09.01 13:52:50

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

RNA-seq数据的上游处理及工具HISAT2; STAR; RSEM; featureCou...
欢迎批评指正一、上游处理流程上游处理步骤包括质量检测、质量控制、比对、定量[2]，每一步处理数据的目的都是不同...
清零2000阅读 16,617评论 1赞 37
RNA_seq（1）植物转录组差异基因分析简单练习
RNA_seq植物实战 Author : yujia 目录：概述salmon工具完成索引建立和生物学定量subre...
CS_yujia阅读 10,132评论 1赞 12
RNA-seq入门实战（二）：上游数据的比对计数——Hisat2+ featureCounts...
本节概览：hisat2 + featureCounts:获取hisat2索引文件，hisat2比对和samtool...
嘿嘿嘿嘿哈阅读 17,588评论 2赞 37
RNA-seq分析简洁版
前面RNA-seq分析：从软件安装到富集分析部分已经把转录组全部流程走完了一遍，这次利用RNA-seq(2)-2:...
Y大宽阅读 33,984评论 8赞 90
mRNA-seq转录组二代测序从raw reads到表达矩阵：上中游分析pipeline
mRNA-seq上中游分析需要用到Linux系统的terminal！尽管TCGA数据库中已经提供了大量的处理好的...
ZZZZZZ_XX阅读 12,573评论 2赞 39

3赞4赞

赞赏

手机看全文