##主要参考教程
#https://www.jianshu.com/p/f6c9482f8927
conda search salmon #查看最新版本
conda install -y salmon=1.9.0 #最新版本
salmon -v #查看版本
conda install -c bioconda gffread
##建立index,参考
cd ref/hum_GRCH38
wget ftp://ftp.ensembl.org/pub/release-100/gtf/homo_sapiens/Homo_sapiens.GRCh38.100.gtf.gz -O GRCh38.gtf.gz
wget ftp://ftp.ensembl.org/pub/release-100/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz -O GRCh38.fa.gz
gunzip -c GRCh38.fa.gz >GRCh38.fa
gunzip -c GRCh38.gtf.gz >GRCh38.gtf
# 获取cDNA序列
gffread GRCh38.gtf -g GRCh38.fa -w GRCh38.transcript.fa.tmp
# gffread生成的fasta文件同时包含基因名字和转录本名字
grep '>' GRCh38.transcript.fa.tmp | head
# 去掉空格后面的字符串,保证cDNA文件中fasta序列的名字简洁,不然后续会出错
cut -f 1 -d ' ' GRCh38.transcript.fa.tmp >GRCh38.transcript.fa
# 获取所有基因组序列的名字存储于decoy中
grep '^>' GRCh38.fa | cut -d ' ' -f 1 | sed 's/^>//g' >GRCh38.decoys.txt
# 合并cDNA和基因组序列一起
# 注意:cDNA在前,基因组在后
cat GRCh38.transcript.fa GRCh38.fa >GRCh38_trans_genome.fa
# 构建索引 (更慢,结果会更准)
salmon index -t GRCh38_trans_genome.fa -d GRCh38.decoys.txt -i GRCh38.salmon_sa_index
## 定量
cat SRR_Acc_List.txt | while read line
do
salmon quant -i /mnt/f/index/salmon_index/homo -l IU \
-1 ./1-cleandata/$line\_clean_1.fastq.gz -2 ./1-cleandata/$line\_clean_2.fastq.gz \
--validateMappings --gcBias --seqBias \
-g /mnt/f/reference/homo/Homo_sapiens.GRCh38.104.gtf -o ./3-salmon/$line
done
## 注意-l 参数,双端非特异性的,-l IU
##不清楚可用-l A或者--libType A
2023-01-04普通转录组-1_salmon
最后编辑于 :
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
推荐阅读更多精彩内容
- 每日5组单词词组学习。 第1组 disconcerting 令人不安的 meteorologist 气象学家 cl...
- 33、 冬,十月,册封李俶为太子,更名为李豫。 自从中兴以来,皇帝对群下都没有赏赐过财物,至此,开始有新铸的大钱,...
- 小时候,每每看到父母争吵,自己只是被吓得瑟瑟发抖,却不知道用什么样的方法来劝说,亦或是没有勇气和胆量,更没有智慧和...
- 最近发现差异基因用GO富集之后的terms自己并不感兴趣,所以找别的富集的办法,大家都知道kegg富集到的大部分都...