xshell转录组hisat-samtools-StringTie下载安装运用

下载

创建hisat目录

mkdir hisat

进入

cd hisat

下载

wget http://ccb.jhu.edu/software/hisat/downloads/hisat-0.1.5-beta-source.zip

建议:去官网下2.0的更好,能多线程跑

解压

unzip hisat-0.1.5-beta-source.zip

配置环境(网上教程)

echo 'PATH=$PATH:/home/wbq/hisat/hisat-0.1.5-beta/' >> ~/.pro

因为我是xshell交互式login shell,所以用的是profile。
非交互式的用

echo 'PATH=$PATH:/home/wbq/hisat/hisat-0.1.5-beta/' >> ~/.bashrc

二者区别参考https://www.cnblogs.com/Chary/p/No0000177.html

比较好的配置环境操作

在~目录中

vim .bash_profile
E  #编辑改文件。电脑无反应,没关系,正常。再输入
PATH=$PATH:文件的绝对路径
#输入好了之后检查无错误后
按键盘左上角Esc键  #电脑无反应,没关系,正常。再输入
:wq   #保存并退出
source .bash_profile #使其生效

配置环境时一定要用绝对路径
重启后生效

检查有没有成功

echo $PATH

显示多出一个hisat-0.1.5-beta 即为成功

运用

构建索引文件

hisat-build /home/xxxx.fa /home/genome

genome是指给index的命名名字,而不是指文件夹。


hisat-build.png

比对

没有注释文件的比对方法

hisat2 -p 18 --dta -x ~/genome/HJX74 -1 /home/wbq/liuqing/rawdata/fq.gz/Rice_D908-T02_good_1.fq.gz -2 /home/wbq/liuqing/rawdata/fq.gz/Rice_D908-T02_good_2.fq.gz -S HJX74.sam

有2个输入文件,是因为双端测序的结果有左端和右端。如果是单端测序,就只有一个输入文件。
不知道每个option的意义的可以输入

hisat2 -h  #看说明书
hisat.png

21.60%的比对没有一次对齐,61.81%的有一次对齐,16.59%的超过一次对齐。
超过一次对齐的原因:存在重复序列,有基因不止一个拷贝。
整体比对在最后一行,87.68%的序列能够比对成功。


另一个数据的.sam文件

.sam文件全称是 sequence alignment map format, 专门储存高通量测序文件。保存了序列名字、长度、序列比对到染色体的什么位置(并校验数据可靠性)、program命令。
各列的意义:
序列,以什么状态(没)比对上(SAM Flags),染色体,比对具体位置,比对质量(the more the better),比对差异情况(插入(i)和缺少(d)算miss match)

有注释文件的比对方法

hisat2_extract_splice_site.py gene.gtf > genes.ss  #把剪切位点提取出来
hisat2 -p 4 --known-splicesite-infile gene.ss -x genome(index文件) -1 SRRxxxx_1.fastq -2 SRRxxx_2.fastq -S SRRxxxx.sam

samtools

下载安装

mkdir samtools
cd samtools
wget https://github.com/samtools/samtools/releases/download/1.10/samtools-1.10.tar.bz2
tar -jxvf samtools-1.10
./configure --prefix=/home/wbq/samtools/samtools-1.10
make
make install
vim .bash_profile
E
PATH=$PATH:/home/wbq/samtools/samtools-.1.10
source .bash_profile
echo $PATH

使用

就是把sam文件改成bam文件,压缩成二进制文件

samtools view -bS HJX74.sam > /home/wbq/HJX74/HJX74.bam  #查看bam文件内容
samtools sort -@ 2 -o HJX74.sort.bam HJX74.bam  #按比对位置排序+格式转换
samtools index HJX74.bam  #建立bam文件索引
samtools merge -@ 4 -h SRR1582649.bam merged.bam SRR1582646.bam SRR1582647.bam SRR1582648.bam SRR1582649.bam SRR1582650.bam SRR1582651.bam #把生成的bam文件合并为一个文件。因为每个文件的sam文件表头都一样,所以用-h指定某一个文件的表头作为总文件的表头。

以上命令不是全都需要打,samtools sort的命令必须打

StringTie

下载安装

mkdir stringtie
cd stringtie
wget http://ccb.jhu.edu/software/stringtie/dl/stringtie-2.1.4.tar.gz
tar -zxvf stringtie-2.1.4.tar.gz
make
vim .bash_profile
i
PATH=$PATH:/home/wbq/stringtie/stringtie-2.1.4
source .bash_profile
echo $PATH

使用

有参考基因组文件

stringtie /home/wbq/HJX74/HJX74.sort.bam -e -G /home/wbq/liuqing/newW0/Oryza_HJX74_top_level.v2.2real.gff3 -o /home/wbq/HJX74/HJX74.gtf

结果


与命令是不同数据

我们拼出来的有1947条转录本,但实际原本有5400+基因,差异原因:

  • 有些基因表达量比较低;
  • 基因间距很小,有重叠,软件会把他们拼接为一个转录本,但里面不止一个基因
  • 链特异性
  • ...

可视化结果

IGV软件

表达量定量

三种定量指标


image.png
stringtie -p 4 -G genes.gtf -e -A SRR1582646.gene_exp \ -o SRR1582646.out SRR1582646.bam
image.png

FPKM和TPM都是样本内可比,样本间不可比。

差异表达分析

有重复的分析

cuffdiff -p 4 genes.gtf SRR1582646.bam,SRR1582647.bam,SRR1582648.bam SRR1582649.bam,SRR1582650.bam,SRR1582651.bam 
#重复用逗号隔开,比较差异的组用空格隔开。

如果它报错:BAM record error: found spliced alignment without XS attribute
没关系,是因为cufflinks版本太老,与hisat2格式有点不合,等它报错报完还是会继续跑的。但是缺点是检查不到可变剪切。
结果:


image.png

fold_change大于1的就是显著上调,0~1的是不显著变化,小于0的为显著下调。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,193评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,306评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,130评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,110评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,118评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,085评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,007评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,844评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,283评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,508评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,667评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,395评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,985评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,630评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,797评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,653评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,553评论 2 352