samtools,bedtools

1 samtools

• SAM全称是Sequence Alignment/Map, 是目前最常用的存放比对或联配数据的格式。无论是重测序,还是转录组,还是表观组, 几乎所有流程都会产生SAM/BAM文件作为中间步骤,然后是后续专门的分析过程。

• 顾名思义samtools就是用于处理sam与bam格式的工具软件,能够实现二进制查看、格式转换、排序及合并等功能,结 合sam格式中的flag、tag等信息,还可以完成比对结果的统计汇总。同时利用linux中的grep、awk等操作命令, 还可以大大扩展samtools的使用范围与功能。比如结构变异,基因融合,SNP/INDEL calling检测等


sam文件格式

其中第二列是常用的基因比对情况打分



这里需要注意,计算比对情况时每次都需要使用总值减去可以减的最大值,最后得到的结果即是序列的比对情况
#view功能可查看sam文件或者进行bam文件转化
/software/samtools-1.3/samtools view /home/tech/NGS-example/AS_example/231ESRP.25K.rep-1.bam |less -s

#提取比对到参考序列上的比对结果 
samtools view  -bF 4 abc.bam > abc.F.bam 

#提取paired reads中两条reads都比对到参考序列上的比对结果,只需要把两个4+8的值#12作为过滤参数即可 
samtools view  -bF 12 abc.bam > abc.F12.bam 

#提取没有比对到参考序列上的比对结果 
samtools view  -bf 4 abc.bam > abc.f.bam 

#提取bam文件中比对到caffold1上的比对结果,并保存到sam文件格式 
samtools view  abc.bam scaffold1 > scaffold1.sam 

#提取scaffold1上能比对到30k到100k区域的比对结果 samtools view  abc.bam scaffold1:30000-100000 > scaffold1_30k-100k.sam

#统计bam文件中的比对flag信息,并输出比对统计结果 
/software/samtools-1.3/samtools flagstat toy.bam

#一般sam转换bam直接用sort函数,排序之后输出bam文件
/software/samtools-1.3/samtools sort -o toy.bam toy.sam

#对排序后的bam文件建立index,并输出为bai文件,用于快速随机处理。
/software/samtools-1.3/samtools index toy.bam

#统计reads数
samtools idxstats toy.bam | awk '{s+=$3+$4}'END'{print s}'

2 bedtools

• bedtools的功能非常强大,试图解决你所遇到的所有和基因组位置运算的问题以及周边问题:基因组运算,多文件比较,PE数据操作,格式转换,Fasta数据操作,BAM工具,统计学相关工具,其他小工具

• bedtools总共有二三十个工具/命令来处理基因组数据。比较典型而且常用的功能举例如下:格式转换,bam转bed(bamToBed),bed转其他格式(bedToBam,bedToIgv);对基因组坐标的逻辑运算,包括:交集(intersectBed,windowBed),”邻集“(closestBed),补集(complementBed),并集(mergeBed),差集(subtractBed);计算覆盖度(coverage)(coverageBed,genomeCoverageBed)

• bedtools的核心是基因组运算,所谓的基因组运算,就是看看看自己手头拿到的区域和你感兴趣的区域的关系如何。 bedtools提供了如下工具做一系列你想到或者你想不到的事情。

• bed格式一般主要包含了基因的染色体定位信息,包括染色体定位,起始位点以及终止位点等信息,便于对整条染色体的基因覆盖情况进行了解

#取交集
bedtools intersect -a a.bed -b b.bed
chr1    100 101 a2  2   -
chr1    100 110 a2  2   -

#输出overlap中a的序列
bedtools intersect -a a.bed -b b.bed -wa

#输出overlap中b的序列
bedtools intersect -a a.bed -b b.bed -wb

#输出两段序列中重复的部分
bedtools intersect -a a.bed -b b.bed -wa -wb

bedtools window命令,顾名思义,是扩展一个窗口;功能与intersect相似,是对A文件中每个元素 的位置坐标扩展,捕获B文件中与A有overlap的元素;如,寻找lncRNA的顺式靶基因
bedtools window -a a.bed -b b.bed
chr1    10  20  a1  1   +   chr1    20  30  b1  1   +
chr1    10  20  a1  1   +   chr1    90  101 b2  2   -
chr1    10  20  a1  1   +   chr1    100 110 b3  3   +
chr1    10  20  a1  1   +   chr1    200 210 b4  4   +
chr1    100 200 a2  2   -   chr1    20  30  b1  1   +
chr1    100 200 a2  2   -   chr1    90  101 b2  2   -
chr1    100 200 a2  2   -   chr1    100 110 b3  3   +
chr1    100 200 a2  2   -   chr1    200 210 b4  4   +

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,761评论 5 460
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,953评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,998评论 0 320
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,248评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,130评论 4 356
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,145评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,550评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,236评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,510评论 1 291
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,601评论 2 310
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,376评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,247评论 3 313
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,613评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,911评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,191评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,532评论 2 342
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,739评论 2 335

推荐阅读更多精彩内容

  • 默契就是我刚打开手机 准备给你发信息 手机就收到提醒 原来是你 我想你想我 像我想你一样来想我 想念我的好 想念我...
    小瑶爱写字阅读 230评论 0 0
  • 生命陪伴心语系统 我本是爱:此刻就是我享受爱,体验爱和表达爱的最大机会。 意气用事:深呼吸一二三。我看见了我的情绪...
    万新玲阅读 186评论 0 1