当我们对疾病分类不够清楚时,可以查看:
前期调研
1 疾病分类
2 根据疾病预测相关基因:
3 根据癌症名称搜索相关信息
cosmic
http://cancer.sanger.ac.uk/cosmic/
TCGA
https://cancergenome.nih.gov/
4 NCBI的OMIM和ClinVar
https://www.ncbi.nlm.nih.gov/omim/
https://www.ncbi.nlm.nih.gov/clinvar/
数据分析
1 关于UCSC不同版本基因组相关
人类基因组不同版本位置的互转
http://genome.ucsc.edu/cgi-bin/hgLiftOver 点击-Tools -liftover
2 bam数据转为fastq格式
[http://bedtools.readthedocs.io/en/latest/content/tools/bamtofastq.html]
3 比对软件
3.1关于reads和基因组比对软件
https://github.com/philres/ngmlr
https://github.com/PacificBiosciences/blasr
minimap2略
bwa略
3.2 关于组装contig和参考基因组的比对
https://github.com/mummer4/mummer
4 结构变异检测软件
4.1 结合二代、三代数据进行混合callSV
https://bitbucket.org/xianfan/hybridassemblysv/
组装后callSV
4.2 三代数据结构变异检测软件
Sniffles
[https://github.com/fritzsedlazeck/Sniffles/releases]
https://www.hgsc.bcm.edu/software/honey
4.3 二代数据结构变异检测软件
lumpy 0.2.13
https://github.com/arq5x/lumpy-sv
Delly
https://github.com/dellytools/delly
4.4 组装contig结构变异检测
组装软件
三代组装
Canu
https://github.com/marbl/canu
Falcon
https://github.com/PacificBiosciences/FALCON-integrate/wiki/
组装contig结构变异检测
http://assemblytics.com
4.5 关于结构变异的注释
annovar
Tandem Repeat Finder
https://tandem.bu.edu/trf/trf.html
后期初步验证
IGV查看检测SV区域reads比对情况
[http://www.broadinstitute.org/software/igv/download]
2 java
http://www.oracle.com/technetwork/java/javase/downloads/jdk9-downloads-3848520.html
3 根据疾病表型查询基因
4流程图
https://www.gliffy.com/go/html5/launch
5预打印文献
6 三代分析
https://github.com/PacificBiosciences/SMRT-Link/blob/master/README.md
7nanopore
8 samtools使用
http://starsyi.github.io/2016/05/21/Samtools%E5%B8%B8%E7%94%A8%E5%91%BD%E4%BB%A4%E8%AF%A6%E8%A7%A3/
9 通路富集的网页:
10 sge的简单的应用
qsub -cwd -l vf=XXG -q all.q -pe smp=XX
11 InterVar
http://qinqianshan.com/acmg-intervar/
https://github.com/WGLab/InterVar/releases
InterVar: Clinical Interpretation of Genetic Variants by the 2015 ACMG-AMP Guidelines
EXAMPLE
./InterVar.py -c config.ini # Run the examples in config.ini
./InterVar.py -b hg19 -i your_input --input_type=VCF -o your_output
annovar讲解
https://www.plob.org/article/9976.html
13 1 GATK
fq处理集:
http://www.bioinformatics.com.cn/?/m/topic/fastq
disease-ontology看疾病分类
14 smartlink在github上的网址
https://github.com/PacificBiosciences/SMRT-Link
12 annovar等注释,最终采取:
annovar网址
以前做Dgv的时候有交集就拿出来,现在设置overlap -minqueryfrac 0.5 设置0.7 70%的交集
13 smart-sv 基于组装,用于高深度的三代数据结构变异检测