各种文章中的关于有害突变的介绍及如何寻找及打分

1.zhangle(大论文)

所有SNPs变异经由 ANNOVAR软件进行注释,首先,经由两步建立华南虎基因组注释用的数据库,使用软件自带的脚本,将基因组注释文件进行转化,参数为“gff3ToGenePred genes.gff stiger_refGene.txt”;接下来,“retrieve_seq_from_fasta.pl -format refGene --seqfile stiger.fa stiger_refGene.txt”。针对所有SNPs变体的vcf格式文件进行格式转化,“convert2annovar.pl -format vcf4old”,生成可以用于进行软件注释的输入文件,在grantham.matrix 矩阵下,对注释到的非同义突(nonsynonymous)进行Grantham Score(Amino acid difference formula to help explain protein evolution)评分,来判定有害的非同义突变,其评分的原理是利用氨基酸的物理/化学组成进行估计,评分的标准为5 到 215。一般认为,Grantham 评分≥150 的突变被认为是有害的,而 Grantham 评分 <150 的突变被认为良性(Nonrandomness of point mutation as reflected in nucleotide substitutions in pseudogenes and its evolutionary implications)。
此外,使用 SnpEff (v4.3)(A program for annotating and predicting the effects of single nucleotide polymorphisms, SnpEff: SNPs in the genome of Drosophila melanogaster strain)鉴定编码区中的 LOF 突变(功能性丢失突变)。首先需要基于华南虎的基因组和注释结果文件构建数据索引,参数设置为“java -Xmx40g -jar snpEff.jar build -gff3 -v south_tiger”。对输入的vcf变异文件,注释每个个体的SNPs并分配SnpEff 类别(参数,“Java -Xmx4g -jar snpEff.jar eff -c snpEff.config -v south_tiger”)。最后,我们将终止插入(stop gained)、剪接受体变体(splice acceptor variant)、剪接供体变体(splice donor variant)三者合并作为最终的 LOF 突变,并在获得的所有LOF注释条目中,提取存在50%以上转录本会受到影响的位点,参数“cat file.eff.vcf | java -jar SnpSift.jar filter "LOF[].PERC > 0.5”。
针对有害的 nsSNPs(Grantham Score > 150)和LOF遗传负荷结果的统计。我们参考了Feng(The Genomic Footprints of the Fall and Recovery of the Crested Ibis)等人的计数方法,用同源位点(纯合子位点计数为2,杂合子位点计算为1)的比例作为统计群体SNP数据中每个个体的遗传负荷。计算公式如下:
Ratio = 2 * homozygous sites / 2 * homozygous sites + 1
heterozygous sites
其中,纯化位点 = 每个个体的纯合等位基因(0/0或1/1)的数量,杂合位点 = 每个个体的杂合等位基因(0/1)的数量。

2.liyu穿山甲(Genomic consequences of population decline in critically endangered pangolins and their demographic histories)

我们使用SnpEff v.4.3t(A program for annotating and predicting the effects of single nucleotide polymorphisms, SnpEff)将每个个体编码区的衍生等位基因突变分为错义突变和LOF突变。与Feng等人的策略The genomic footprints of the fall and recovery of the crested ibis类似,每个穿山甲物种的主要纯合等位基因(>占个体的50%)和其他穿山甲物种(作为外群)的相同纯合等位基因的基因型被用来代表祖先状态。我们根据两种穿山甲的注释和参考基因组序列建立了数据库。VCF格式的输入文件用于注释snp,并为每个个体的输入snp分配突变类别。LOF突变包括过早终止密码子(无义)和剪接位点中断的单核苷酸变异。评估每一类纯合子位点(每个位点两个)与纯合子和杂合子位点(每个纯合子位点两个,每个杂合子位点一个)的数量之比,以估计有害负荷The genomic footprints of the fall and recovery of the crested ibis;Genomic flatlining in the endangered island fox。
错义突变的危害性也通过格兰瑟姆评分(GS)[55]来诊断,这是一种衡量氨基酸变化的物理/化学性质的方法。Grantham评分≥150为有害(Amino acid difference formula to help explain protein evolution)。对于所有已鉴定的纯合LOF突变(种群间绝对等位基因频率差异>0.2)(Nonrandomness of point mutation as reflected in nucleotide substitutions in pseudogenes and its evolutionary implications),我们使用BLASTP基于人类基因组注释获得相关基因(e值≤1.0 × 10−10)(Historical genomes reveal the genomic consequences of recent population decline in eastern gorillas)。受LOF突变影响的基因的GO和KEGG功能富集基于DAVID数据库进行评估(Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources)。为了避免装配和注释工件对LOF结果的影响,我们还通过将这些结果与之前独立发表的两个基因组进行比较来证实这些结果(Scaling up pangolin protection in China)。

3.Zachary A(Long Runs of Homozygosity Are Enriched for Deleterious Variation)

为了预测一个变异等位基因是否有害,我们使用PolyPhen2程序。对于中性变异,我们认为同义位点和错义位点都是良性的。接下来,通过ROH区域的坐标,我们计算每个个体的ROH中预测的有害变异的数量。
可以和上面两个结合一下,利用上面的软件找到有害突变位点,再根据坐标对应到ROH片段中。

4.Trevor J. Pemberton(Genomic Patterns of Homozygosity in Worldwide Human Populations)

文中提到了一个计算ROH热点区域和冷点区域的公式:
Pall=nall / N
其中P为概率,nall为某个ROH在人群中的数量,N为总人口数。
根据公式划分ROH属于热点区域还是冷点区域,热点区域代表ROH在大多数个体中都有分布,导致遗传多样性降低,而冷点区域导致遗传多样性升高。文章中定义超过30.34%为热点区域;低于2.72%为冷点区域。感觉可以应用一下。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,033评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,725评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,473评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,846评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,848评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,691评论 1 282
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,053评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,700评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,856评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,676评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,787评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,430评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,034评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,990评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,218评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,174评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,526评论 2 343

推荐阅读更多精彩内容