本周最新文献速递20210718
一、精细解读文献 一
文献题目: Tissue-specific 5-hydroxymethylcytosine landscape of the human genome
不想看英文题目: 人类基因组的组织特异性 5-羟甲基胞嘧啶景观
杂志和影响因子: Nat Commun (IF: 12.121; Q1)
研究意义: 5-羟甲基胞嘧啶 (5hmC) 是一种重要的表观遗传修饰,在各种生物学过程中起着重要作用,包括转座子沉默、基因表达调控、基因组印记和X-染色体失活等。绘制人体组织中 5hmC 图谱有助于了解其调控机制。
结论:
1)通过 hmC-CATCH 测序方法生成了 19 种人体组织类型的 5hmC 全基因组数据,数据包括 6 个中国捐赠者(3 名男性 、3 名女性)的 60 个组织样本;
2)产生了 721,404 个可重复的 5hmC 峰,9,416,937 个可重复的 5hmC 位点,峰和位点大部分位于内含子和基因间隔区;
3)分析 5hmC 在不同调控区域的 motif,发现 5hmC motif 呈现规律性的 “CAhmCGT” 模式,与 ARNT 的 motif 接近,揭示 5hmC 可能影响 ARNT 在基因组的结合率,有文献报道食管癌患者的 ARNT 结合motif后 会使得 5hmC 信号丢失;
4)对人体组织中的 5hmC 水平和基因表达进行皮尔森相关性分析,发现基因的表达水平和 5hmC 水平显著正相关,且大多数基因为组织特异性表达,但 5mC 与组织特异性基因的表达水平则无显著相关,说明 5hmC 不仅与基因表达密切相关,并且可能维持组织特异性的功能;
5)为了进一步阐明 5hmC 维持组织特异性可能的调控机制,作者鉴定了一系列具有组织特异性的 5hmC 峰,表现为在不同组织中呈现差异高羟甲基化,并将该区域命名为组织特异性差异羟甲基化区域(tsDhMRs), 大部分 tsDhMRs 位于内含子和远端区域,且在进化上更为保守,说明 tsDhMRs 属于一种重要的调控元件;
6)探究 tsDhMRs 潜在的转录因子结合位点 (TFBS),发现超过一半的 tsDhMR 与至少一个 TFBS 重叠,且重叠的 TFBSs 多为组织特异性;
7)结合GWAS结果,发现 tsDhMRs 区域富含 GWAS 发现的显著信号位点,且与 eQTL SNP 高度重合,说明 tsDhMR 有助于理解 GWAS 发现的 SNP 功能;
亮点: 鉴定了数十万个 5hmC 峰和数百万个 5hmC 位点,远远超越之前报道的数量;
局限: 大方向上观察到 tsDhMRs 区域与 eQTL 位点(或GWAS 信号位点)高度重合,但文章没有进一步解释 eQTL(或GWAS信号位点) 与 5hmC 是如何一起影响基因表达(或表型)?
文章链接:
https://pubmed.ncbi.nlm.nih.gov/34253716/
doi: 10.1038/s41467-021-24425-w
公开的资料:
Sequencing data:
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE134078
BS-seq:
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE119981
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE112356
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE59395
ChIP-seq data:
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE59395
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE16256
DNase-seq:
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE18927
Code:
https://github.com/herb-BO/hmC_CATCH
二、精细解读文献 二
文献题目: Discovery and prioritization of variants and genes for kidney function in >1.2 million individuals
不想看英文题目: 在超过 120 万人的队列中发现和优化肾功能相关的变异位点和基因
杂志和影响因子: Nat Commun (IF: 12.121; Q1)
研究意义: 慢性肾病 (CKD) 在发达国家成年人口中患病率超过 10%,为全球发病率和死亡率主因。CKD 的临床表现为肾小球滤过率(GFR )降低,其可用血清肌酐水平进行估计。据报道,基于血清肌酐的肾小球滤过率 (eGFRcrea) 遗传度高达54%,但缺乏大规模队列对其调控下的慢性肾病进行研究。
结论:
1)总共纳入了 1,201,909 个人,对 eGFRcrea 表型进行荟萃分析,鉴定了424 个相关的基因座,其中 201 个为新基因座,223 个是已知的;
2) 82% 的 eGFRcrea 基因座与多种肾功能标志物显著相关,比如血清胱抑素 C (eGFRcys)、血尿素氮 (BUN),说明 eGFRcrea 鉴定的基因座可很好表征肾功能;
3)使用 GCTA 进行条件分析,发现了 634 个独立信号;
4)为了缩小关联信号的范围,对每个信号的后验概率 (PPA)进行计算,并构建 99% 可信集。 在 634 个独立信号中, 138 个位于 99% 可信集中,其中 30 个被映射到新基因座上;
5)对99%可信集的变异位点进行 cis -eQLT/sQTL 共定位并映射到基因上,总共产生 5906 个基因,结合CADD 得分、肾功能注释数据库(MGI小鼠数据库、OMIM数据库)等对 5906 个基因进行优先排序(GPS)后,产生了32个与肾功能高度相关的基因;
6)使用 LDSC-SEG 对 5906 个基因的细胞类型和组织特异性进行鉴定,发现主要富集在肾脏和肌肉中,与之前文献报道的一致;
亮点:
使用 eGFRcys/BUN 关联结果侧面验证 eGFRcrea 结果的可靠性;
文章链接:
https://pubmed.ncbi.nlm.nih.gov/34272381/
doi: 10.1038/s41467-021-24491-0
公开的资料:
log(eGFRcrea), log(eGFRcys), log(BUN) gwas summary 数据:
http://www.genepi-regensburg.de/ckd
https://ckdgen.imbi.uni-freiburg.de/
https://ckdgen.imbi.uni-freiburg.de/
GPS基因:
http://www.genepi-regensburg.de/ckd
三、其他文献推荐
下面的文献也挺精彩的,但由于下不到原文,或博主时间有限,没法精细解读,故列出来供各位参阅;
当然,你们有精彩的文献想让我解读的(前提是一周内刚出炉的文献),可给我发pdf(然而可能种种原因,我不一定有时间解读,不要对我抱太高期待);
文献题目: Senolytics reduce coronavirus-related mortality in old mice
不想看英文题目: Senolytics 降低老年小鼠与冠状病毒相关的死亡率
杂志和影响因子: Science (IF: 41.845; Q1)
文章链接:
https://science.sciencemag.org/content/373/6552/eabe4832
文献题目: Highly accurate protein structure prediction with AlphaFold
不想看英文题目: 使用 AlphaFold 进行高精度蛋白质结构预测
杂志和影响因子: Nature (IF: 42.778; Q1)
文章链接:
https://www.nature.com/articles/s41586-021-03819-2
文献题目: The chromatin, topological and regulatory properties of pluripotency-associated poised enhancers are conserved in vivo
不想看英文题目: 多能静态增强子的染色质、拓扑和调控特性在体内是保守的
杂志和影响因子: Nat Commun (IF: 12.121; Q1)
文章链接:
https://www.nature.com/articles/s41467-021-24641-4
文献题目: Profiling variable-number tandem repeat variation across populations using repeat-pangenome graphs
不想看英文题目: 使用重复泛基因组分析不同群体的可变数目串联重复变异
杂志和影响因子: Nat Commun (IF: 12.121; Q1)
文章链接:
https://www.nature.com/articles/s41467-021-24378-0
四、工具或资源类介绍
文献题目: Si-C is a method for inferring super-resolution intact genome structure from single-cell Hi-C data
不想看英文题目: Si-C:从单细胞 Hi-C 数据推断超分辨率完整基因组结构
杂志和影响因子: Nat Commun (IF: 12.121; Q1)
文章链接:
https://www.nature.com/articles/s41467-021-24662-z
文献题目: RoboCOP: jointly computing chromatin occupancy profiles for numerous factors from chromatin accessibility data
不想看英文题目: RoboCOP:从染色质可及性数据中联合计算多因素下的染色质占用率
杂志和影响因子: Nucleic Acids Res (IF: 11.501; Q1)
文章链接:
https://pubmed.ncbi.nlm.nih.gov/34255854/
文献题目: quincunx: an R package to query, download and wrangle PGS Catalog data
不想看英文题目: quincunx:查询、下载和处理多基因评分 (PGS)目录数据的 R 包
杂志和影响因子: Bioinformatics (IF: 5.61; Q1)
网站: https://github.com/maialab/quincunx
文章链接:
https://pubmed.ncbi.nlm.nih.gov/34270693/
文献题目: LINADMIX: Evaluating the effect of ancient admixture events on modern populations
不想看英文题目: LINADMIX:评估古代混合事件对现代人群的影响
网站: https://github.com/swidler/linadmix
杂志和影响因子: Bioinformatics (IF: 5.61; Q1)
文章链接:
https://pubmed.ncbi.nlm.nih.gov/34270685/
致谢橙子牛奶糖(陈文燕),请用参考模版:We thank the blogger (orange_milk_sugar, Wenyan Chen) for XXX
感谢小可爱们多年来的陪伴, 我与你们一起成长~