前提这次研讨会的内容很丰富,作为一个生信的初学者,一次性灌输这些内容有些太多,做个写个文章记录一下。表示听过
广东生物信息学研讨会
11月9日内容
第一讲 清华生命科学院 张强锋 single-cell sequencing data analysis via latent feature extraction
第二讲 华南理工大学数学学院 刘锐 基于动态生物信息探测疾病临界点
第三讲 中山大学中山医学院 李淼新 整合转录组数据深 度解析复杂疾病统计关联信号方法研究
第四讲 中国科学院广州生物医药与健康研究院 陈捷凯 细胞命运迫踪算法及在体细胞重编程中的应用
第五讲 南方医科大学 官道刚 多组学数据整合技术体系的建立及在临床和转化医学中的应用
第六讲 中山大学生命科学学院 杨建华 Decoding the Regulation of RNA modifications from Multi-dimensional Sequencing Data
第七讲 中山大学生命科学学院 骆观正 新型核酸修饰N6甲基腺嘌呤的精准检测及功能研究
第八讲 中国科学院广州生物医药与健康研究院 彭广敦 空间转录组分析
第九讲 广州医科大学呼吸疾病国家重点实验室 孙德强 DNA甲基化分析方法开放及其在脑癌中的应用
第十讲 AWS基因生命科学 余昶 AWS助力生物信息云端创新
第十一讲 中山大学生命科学学院 张锐 Distinguishing signal from noise in epitransariptome maps
第十二讲 南方医科大学肾内科 张镇海 免疫组库测序及其应用
第十三讲 南方科技大学生物系 靳文菲 Principles of 3D Nucleus Organization and Epigenetic Regulation in Diploid Genome Revealed by Multi-omic Data from Hybnid Mouse
第一讲 single-cell sequencing data analysis via latent feature extraction
开始介绍了 一篇文章:Spatially resolved, highly multiplexed RNA profiling in single cells
by Kok Hao Chen, Alistair N. Boettiger, Jeffrey R. Moffitt, Siyuan Wang, and Xiaowei Zhuang
https://science.sciencemag.org/content/348/6233/aaa6090
简介:细胞功能的基础是的蛋白质在何时何地表达以及表达的数量。smFISH实验量化了mRNA的Copy number 和位置。但是通过smFISH同时测量的RNA种类的数量受到限制。他们使用带有错误纠正编码方案的组合标记。同时在单细胞中100至1000个rna不同RNA成像。~10的4次方到10的6次方对的相关基因使其限制基因调控网络,预测许多未注释基因的新功能,并鉴定与编码蛋白质特性相关的RNA独特的空间分布模式。
一句话:
提出了MERFISH 用一组编码探针标记每个细胞RNA,使用连续杂交和成像循环,每个循环都有不同的探针,识别与每个RNA结合的读出序列并解码RNA,例如:使用改良的汉明码为每个RNA分配二进制字符,并结合读序对RNA进行编码。
用此方法在单细胞中鉴定计数与定位多种RNA,单RNA的高度重复测量可以用于计算基因表达、noise、不同基因之间表达的相关变异和单细胞内的RNA空间分布
图E是用于RNA鉴定的MHD4代码的示意图。每个RNA物种首先用192个编码探针标记,该探针将RNA转换为读出序列的特定组合(编码hyb)。这些编码探针各自包含一个RNA靶向区域,两侧是两个读数序列,从N池中提取不同的序列,每个序列都与特定的杂交回合相关。特定RNA种类的编码探针包含N个读出序列中四个序列的特定组合,这些序列对应于该RNA应该读取1个的四个杂交回合。随后的N轮与荧光读出探针的杂交用于探测读出的序列(hyb 1,hyb 2,…,hyb N)。通过在连续几轮杂交之间进行光漂白使结合的探针失活。为了清楚起见,对于编码探针,仅描绘了读出序列的一种配对。然而,在实际实验中,四个读出序列的所有可能的对都以相同的频率使用,并沿每个细胞RNA随机分布。
视频没了直接读文献了
https://www.biorxiv.org/content/10.1101/315556v1.full
一句话:
提出了一种scScope 深度学习算法 从数百万个嘈杂的单细胞基因表达谱中准确,快速地识别细胞类型组成。
具体内容:
问题提出:single-cell profiles are highly susceptible totranscript amplification noise and dropout events 需要一种从嘈杂,大量,高纬度的scRNA 数据处理工具
scScope 使用了一种无监督的单细胞数据建模的深度学习框架处理单细胞数据
主要架构(图a):scScope的循环网络架构。输入具有缺失基因测量值的单细胞配置文件x , encoder layer(用于特征提取),decoder layer(用于降噪)imputationlayer(用于插补归位)推算结果v被加回到原始输入配置文件x填写缺失值,此过程递归进行T次,以产生最终的特征特征向量输出h,用于生物学发现,例如识别表型不同的亚群或基因网络对扰动的反应。
视频没了。。。。