生物信息学数据挖掘学习笔记

教程https://www.bilibili.com/video/BV1JE411g7pr

image.png

image.png

image.png
image.png

芯片质量分析图


image.png

所有样本的基线处于一个0的水平线上
RNA降解图,这样的图就表明芯片质量很好


image.png


每个圆圈大小不一样:大:更多差异基因富集在这个上,颜色越深,表明更大程度的富集
image.png

差异基因上下游之间关系


image.png

共表达,,不同颜色代表一个模块,,找到所感兴趣的模块,与临床信息做比对,确定哪一个模块

如何利用GEO数据库对芯片简单分析

image.png

image.png
image.png

10个样本做基因芯片,叫系列series,用什么手段检测样本的基因表达量,就是平台,


image.png

确定数据类型:基因芯片、甲基化、等等


image.png

image.png

image.png

image.png

image.png

image.png

image.png

要把这些差异基因下载下来的话要复制粘贴就可以了,但有些没有基因名字,这些基因删掉就可以了


image.png

把基因芯片检测到的所有基因都做成一个表格,包含有差异和无差异的
image.png

要保存,,复制粘贴跟前面不一样‘
image.png

打开excel,粘贴,这时所有数据都搞在第一列,这时需要分开放在不同的列里面
选中第一列------数据---分列--固定宽度
--固定宽度

image.png

没有分开的单击一下就行了,下一步完成既可以了,去除分号,替换成空格

数据的中位数在同一个水平线上

制作热图,


image.png

GEO在线工具制作热图
只有有热图的项目才可以做热图
芯片质量评估、R


image.png

左上灰色分布图,,,灰色均一,
2 白色灰色权重较高,权重随机分布,分布均匀

3.残差点:点随机分布,,绿红蓝点随机分布,质量可以过关


image.png

1.做RLE比较简单
image.png

都要在0
2.做NUSE
image.png

image.png

中心处于一致水平接近于1
image.png

5端开始降解,若斜率很低和很高,,降解多,芯片质量有问题

r分析

image.png

image.png

下载原始数据

残差图、权重图

image.png

image.png

RLE

image.png

NUSE

image.png

RNA降解图

image.png

数据下载和预处理

GEO数据库里真正下载的是三个文件,平台文件、SERIES MATRIX FILE、RAW.tar


image.png

平台的话点进去,拉到最下面


image.png

点击如图,如果download不一定有的话,,点下面那个ANNOTATION SOFT table也可以的

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容