【群体结构】Network分析

疫情的爆发使得病毒基因组的研究呈现井喷式增长,其中有一部分研究是与进化相关的,病毒从何而来,病毒是否发生了进化等等一系列问题都被大家关注着。这里小Q介绍其中的一种分析--Network网络图分析。

分析用途

目前小Q接触Network分析,有以下几种使用环境:

软件介绍

  • 小编较常用的软件是Network(https://www.fluxus-engineering.com/sharenet.htm),这款软件是免费开源的,可直接下载使用。它主要是计算单倍型之间的关系,并计算其在网络中的位置。
  • 它还有一个收费的Network publisher,可以很方便的调整Node的颜色分区,对于后面图的展示帮助很大。这里不做介绍。

1)输入文件
我较为常用的RDF(Roehl Data File)文件,以此为例:
示例: 2个单倍型,5个碱基长度

空格空格;1.0
1;2;3;4;5;
10;10;10;10;10;
\>H_1;1;;;;;;;;
CCTCG
\>H_2;1;;;;;;;;
CCTCG

讲解:
1.1) 第1行
;1.0前面的2个空格必须要有,别问原因,问小Q也不知道,就知道不加就出错,哈哈
1.2)第2行
碱基(突变)位置,随意数字都可以,建议用基因组上的真实位置,这样后续分析可知道单倍型之间相差是哪些位置的碱基。
1.3)第3行
每个碱基的权重,一般这里我不做修改,默认都是10,关于如何修改这个值,感兴趣的伙伴可以看下官方说明。
1.4)第4行-第5行
第1个单倍型的名称和碱基序列

  • H_1;1;;;;;;;;
    这里,H_1是单倍型名称,必须是独特的
  • 1:表示这个单倍型的频数为1
    后面每一个分号前面都表示这个单倍型的属性,比如:所属物种,所属国家,所属时间等均可
    1.5)第6行-第7行
    第2个单倍型的名称和碱基序列

怎么做

  1. 准备好RDF文件
微信图片_20200807121252.png
微信图片_202008071212521.png
微信图片_202008071212522.png
微信图片_202008071212523.png
微信图片_202008071212524.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。