DARwin6 can be directly downloaded from the web site http://darwin.cirad.fr/
应该是没有发表正式文章
貌似可以以进行聚类分析为主,还可Principal Coordinate analysis,引物从原始数据到聚类文件输入文件-计算dissimilarities-得到树文件
现在就是明白软件的对于基因型SSR数据的输入格式,软件以.var
格式作为软件的输入格式,其格式具体内容如下:
1 2 3 行都是一些特定的描述,之后为你的数据
输入文件 .VAR components`具体的数据格式包括:
Single data
: 显性数据。单倍体数据,0/1格式数据
Sequence data
:序列数据
本实验为带有基因型的SSR数据,即是软件中的
Allelic data
: 第一行需表明倍性,第二行位点数和等位基因树
最方便得到.var文件就是预先处理自己文件为一下这种文本格式,本次将999作为missing data
然后import这个文件即可,会输出Var格式的文件作为标准的软件输入格式文件,可选择什么作为missingdata。这种情况会清除DataMatrix里的对于样本的命名,重新按顺序从1开始进行命名,很不友好,尝试自己将DataMatrix更改为var格式,是可以的只要第一列即样本列只是数字即可,后续进行转换吧。重命名后也会很迷惑,还是使用原文件DataMatrix用软件转换成var吧,之后的树形文件中的标签可以直接使用itol进行更改
输入文件 .AFT 文件
计算PCA时的输入文件,不关注
中间文件 .DIS 文件
计算得到的dissimilarity matrix 可从其他软件计算得到,应该也可以从var文件中使用DARwin计算得到。
如何计算dissimilarity matrix
而对于missing data如何进行操作,可删除整个样本或整个位点,一般选择第三个选项也是默认。
然后设置bootstraps,点击右上save即可,得到dis文件
结果文件 .ARB
应该时对树形文件的描述,看不懂
然后就可以使用itol等软件进行编辑了。