复现SCI文章多序列比对相似性表格(二)—DNA序列相似性

前面通过视频给大家介绍一下我们要复现的内容

复现SCI文章多序列比对相似性表格(一)

就是下面这篇文章的Table2


表格如下,一共有23种不同的肝炎病毒株


表格中,右上三角是23种病毒株的DNA序列,两两之间的序列相似性。左下三角是23种病毒株的氨基酸序列,两两之间的序列相似性。

今天我们先来计算,DNA序列两两之间的序列相似性。

1)数据获取这里文章的表格中已经给出了23个病毒株的ID号,在表格的行名中。直接贴到NCBI数据库就可以下载相应的DNA序列和氨基酸序列。

2)计算DNA序列两两之间的序列相似性,这里有23种病毒株,所以需要计算253次。

最终我们可以得到下面这个DNA序列两两之间的相似性


获取完整数据+R代码+详细注释

今天的分享就先到这里,希望对大家的科研有所帮助。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容