本篇的主要内容是:以果蝇蛋白序列数据为参考序列,注释转录组CDS序列。
- 下载果蝇蛋白序列
打开Flybase下载果蝇序列(ftp://ftp.flybase.net/genomes/Drosophila_melanogaster/dmel_r6.28_FB2019_03/fasta/)
2.创建工作目录,将参考序列放到工作目录
解压缩文件
可以查看文件
- 构建本地数据库
参考https://www.jianshu.com/p/775b463a0ec9
- 比对数据
命令如下
这一步消耗大量时间。建议长时间等待。
- 利用Excel简单注释
将比对结果粘贴到Excel上
将比对的Flybase上的蛋白ID利用flybase重新注释蛋白名称
最右侧就是Flybase中基因名及蛋白编号。可方便查询。