文章题目
whole genome genotyping reveals discrete genetic diversity in north-east Atlantic maeral beds
期刊、发表时间等等
Evolutionary Applications
4.013 二区
University of Exeter 英国
本地文件名 eva.13219.pdf
主要研究内容
maeral beds 是个啥暂时还不知道
Phymatolithon calcareum, a maerl-forming red algal species
红藻的一个种
二代测序,组装了基因组,然后检测snp,做群体结果
还分析了叶绿体和线粒体基因组
数据和分析用的代码都是公开的,很好的学习素材
github的链接是
GitHub - Tom-Jenkins/maerl_genomics: Data and code from Jenkins et al. 2021
论文里写道有一个线粒体组装成环状的了,Tre04,
我们按照他提供的脚本组装试一下
首先是下载测序数据
conda activate download_raw_data
prefetch SRR13356850 -O ./
数据不大,很快就下载好了
转换成fastq格式
fasterq-dump --split-files SRR13356850.sra -p
提取属于线粒体中的测序数据reads
下载种子序列
KF808323
MH281621
conda activate chloroplast
get_organelle_from_reads.py -1 SRR13356850.sra_1.fastq -2 SRR13356850.sra_2.fastq -o output_dir -s MH281621.fasta,KF808323.fasta -F embplant_mt,embplant_mt -t 16 -R 50 --no-spades
这个结果没有内容,暂时不知道什么原因
论文中组装用到的是Unicycler这个程序
接下来我试了一下NOVOplasty这个程序组装得到了环状结果,最终长度是28066 bp 结果和文章中的一致
还涉及到了基因渗入分析,这部分内容得好好看一下
还有一个图是关于地图添加饼状图的,抽时间重复一下代码
这里还有种群结构分析,就是structure 然后多少个k那个,这个也得好好看看
欢迎大家关注我的公众号
小明的数据分析笔记本
小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!