关于微生物全基因组测序的应用在当今生命科学领域的研究中有着着至关重要的作用。
今天来分享一下基于全基因组测序的拼接:
拼接分析原理
测序仪器一次测量的长度有限,通常会对样本中的序列进行饱和式测量,原始数据文件中会包含大量来自基因不同位置、长度不同的短序列。拼接工作将这些短序列按照一定顺序排列并筛除重复部分,合成长序列。
全基因组测序原始数据质控及拼接服务通过数据拼接算法(Velvet、SPAdes)及k-mer值优化选择,进行数据拼接;同时依据大样本分析结果,可对原始数据、质控后数据、拼接数据进行可靠性评估,并通过颜色标记直观指示样品测序数据可靠性,保证数据分析准确度,包括N50、NonACGT碱基数目、GC含量、contig数目等。
两个或多个基因测序结果要如何拼接呢?直接在微生物数据分析平台进行批量拼接分析(沙门氏菌),同时并行处理多项数据,最后以图形展现,更直观。