目录
(2) 选择物种(selected reference assemblies)
目的:对已通过Primer Premier 3和 Oligo 7所设计的引物,用NCBI-Primer-Blast 检测该引物在该物种中的特异性。
Primer-BLAST,在线设计用于聚合酶链反应(PCR)的特异性寡核苷酸引物。Primer-BLAST可以直接从Blast主页(http://blast.ncbi.nlm.nih.gov/)找到,或是直接用下面的链接进入:http://www.ncbi.nlm.nih.gov/tools/primer-blast/
输入引物的序列(注意引物的方向)
在specificity check区,选择设计引物或验证引物时的目标数据库和物种。这一步是比较重要的。这里提供了7种数据库:RefSeq mRNA, Refseq representative genomes,Genomes for selected eukaryotic organisms (primary assemblies only),Refseq representative genomes,core_nt,nt,Refseq RNA,Custom。
下面就这7种数据库进行介绍:
a. Refseq mRNA:此数据库仅包含来自NCBI参考序列集合的mRNA。只包含了NCBI Refseq数据库中编码蛋白质的mRNA。
b. Refseq representative genomes(Refseq代表性基因组):此数据库包含NCBI Refseq参考和代表性基因组,包含了NCBI Refseq数据库中编码蛋白质的mRNA和非编码RNA。涵盖广泛的分类组,包括真核生物、细菌、古细菌、病毒和类病毒。这些基因组是NCBI提供的质量最好的基因组之一。该数据库包含最小冗余的基因组表示。对于真核生物,每个物种只包括一个基因组(然而,在适用的情况下,真核生物基因组的替代位点也包括在内)。对于其他物种,可以包括来自同一物种的不同分离株的基因组。线粒体基因组包括在适用的地方。该数据库以最小冗余度建立,包含了从NCBI Refseq基因组数据库中选择的参考和代表性基因组,其结果是该数据库中的基因组是NCBI提供的质量最好的基因组序列信息。
c. Genomes for selected eukaryotic organisms (primary assemblies only):包含了来自主要染色体装配的完整或接近完整的基因组序列,可以选择限定的物种有:apis mellifera,bos taurus ,danio rerio,dog,drosophila melanogaster,gallus gallus,human,mouse,pan troglodytes,pig,rat。
d. nt(Nucleotide sequence database)包含了除EST,STS,GSS,WGS,TSA,patent,HTGS以及长度超过100Mb序列以外的包含在GenBank,EMBL,DDBJ,PDB,RefSeq中的所有序列。
e. core_nt:与nt相同,除了它不具有NCBI基因组组装部分的真核染色体序列。
f. Refseq RNA:这包含了所有来自NCBI参考序列。收集的真核生物基因组的RNA条目(仅为初级组装):这些是来自许多真核生物的初级染色体组装(即没有替代位点)的Refseq代表性基因组。线粒体和质体基因组也包括在适用的地方。虽然该数据库中的序列完全被Refseq代表性基因组数据库覆盖,但它不包含替代位点,从而避免了包含替代位点带来的序列冗余。如果您不考虑由替代位点表示的变异,则建议使用该数据库。
g. Custom(自定义):您可以使用自己的序列,包括核苷酸序列,基因组组装序列(如GCF_000001635.27)或FASTA序列作为搜索数据库。最多允许加入20个装配件。FASTA序列限制在300米以内。注意,对于自定义数据库,有机体字段将被忽略。
a. 如果是提取的RNA反转录后得到cDNA就选择Refseq mRNA(针对mRNA)或Refseq RNA(针对mRNA和lncRNA);若模板是基因组,则应该选择Refseq representative genomes。
b. Refseq mRNA和Refseq RNA区别:举例NCBI human GLYR1(Gene ID: 84656)有5个NM 号,6个NR号,7个XM号,4个XR号。在使用AGTCGTCTCAACCTGCGACAT和GCCGCTAAGATCACCAACATC这对qPCR引物进行比对,结果为:如果选择Refseq mRNA比对,只能比对到5个NM号和7个XM号;如果选择Refseq RNA比对,比对到5个NM号,6个NR号,7个XM号,4个XR号。
c. Refseq representative genomes与Genomes for selected organisms (primary reference assembly only)的区别:前者完全包含后者,后者Genomes for selected organisms (primary reference assembly only)不包含替代基因组,因此比Refseq representative genomes数据库具有更少的冗余。如果您不考虑替代基因组或者线粒体序列,建议在进行qPCR引物特异性比对时推荐使用Genomes for selected organisms (primary reference assembly only)。
(2)选择物种(selected reference assemblies)
包括以下的物种:human, chimpanzee, mouse, rat, cow, dog, chicken, zebrafish, fruit fly, honeybee, Arabidopsis,和 rice。
要选择自我配对和互相配对度低,产物长度尽量小的等等。需要指出的是,要注意看引物对非目标基因的检测潜力,如果它对于目标基因相似基因扩出的产物长度与目标产物长度一样长,这个引物的非特异性就很强,不能要。