4️⃣ 核酸序列特征分析(6):密码子使用模式的分析

[序列比对和序列特征分析总目录](https://www.jianshu.com/p/878f2b2495ae

一共20种编码氨基酸,除去3个终止密码子,一共61个密码子。也就是说61个密码子编码20种氨基酸。会出现每个氨基酸对应几个密码子的现象,这些编码同一个氨基酸的密码子叫同义密码子。但是这些密码子不是平均使用,而是有一定的使用倾向性。

也就是说,某一物种或某一基因通常倾向于使用一种或几种特定的统一密码子,并且这种现象不是随机的,这些最常用的密码子称为最优密码子,这种现象称为密码子使用偏好性。
这种偏好性的产生与基因的表达水平,翻译起始效应,基因的碱基组成, GC含量,基因长度,tRNA丰度等很多因素相关。

所以,分析密码子偏好性有重要的生物学意义。


code degeneracy

最广泛使用的密码子偏好性软件是CodonW,目前没有界面版本,有Windows,max和linux命令行版本。还是以linux为例

可以用conda安装,省却很多麻烦。

conda install codonW

安装完成

$ codonw

 Welcome to CodonW  for Help type h

 Initial Menu
 Option
         (1) Load sequence file
         ( )
         (3) Change defaults
         (4) Codon usage indices
         (5) Correspondence analysis
         ( )
         (7) Teach yourself codon usage
         (8) Change the output written to file
         (9) About C-codons
         (R) Run C-codons
         (Q) Quit
 Select a menu choice, (Q)uit or (H)elp ->

用法和别的不太一样,属于命令行的交互版
具体来讲:

  • 输入1,载入要分析的序列文件,这里我载入官方网站的示例数据
  • 中间的选项可以自行设置,只需要输入相应的序号即可
    比如第4个选项
 Codon usage indices
 Options
 ( 1)  Codon Adaptation Index       (CAI)
 ( 2)  Frequency of OPtimal codons  (Fop)
 ( 3)  Codon bias index             (CBI)
 ( 4)  Effective Number of Codons   (ENc)
 ( 5)  GC content of gene           (G+C)
 ( 6)  GC of silent 3rd codon posit.(GC3s)
 ( 7)  Silent base composition
 ( 8)  Number of synonymous codons  (L_sym)
 ( 9)  Total number of amino acids  (L_aa )
 (10)  Hydrophobicity of protein    (Hydro)
 (11)  Aromaticity of protein       (Aromo)
 (12)  Select all
 (X)  Return to previous menu

这里,我选择了12,select all 设置好后,运行“R”选项,
结果如下

$ head -20 kkout
title                           T3s     C3s     A3s     G3s     CAI     CBI     Fop     Nc      GC3s    GC      L_sym L_aa    Gravy   Aromo
YCG9_Probable__________13       0.4337  0.2347  0.3588  0.1852  0.177   -0.083  0.360   54.09   0.335   0.394   439   458     0.610699        0.122271
YCG8________573_residues_       0.2876  0.3595  0.4222  0.1875  0.156   -0.036  0.372   52.46   0.439   0.446   180   190     -0.211579       0.084211
ALPHA2________633_residue       0.3636  0.2273  0.4939  0.2177  0.153   -0.108  0.353   58.73   0.328   0.351   204   210     -0.667143       0.052381
ALPHA1________528_residue       0.4361  0.2180  0.4228  0.2589  0.231   0.018   0.446   58.29   0.345   0.379   168   175     -0.522857       0.148571
CHA1_________1083_residue       0.4399  0.2337  0.3927  0.1958  0.214   0.000   0.425   50.30   0.328   0.394   351   360     -0.046667       0.075000
KRR1__________951_residue       0.4045  0.2409  0.4310  0.2591  0.193   -0.092  0.364   45.99   0.364   0.384   302   316     -0.762658       0.079114
PRD1_________2139_residue       0.4180  0.2757  0.3244  0.3169  0.263   0.052   0.456   53.19   0.430   0.397   684   712     -0.481742       0.117978
KAR4_________1008_residue       0.3931  0.2328  0.4412  0.2512  0.206   -0.011  0.413   50.47   0.354   0.383   322   335     -0.554030       0.089552
PBN1_________1251_residue       0.4102  0.2156  0.4419  0.2210  0.196   -0.039  0.392   53.53   0.330   0.386   403   416     -0.462260       0.098558
LRE1_________1761_residue       0.4072  0.2278  0.4202  0.2250  0.189   -0.126  0.358   52.23   0.347   0.419   570   586     -0.848123       0.061433
APA1__________966_residue       0.3975  0.3156  0.4043  0.1972  0.274   0.110   0.485   42.55   0.385   0.395   309   321     -0.439252       0.093458
YCE9__________939_residue       0.4041  0.3061  0.3440  0.2244  0.263   0.012   0.437   58.49   0.410   0.433   295   312     -0.452885       0.125000
YCE8_________1392_residue       0.3850  0.2460  0.3835  0.3014  0.204   -0.012  0.407   49.11   0.396   0.370   454   463     -0.123974       0.073434
YCE7__________777_residue       0.3861  0.2277  0.4022  0.3118  0.183   -0.084  0.363   58.22   0.394   0.391   251   258     -0.201938       0.104651
YCE5_________2283_residue       0.4197  0.2705  0.3664  0.2416  0.224   -0.036  0.393   53.53   0.383   0.386   732   760     -0.225000       0.102632
YCE6__________324_residue       0.3733  0.1867  0.3810  0.3291  0.227   -0.046  0.410   61.00   0.400   0.417   100   107     -0.404673       0.074766
YCE4_________1254_residue       0.3441  0.3765  0.3099  0.2098  0.204   0.068   0.450   54.53   0.468   0.453   402   417     -0.442686       0.083933
PDI1_________1569_residue       0.3243  0.4840  0.2541  0.2493  0.334   0.181   0.532   34.31   0.556   0.474   509   522     -0.248276       0.107280
GLK1_________1503_residue       0.2775  0.3650  0.2402  0.3792  0.227   0.053   0.446   51.32   0.581   0.497   484   500     -0.220000       0.068000

还有一个blk文件

$ head -20 kkblk
Phe UUU   27 1.38 Ser UCU    4 0.71 Tyr UAU    6 1.00 Cys UGU    4 1.14
    UUC   12 0.62     UCC    8 1.41     UAC    6 1.00     UGC    3 0.86
Leu UUA   12 1.24     UCA    7 1.24 TER UAA    0 0.00 TER UGA    0 0.00
    UUG    9 0.93     UCG    4 0.71     UAG    1 3.00 Trp UGG    5 1.00

    CUU   19 1.97 Pro CCU    5 1.43 His CAU    3 1.00 Arg CGU    3 1.50
    CUC    7 0.72     CCC    0 0.00     CAC    3 1.00     CGC    0 0.00
    CUA    9 0.93     CCA    7 2.00 Gln CAA   11 1.69     CGA    1 0.50
    CUG    2 0.21     CCG    2 0.57     CAG    2 0.31     CGG    0 0.00

Ile AUU   19 1.33 Thr ACU    5 0.71 Asn AAU   12 1.20 Ser AGU    8 1.41
    AUC   10 0.70     ACC    8 1.14     AAC    8 0.80     AGC    3 0.53
    AUA   14 0.98     ACA   10 1.43 Lys AAA   13 1.08 Arg AGA    5 2.50
Met AUG   14 1.00     ACG    5 0.71     AAG   11 0.92     AGG    3 1.50

Val GUU   16 2.00 Ala GCU   10 1.33 Asp GAU    8 1.07 Gly GGU   21 2.00
    GUC    5 0.62     GCC    9 1.20     GAC    7 0.93     GGC    3 0.29
    GUA    7 0.88     GCA    9 1.20 Glu GAA    7 1.40     GGA   10 0.95
    GUG    4 0.50     GCG    2 0.27     GAG    3 0.60     GGG    8 0.76

更加详细的内容可以查看codonW作者的毕业论文


最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,922评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,591评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,546评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,467评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,553评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,580评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,588评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,334评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,780评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,092评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,270评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,925评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,573评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,194评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,437评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,154评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,127评论 2 352

推荐阅读更多精彩内容