PlantCAZyme

PlantCAZyme是基于dbCAN(用于自动碳水化合物活性酶注释的数据库)建立的数据库,目的是向植物碳水化合物和生物能源研究社区提供碳水化合物活性酶(CAZymes)的预先计算的序列和注释数据。 当前版本包含来自35个植物(包括被子植物,裸子植物,lycophyte和苔藓植物苔藓)和具有完全测序的基因组的绿藻藻的159个蛋白家族的43 790个CAZymes数据。 数据库的有用特征包括:(i)BLAST服务器和HMMER服务器,其允许用户针对我们的预先计算的序列数据搜索以用于注释目的,(ii)下载页面,以允许批量下载特定CAZyme家族的数据或 物种和(iii)蛋白质浏览页面,以提供容易获得最全面的序列和注释数据。

介绍
Lignocellulosic biofuels have received great attentions in the past decade for obvious economic and environmental reasons [1]. Other than using starch-based plant materials as the feedstock, lignocellulosic biofuels use inedible plant biomass materials, which however are very recalcitrant to be degraded to release fermentable sugars. The bioenergy research community thus has major interests in genetically modifying plants in order to develop low-cost biofuels [2]. To achieve this goal, researchers need to know which genes should be modified to acquire the desired plants with lower recalcitrance to enzymatic degradation. Therefore biomass-related enzyme databases are highly needed to promote the development of transgenic biofuel crops [3]. Carbohydrate-Active enzymes (CAZymes) are enzymes responsible for the synthesis, degradation and modification of storage and structural biomass polysaccharides [4] and thus are the most important enzymes for bioenergy research. CAZymes are not only found in plants and bacteria, but also in fungi and animals, responsible for the synthesis, degradation and modification of all the glycoconjugates in nature including glycoproteins and glycolipids. Therefore they are also fundamentally important for general carbohydrate and glycobiology research [4].
由于明显的经济和环境原因,木质纤维素生物燃料在过去十年中受到了极大的关注[1]。除了使用基于淀粉的植物材料作为原料之外,木质纤维素生物燃料使用不可食用的植物生物质材料,然而其非常顽固地被降解以释放可发酵的糖。因此,生物能源研究界对基因改造植物具有重大兴趣,以开发低成本生物燃料[2]。
为了实现这个目标,研究人员需要知道哪些基因应该被修饰以获得具有较低的对酶降解的顽抗性的所需植物。因此,生物质相关酶数据库是非常需要促进转基因生物燃料作物的发展[3]。碳水化合物 - 活性酶(CAZymes)是负责储存和结构生物质多糖的合成,降解和修饰的酶[4],因此是生物能源研究中最重要的酶。 CAZymes不仅在植物和细菌中发现,而且在真菌和动物中发现,负责自然界中所有糖缀合物的合成,降解和修饰,包括糖蛋白和糖脂。因此,它们对于一般的碳水化合物和糖生物学研究也是重要的[4]。
CAZymes are present in all life kingdoms and particularly abundant in plants [5]. Since 1998, the CAZyme database, known as CAZy, has started to collect experimentally (biochemically, genetically and structurally) characterized CAZyme proteins and classify them into protein families and so far has created 330 families (as of May 2013) of six classes based on sequence homology: GHs (glycoside hydrolases), GTs (glycosyltransferases), CEs (carbohydrate esterases), PLs (polysaccharide lyases), AAs (auxiliary activities) and CBMs (carbohydrate binding modules) [6]. It then populated each family by including homologs from GenBank, UniProt and PDB databases using both BLAST and protein domain/motif search strategies as well as expert manual inspection of sequence alignment [4, 7]. CAZy is an extremely useful resource for its most original classification scheme and high-quality manual curation, and thus has been widely accepted by the carbohydrate research community.
CAZymes存在于所有的生命王国,特别是丰富的植物[5]。自1998年以来,被称为CAZy的CAZyme数据库已开始收集实验(生物化学,基因和结构)特征的CAZyme蛋白质,并将它们分类为蛋白质家族,到目前为止已经创建了330个家庭(2013年5月)基于序列同源性:GHs(糖苷水解酶),GTs(糖基转移酶),CEs(碳水化合物酯酶),PLs(多糖裂解酶),AA(辅助活性)和CBMs(碳水化合物结合模块)。然后通过包括来自GenBank,UniProt和PDB数据库的同源物,使用BLAST和蛋白质结构域/基序搜索策略以及专家手动检查序列比对来填充每个家族[4,7]。 CAZy是其最原始的分类方案和高质量手工策划的非常有用的资源,因此已被碳水化合物研究界广泛接受。

由于产生数千个完成的植物和微生物基因组和宏基因组,在过去几年中出现了对自动CAZyme注释的巨大需求。但CAZy数据库不提供自动CAZyme注释。鉴于这种需求,在2012年,我们开发了一个名为dbCAN的Web服务器,允许用户提交自动CAZyme注释的新排序的基因组[8]。 Web服务器后面是330个CAZyme系列的隐藏的Markov模型(HMM);每个HMM代表从CAZy数据库的注释CAZyme蛋白序列中检索的每个家族的保守签名区域的序列比对。 dbCAN网站在出版后已经收到了许多国家的数千次访问,表明其对CAZymes研究的影响。

330 CAZyme HMM的可用性还使得可以建立用于植物CAZym的专用数据库。关于相似的资源,CAZy数据库仅覆盖超过40个测序的植物和藻类基因组中的两个(拟南芥和水稻)不包括所有测序的生物能源作物(例如杨树,柳枝稷,高粱)和进化上重要的生物体(例如苔藓,穗苔,藻类)。另外两个数据库,pDAWG [9]和Rice GT [10],仅限于少数的CAZyme家族和基因组。还有一些其他数据库,如Cell Wall Genomics数据库[11]和Cell Wall Navigator数据库[12],它们只包含极少数的CAZyme系列。因此,PlantCAZyme的发展是对植物碳水化合物和生物能源研究的工具箱的及时和高度显着的补充。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 221,135评论 6 514
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,317评论 3 397
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 167,596评论 0 360
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,481评论 1 296
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,492评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,153评论 1 309
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,737评论 3 421
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,657评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,193评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,276评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,420评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,093评论 5 349
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,783评论 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,262评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,390评论 1 271
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,787评论 3 376
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,427评论 2 359

推荐阅读更多精彩内容

  • 尽管时间只有20多年,生物工程已发展成一个庞大的体系,按照传统的说法(尽管这个传统也不过20年),生物技术主要包括...
    Lucine晔阅读 5,135评论 0 22
  • pyspark.sql模块 模块上下文 Spark SQL和DataFrames的重要类: pyspark.sql...
    mpro阅读 9,464评论 0 13
  • 原书共371页,总计34万字,拆解版大约2.8万字,你仅需要2小时就能读完整本书。 《自私的基因》作者理查德·道金...
    惜她阅读 6,150评论 1 53
  • 基于ROS的SLAM开源库学习笔记 一直听说SLAM, SLAM。 但是实际上,除了SLAM是持续定位和生成地图的...
    MrFred_4606阅读 4,165评论 0 1
  • 我有孤独和烈酒,只有你才能平复我的孤独
    孤独的浅色阅读 78评论 0 0