A4: 蛋白质组搜库--安装,建库,搜库,整合,分析

搜库前准备

搜库前应重装系统,清空不必要的东西,可在服务器A4, A5重装win7 PE版本(自带U深度PE装机工具);安装完后需要激活一下win7

安装,均在A4服务器的C盘
  1. apache(一个网络服务器)安装:D:\Program\Proteome\MASCOT_v2.3
    点击exe安装, 填写邮箱名可以是假的,但必须跟后面保持一致(如66@.com);登录localhost时(http://127.0.0.1/)出现 it works!为安装成功

  2. Perl x64 语言安装 (Mascot是基于Perl语言编写的)
    D:\Program\Proteome\MASCOT_v2.3
    3.Mascot x64 安装:D:\Program\Proteome\MASCOT_v2.3
    安装时,要找到安装包内的mascot.licence 的具体路径,将其粘到指定的licence 框内
    mascot.licence 的具体路径: D:\Program\Proteome\MASCOT_v2.3

为了让apache读懂Mascot,需要将/MASCOT/ 文件夹内的httpd.config文件中的全部内容,黏贴到/apache/文件夹内的httpd.config文件尾部,保存后重新打开apache,restart一下apache,再刷新Mascot网页。成功则可看见Mascot 网页的相关搜库内容。
PS: 若刷新网页失败,多半是因为apache没有被打开,或重启成功,多重启尝试则可!

4.Netframework 安装
为了可对搜库进行批量操作,需要使用Daemon,但Daemon安装前,需要安装Netframework 4.5版本,Netframework在此类似JAVA,用于解释.exe软件
存放路径:D:\Software\Drivers\Package\NetFramework
PS: 1. Netframework 4.5用于win 7电脑;若在win10 上安装Daemon,则不需要安装Netframework

  1. Daemon 安装(也称Mascot Daemon)D:\Program\Proteome\MASCOT_v2.3
    Daemon可对搜库进行批量操作。

  2. Scaffold安装 D:\Program\Proteome\Q+S
    1)重装服务器后,本机的时间需要该licence的时间,安装时将licence 粘进对应的框(sn.txt文件为licence)
    2)在【控制面板】,进入【防火墙】,高级设置,选【出站规则】,【新建规则】,选【程序】,将Scaffold文件夹下的 jre/bin/javaw.exe block掉, 选【阻止连接】,再随便重命名一下
    c:/program file/scaffold 4

MASCOT搜库

  1. peptide Mass Fingerprint 是按蛋白的KD数进行搜库;
  2. 单个Raw文件可在Ions Search进行搜库,但前提需要将raw文件的.wiz格式转为mgf格式
    3.搜库前建库:
    1)可在uniprot上下载所需的物种参考氨基酸序列:
    在Taxonmy下,选view protein,选择Swiss prot(这个参考序列属于一个基因对应一个全长protein),
    选择.fasta格式进行下载 (有时候注释时也需要将其.txt格式的文件一起下载)
    2)进入MASCOT网页,导入数据库http://a4/mascot
    在 Configuration editor进入,选database maintence, 进入建库操作面板,修改:
    (1)选上Active, AA(氨基酸),mem lock(把数据放入内存进行搜库);
    (2)将路径C:/MASCOT/sequence/Mouse/GRCm38.fa输入指定框,并修改为:C:/MASCOT/sequence/Mouse/GRCm38*.fa
    (3)只保留parse accession 和 parse description 这两项,并且parse accession选4th项,parse description 选5th项,后面的空格全清空,再点击test definition 看格式是否喜欢,最后确定正确不报错时点击Apply 使用。
    (4)然后在MASCOT网页database status(http:/a4/mascot/x-cgi/ms-status.exe)上疯狂F5刷新,观察status达到 In use(在刷新时,索引fasta文件会慢慢进入MASCOT,需要稍等)

Daemon的搜库前工作

1.先导入/IBS/文件夹已有的参数设置:D:\Program\Proteome\MASCOT_v2.3\IBS ,再保存为tmp.par,再在Task Editor导入,保存在/IBS/parameter/。
2.导入馏分,理论上每个馏分都单独进行搜库;
PS: 馏分输入下面有一个选项,[Merge MS/MS],这一项适用于多个馏分对应一个样本的情况,才可以merge

  1. 在MASCOT建库成功后,重启Daemon 可见新库已建入,run即可;
  2. 搜库完成后,结果放在:MASCOT/data/.dat,均可用Scaffold进一步整合分析,也可用高级版的MASCOT查看其他相关信息;
    PS: 1. 理论上1个mgf文件对应1个dat文件,均可在Daemon的进程列表上查询;
    2.基本上按照输入顺序搜库,序号为输出的终止时间。

Scaffold整合文件及分析

官网下载Install_Scaffold_Q+S_5.2.0_Windows_x64或4.0版本,安装后导数据。

  1. 将MASCOT/data/.dat的搜库结果,先按组别名字划分好文件夹,按组顺序分别导入,如三次重复组:A,B,C仨组(x 21个馏分)分别进入;
  2. 导入时若报错memory不足,可在【Edit】中的【Preference】中,设置【Memory】为16G(16000MB);
  3. 统计分析:进入【Quant】中【Update Experimental Design】,设置:
  1. 设【Analysis Type】为Ratio-based;
  2. 设【Experiment Type】为Between-subjects(Independent Groups);
  3. 设【Edit Sample Names and Categories】设置组数以及对应的组别颜色;
  4. 设【Organize Quant Samples】中,将每组对应的馏分拖进改组,设置【Reference】为control 组的馏分,Finish 后 Update Samples;


    3e9762b407ecb2a85d746c5b2d5bade.jpg
  1. 保存为.sf3文件,方便后续导入;
  2. 导出数据前,可设置:
    1)【hide decoys】去掉decoys;
  1. Min peptides=2 或FDR threshold=1%;
  2. Protein Threshold=99% , Peptides Threshold=95%(若蛋白过少,可放松俩阈值到90%);
    4)选择【Quant】中【Launch Q+ Quantitation Module】模块,进行需要一段时间,选择【Display Options】为Fold Change Ratio,然后右键选择【Copy All Data】,黏贴到新的Excel表格去。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容