MaxQuant的安装和使用(linux OR windows)

2024-01-28 04:20

本文主要是介绍MaxQuant的安装和使用(linux OR windows),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

  • 1. 安装
  • 2. 用法
    • 2.1 命令行方式(linux)
    • 2.2 GUI方式(windows)
      • Andromeda配置/Configuration(2)
      • 数据上传/Raw files (14)
      • 组特异参数/Group-specific parameters(17)
      • 全局参数/Global parameters (36)
      • Performance(82)
      • ==处理器数量(80)==
  • 3. Troubleshooting
  • 参考

MaxQuant 是一款定量蛋白质组学软件包,支持多种标记定量和无标定量的质谱数据。

1. 安装

MaxQuant下载方式:

  • 通过官网 下载,包括andromeda(搜索引擎)+viewer(检查原始数据、鉴定和定量结果)。
  • 通过conda下载,详见下面代码。(linux安装时推荐使用该方法)
conda create -n maxquant
conda activate maxquant
conda install -c bioconda maxquantmaxquant --help    # 查看命令行参数#maxquant mqpar.xml#报错如下:.NET Core 3.1 needs to be installed. Please visit https://dotnet.microsoft.com/download/dotnet-core/3.1 and install the SDK x64.#mkdir -p dotnet; cd dotnet#wget ...#tar xzvf dotnet-sdk-3.1.426-linux-x64.tar.gz#export DOTNET_ROOT=/path/software/dotnet#export PATH=$PATH:/path/software/dotnet

此外,官网还提供了Perseus软件,用于对MaxQuant输出进行统计分析。

2. 用法

2.1 命令行方式(linux)

通过以下任一方法生成配置文件。其中方法1需要人工修改较多地方,方法2仅需修改文件位置,更加方便,但需要注意使用相同版本GUI来产生配置文件。

# 方法1. 生成配置文件mqpar.xml
maxquant --create mqpar.xml
#maxquant mqpar.xml --changeFolder=mqpar_new.xml /fasta /raw
vi mqpar.xml# 方法2. 相同版本GUI保存参数文件,传输到linux

基于配置文件运行软件。

maxquant mqpar.xml

2.2 GUI方式(windows)

双击MaxQuant.exe,打开以下界面。红框为参数配置模块。其中大部分参数通常并不需要改变,一般使用官方protocol中提供的minimal workflow就可以,见下文高亮部分。 另外,官方protocol中一些参数随着版本更新其位置已经发生改变或者被移除,此类参数会以删除线标识。
在这里插入图片描述

Andromeda配置/Configuration(2)

  • Modifications(3-10):修饰的增、改。
  • Proteases(11)
  • Sequence databases(12-13)v2.0.3.0中没有发现该参数。

数据上传/Raw files (14)

  • Load data(15):通过以下任一方法导入原始数据,如.raw等。
    • Load:导入原始数据。
    • Load folder: 导入选中文件夹中所有原始数据。
  • Experimental design(16):通过以下任一方法设置元数据。
    • Set*:选中行后,①通过Set experiment设置实验(分组/样本),相同实验的数据后续会被合并;②通过Set paramter group设置参数组,不同参数组可以应用不同的参数设置,具体设置见(17);③通过Set fraction设置fraction;
    • Write*:当数据项较多时,可以通过Write template导出包含数据的模板文件,然后在直接编辑模板文件,最后将编辑好的模板文件通过Read from file导入软件。
      在这里插入图片描述

组特异参数/Group-specific parameters(17)

  • Type(19)
    • Type(19):指定LC-MS run的类型。①label-free和MS1-labeled样本选择Standard;②传统的同位素标记标记样本选择Reporter ion MS2;③同位素标记的MS3质谱选择Reporter ion MS3
    • Multiplicity(19):指定MS1标签数。如果没有使用标签,设置为1。下方复选框选择使用的标签。
      在这里插入图片描述
  • Digestion(20)
    • Digestion mode(21):
    • Enzyme(22):因为准确的裂解特异性等优点,胰蛋白酶在多数自下而上的蛋白质组学实验中都被用作蛋白酶。因此Enzyme默认值为Trypsin/P。胰蛋白酶能裂解精氨酸和赖氨酸C末端的肽段,除非其后有脯氨酸。MaxQuant使用该规则对蛋白质数据库进行in silico裂解。
    • Max. missed cleavages(23):蛋白酶消化并不总是完全的,通过将参数设为2,in silico裂解的序列中也包括含有额外精氨酸或赖氨酸的肽段。
      在这里插入图片描述
  • Modifications(24):根据in silico生成的多肽数据库计算出多肽的质量,并与测量的质量相匹配,从而对其进行识别。肽的质量会因肽的修饰而改变,例如在不同定量策略中应用的化学标记或生物学翻译后修饰。因此,在in silico生成的肽质量列表中还必须包括可能的肽修饰。
    • Variable modifications(25)Variable modifications是指并非每个氨基酸都会发生的修饰,如蛋氨酸氧化(Oxidation (M))可能只发生在某些蛋氨酸上。再比如,只有少数肽的 N 端会发生乙酰化(Acetyl (Prorein N-term))。需要注意的是可变修饰会增加in silico肽数据库的容量,进而增加分析时间。
    • Fixed modifications(39)Fixed modifications是指特定氨基酸每次出现时都会发生的修饰。这些修饰通常是人为引入的,如蛋白质组学样品制备中防止二硫键重新形成的半胱氨酸的氨基甲酰甲基化,也是该参数的默认值Carbamidomethyl (C)
    • Max. number of modifications allowed per peptide(26);
      在这里插入图片描述
  • Label-free quantification(27):
    • Label-free quantification(27):选择是否应用LFQ算法。
      • min. ratio count(28)
      • Fast LFQ(29)
      • Skip normalization(30)
        在这里插入图片描述
  • Instrument (31)
  • First search: (32)
  • Misc.(33): Re-quantify(34); Match type(35)???

全局参数/Global parameters (36)

  • Sequences(37)
    在这里插入图片描述

    • Add(37):添加数据库。此外,还可以通过IdentifierDescription定义的正则,从fasta头提取ID和描述。
    • Include contaminants(38): 将conf/contaminants.fasta中的蛋白添加到搜索数据库。
    • Fixed modifications(39):v2.0.3.0中该参数已移动至页面(24)下,详见上文。
    • Min. peptide length & Max. peptide mass(40):设置用于蛋白鉴定和定量肽段的最短长度(典型值7-9,长度<7的肽段不是唯一的。注:甚至更长的肽段也不是唯一的,比如源于同一结构域的肽段可能被同源蛋白共有,可以通过设置min unique peptides处理该情况)和最大质量。
    • (Min|Max). peptide lengths for unspecific(41):设置非特异性搜索(即不使用消化酶)情况下的最小和最大肽段长度;
  • Identification(42)
    在这里插入图片描述
    红框中的13个参数在v2.0.3.0和v1.5.3.30中都在Identification下。

    • PSM FDR(43):PSM水平的FDR阈值,由TDA计算得出,0.01代表1% FDR。
    • Protein FDR(44):蛋白质水平的FDR阈值。
    • Site decoy fraction(45):修饰位点表水平上对饵命中进行过滤。
    • Min. peptides(46):鉴定一个蛋白质簇所需总肽段数的最小值,并在最终表格中报告。
    • Min. razor + unique peptides(46):鉴定一个蛋白质簇所需razor+unique肽段数的最小值,并在最终表格中报告。
    • Min. unique peptides(46):鉴定一个蛋白质簇所需unique肽段数的最小值,并在最终表格中报告。肽会以统计的方式组合成相应的蛋白质,因此主要应根据唯一肽进行判断。可以将参数设为1,即输出表中只报告至少有一个唯一肽的蛋白质。
    • Min. score for unmodified peptides(47):接受MS2鉴定无修饰肽的最小Andromeda分数。推荐值为0,即除FDR外,没有额外的过滤。
    • Min. score for modified peptides(47):接受MS2鉴定修饰肽的最小Andromeda分数。默认值为40。除对PSMs应用的FDR外,还需额外过滤。
    • Min. delta score for unmodified peptides(47):接受MS2鉴定无修饰肽的最小Andromeda delta分数推荐值为0,即除FDR外,没有额外的过滤。
    • Min. score for modified peptides(47):接受MS2鉴定修饰肽的最小Andromeda delta分数默认值为6。除对PSMs应用的FDR外,还需额外过滤。
    • Base FDR calculations on delta score:如果选中,所有 FDR 计算都将使用 delta 分数作为输入。delta 分数是得分最高的 PSM 与氨基酸序列不同、得分次之的 PSM 之间的分数差。
    • Dependent peptides:无偏搜索来自已鉴定肽的修饰肽。
  • Adv. Identification???(51)

  • Protein quantification(55)
    在这里插入图片描述

    • (Label)? Min. ratio count:设置蛋白定量的最小比值计数。对于定量标记肽对/三联体数量较少的蛋白质,将不报告比值。如果使用实验设计,则该标准将分别应用于每个实验。
    • Peptides for quantification:指定蛋白质比率的计算方式。All 选项将使用所有肽段进行定量。Unique 选项则只使用簇中特有肽进行定量。Unique + razor 选项通过簇中特有肽和剃刀肽计算蛋白质比率。剃刀肽(razor)是指分配给蛋白簇的非特有肽,该蛋白质簇中有最多的其他肽。
    • Use only unmodified peptides and …:指定蛋白质定量应使用哪种多肽。如果未选中,则使用所有肽段(无论其修饰状态)。如果选中,则使用所有未修饰肽段+仅在下面字段中指定修饰的肽段。
      • Modifications used in protein quantification:
      • Discard unmodified counterpart peptide:如选中,则未修饰的多肽也将被丢弃,因为鉴定的修饰多肽对应的修饰未在上述字段中指定。
    • Adavanced ratio estimation:
  • Tables(66)

  • Folder locations(67)

  • Advanced(72)
    在这里插入图片描述

    • Used for occupancies:在计算基于标签的occupancies,使用归一化还是非归一化比率。
  • Number of threads(80)

  • Start(81)

Performance(82)

处理器数量(80)

3. Troubleshooting

https://groups.google.com/g/maxquant-list

参考

Neuhauser, Nadin, et al. “High performance computational analysis of large-scale proteome data sets to assess incremental contribution to coverage of the human genome.” Journal of proteome research 12.6 (2013): 2858-2868.
2013年,作者发布了支持并行计算的版本(1.3.7.4)。

MaxQuant goes Linux
2018年,作者发布了MaxQuant的linux版本(1.6.1.0)。该版本主要依赖mono

MaxQuant Doc
官方文档链接。

【6】蛋白质组学鉴定定量软件之MaxQuant
一篇MaxQuant的中文实践。

Label-free data analysis using MaxQuant
文章介绍了如何Galaxy平台中使用MaxQuant,本文翻译了其中对参数的解释。

这篇关于MaxQuant的安装和使用(linux OR windows)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/652458

相关文章

使用Python创建一个功能完整的Windows风格计算器程序

《使用Python创建一个功能完整的Windows风格计算器程序》:本文主要介绍如何使用Python和Tkinter创建一个功能完整的Windows风格计算器程序,包括基本运算、高级科学计算(如三... 目录python实现Windows系统计算器程序(含高级功能)1. 使用Tkinter实现基础计算器2.

在.NET平台使用C#为PDF添加各种类型的表单域的方法

《在.NET平台使用C#为PDF添加各种类型的表单域的方法》在日常办公系统开发中,涉及PDF处理相关的开发时,生成可填写的PDF表单是一种常见需求,与静态PDF不同,带有**表单域的文档支持用户直接在... 目录引言使用 PdfTextBoxField 添加文本输入域使用 PdfComboBoxField

Git可视化管理工具(SourceTree)使用操作大全经典

《Git可视化管理工具(SourceTree)使用操作大全经典》本文详细介绍了SourceTree作为Git可视化管理工具的常用操作,包括连接远程仓库、添加SSH密钥、克隆仓库、设置默认项目目录、代码... 目录前言:连接Gitee or github,获取代码:在SourceTree中添加SSH密钥:Cl

Windows系统宽带限制如何解除?

《Windows系统宽带限制如何解除?》有不少用户反映电脑网速慢得情况,可能是宽带速度被限制的原因,只需解除限制即可,具体该如何操作呢?本文就跟大家一起来看看Windows系统解除网络限制的操作方法吧... 有不少用户反映电脑网速慢得情况,可能是宽带速度被限制的原因,只需解除限制即可,具体该如何操作呢?本文

Python中模块graphviz使用入门

《Python中模块graphviz使用入门》graphviz是一个用于创建和操作图形的Python库,本文主要介绍了Python中模块graphviz使用入门,具有一定的参考价值,感兴趣的可以了解一... 目录1.安装2. 基本用法2.1 输出图像格式2.2 图像style设置2.3 属性2.4 子图和聚

windows和Linux使用命令行计算文件的MD5值

《windows和Linux使用命令行计算文件的MD5值》在Windows和Linux系统中,您可以使用命令行(终端或命令提示符)来计算文件的MD5值,文章介绍了在Windows和Linux/macO... 目录在Windows上:在linux或MACOS上:总结在Windows上:可以使用certuti

CentOS和Ubuntu系统使用shell脚本创建用户和设置密码

《CentOS和Ubuntu系统使用shell脚本创建用户和设置密码》在Linux系统中,你可以使用useradd命令来创建新用户,使用echo和chpasswd命令来设置密码,本文写了一个shell... 在linux系统中,你可以使用useradd命令来创建新用户,使用echo和chpasswd命令来设

Python使用Matplotlib绘制3D曲面图详解

《Python使用Matplotlib绘制3D曲面图详解》:本文主要介绍Python使用Matplotlib绘制3D曲面图,在Python中,使用Matplotlib库绘制3D曲面图可以通过mpl... 目录准备工作绘制简单的 3D 曲面图绘制 3D 曲面图添加线框和透明度控制图形视角Matplotlib

Pandas中统计汇总可视化函数plot()的使用

《Pandas中统计汇总可视化函数plot()的使用》Pandas提供了许多强大的数据处理和分析功能,其中plot()函数就是其可视化功能的一个重要组成部分,本文主要介绍了Pandas中统计汇总可视化... 目录一、plot()函数简介二、plot()函数的基本用法三、plot()函数的参数详解四、使用pl

使用Python实现IP地址和端口状态检测与监控

《使用Python实现IP地址和端口状态检测与监控》在网络运维和服务器管理中,IP地址和端口的可用性监控是保障业务连续性的基础需求,本文将带你用Python从零打造一个高可用IP监控系统,感兴趣的小伙... 目录概述:为什么需要IP监控系统使用步骤说明1. 环境准备2. 系统部署3. 核心功能配置系统效果展