生物信息之多序列比对,进化树分析,保守位点分析

2024-06-02 23:18

本文主要是介绍生物信息之多序列比对,进化树分析,保守位点分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 一、序列下载与整理
      • 下载fasta格式序列
      • 合并多个fasta文件
  • 二、多序列比对
      • 软件下载安装
      • 序列比对
  • 三、进化树分析
  • 四、保守位点分析

一、序列下载与整理


下载fasta格式序列

0、输入网址:https://www.ncbi.nlm.nih.gov/gene

1、输入你想查找的序列,比如Syp基因 可以点击图片来查看高清图

这里写图片描述

2、进入基因详细信息页面
这里写图片描述

3、点击Genbank
这里写图片描述

4、如图所示可以下载到fasta格式的序列,注意这里下载的是基因或者蛋白质的全序列

如果你有一定的Python编程基础,可以查看这篇文章来批量下载大量基因序列:生物信息中的Python 04 | 批量下载基因与文献

这里写图片描述

当然,你也可以直接用CDS,各种基因元件来做进化树。

如果你有编程基础,可以参考这篇从 Genbank 文件中提取 CDS 等其他特征序列 来提取基因特征序列。

这里提供一种提取基因启动子区域的方法

  • 假如你希望得到promoter的基因,可以在如图所示的位置输入起始位点和终止位点
  • 一般promoter的位点不确定,可以通过将起始位点左右2kb基因视为promoter
  • 比如:如图起始位点为7638580,那么起始位点要减500,终止位点加1499,这时需要在from输入7638080,to输入7640079(得到长度为2kb的序列)
  • 点击Update view 按钮
  • 然后和同上一步下载fasta序列
    这里写图片描述

合并多个fasta文件

1、下载多个序列后,我们将下载的序列整理到特定文件夹下,比如D:\Download\fasta_files,就像这样:
mark

2、你的fasta_files文件夹里应该是这样的
这里写图片描述

3、返回D:\Download路径下,在文件夹空白地方Shift+右键,点击在此处打开命令窗口
这里写图片描述

4、输入
type fasta_files\*.fasta > all_sequence.fasta
mark

5、现在,在你的文件夹下应该类似这样的:
mark

6、得到整合文件 all_sequence.fasta(这个文件也可以通过记事本打开,下面软件为UE)
这里写图片描述

二、多序列比对


软件下载安装

Clustalw 下载链接:http://www.clustal.org/download/current/clustalw-2.1-win.msi

Clustalx 下载链接:http://www.clustal.org/download/current/clustalx-2.1-win.msi

MEGA 下载链接:http://www.megasoftware.net/releases/MEGA7.0.26_win64_setup.exe

序列比对

1、打开MEGA,进入序列比对分析
这里写图片描述

2、载入fasta序列
这里写图片描述

3、使用Clustalw 比对序列,参数默认点OK
这里写图片描述

4、跑出来的结果需要编辑第一列只留下物种名,序列去掉5’,3’端的空序列(因为要比对序列同源性,最好把显示 - 的序列去掉,使多序列的两端整齐,类似矩阵)
mark

5、导出fasta格式和MEGA格式两种格式
这里写图片描述

6、打开Clustalx 加载刚刚比对完的fasta格式(注意是比对完的,文件后缀名为.fas)
这里写图片描述

7、导出可视化文件,参数默认点OK
这里写图片描述

8、得到可视化的多序列比对结果,打开类似这样(打开用到的软件为Adobe Acrobat)
这里写图片描述

三、进化树分析


1、打开MEGA,载入meg文件
这里写图片描述

2、参数设置(这里是核酸序列)
这里写图片描述

3、得到进化树
这里写图片描述

这里写图片描述

4、导出与美化
这里写图片描述

美化参考:http://www.sohu.com/a/130616941_278730

四、保守位点分析


1、输入网址

MEME : http://meme-suite.org/tools/meme

2、上传fasta序列(这里的序列是整合后的文件,文件后缀.fasta),并输入参数(这里设置motif为10)
这里写图片描述

3、得到保守位点分析结果
这里写图片描述

这篇关于生物信息之多序列比对,进化树分析,保守位点分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1025367

相关文章

MyBatis Plus 中 update_time 字段自动填充失效的原因分析及解决方案(最新整理)

《MyBatisPlus中update_time字段自动填充失效的原因分析及解决方案(最新整理)》在使用MyBatisPlus时,通常我们会在数据库表中设置create_time和update... 目录前言一、问题现象二、原因分析三、总结:常见原因与解决方法对照表四、推荐写法前言在使用 MyBATis

Python主动抛出异常的各种用法和场景分析

《Python主动抛出异常的各种用法和场景分析》在Python中,我们不仅可以捕获和处理异常,还可以主动抛出异常,也就是以类的方式自定义错误的类型和提示信息,这在编程中非常有用,下面我将详细解释主动抛... 目录一、为什么要主动抛出异常?二、基本语法:raise关键字基本示例三、raise的多种用法1. 抛

github打不开的问题分析及解决

《github打不开的问题分析及解决》:本文主要介绍github打不开的问题分析及解决,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、找到github.com域名解析的ip地址二、找到github.global.ssl.fastly.net网址解析的ip地址三

Mysql的主从同步/复制的原理分析

《Mysql的主从同步/复制的原理分析》:本文主要介绍Mysql的主从同步/复制的原理分析,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录为什么要主从同步?mysql主从同步架构有哪些?Mysql主从复制的原理/整体流程级联复制架构为什么好?Mysql主从复制注意

java -jar命令运行 jar包时运行外部依赖jar包的场景分析

《java-jar命令运行jar包时运行外部依赖jar包的场景分析》:本文主要介绍java-jar命令运行jar包时运行外部依赖jar包的场景分析,本文给大家介绍的非常详细,对大家的学习或工作... 目录Java -jar命令运行 jar包时如何运行外部依赖jar包场景:解决:方法一、启动参数添加: -Xb

Apache 高级配置实战之从连接保持到日志分析的完整指南

《Apache高级配置实战之从连接保持到日志分析的完整指南》本文带你从连接保持优化开始,一路走到访问控制和日志管理,最后用AWStats来分析网站数据,对Apache配置日志分析相关知识感兴趣的朋友... 目录Apache 高级配置实战:从连接保持到日志分析的完整指南前言 一、Apache 连接保持 - 性

Linux查看系统盘和SSD盘的容量、型号及挂载信息的方法

《Linux查看系统盘和SSD盘的容量、型号及挂载信息的方法》在Linux系统中,管理磁盘设备和分区是日常运维工作的重要部分,而lsblk命令是一个强大的工具,它用于列出系统中的块设备(blockde... 目录1. 查看所有磁盘的物理信息方法 1:使用 lsblk(推荐)方法 2:使用 fdisk -l(

Linux中的more 和 less区别对比分析

《Linux中的more和less区别对比分析》在Linux/Unix系统中,more和less都是用于分页查看文本文件的命令,但less是more的增强版,功能更强大,:本文主要介绍Linu... 目录1. 基础功能对比2. 常用操作对比less 的操作3. 实际使用示例4. 为什么推荐 less?5.

spring-gateway filters添加自定义过滤器实现流程分析(可插拔)

《spring-gatewayfilters添加自定义过滤器实现流程分析(可插拔)》:本文主要介绍spring-gatewayfilters添加自定义过滤器实现流程分析(可插拔),本文通过实例图... 目录需求背景需求拆解设计流程及作用域逻辑处理代码逻辑需求背景公司要求,通过公司网络代理访问的请求需要做请

Java集成Onlyoffice的示例代码及场景分析

《Java集成Onlyoffice的示例代码及场景分析》:本文主要介绍Java集成Onlyoffice的示例代码及场景分析,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要... 需求场景:实现文档的在线编辑,团队协作总结:两个接口 + 前端页面 + 配置项接口1:一个接口,将o