生物信息之多序列比对,进化树分析,保守位点分析

2024-06-02 23:18

本文主要是介绍生物信息之多序列比对,进化树分析,保守位点分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 一、序列下载与整理
      • 下载fasta格式序列
      • 合并多个fasta文件
  • 二、多序列比对
      • 软件下载安装
      • 序列比对
  • 三、进化树分析
  • 四、保守位点分析

一、序列下载与整理


下载fasta格式序列

0、输入网址:https://www.ncbi.nlm.nih.gov/gene

1、输入你想查找的序列,比如Syp基因 可以点击图片来查看高清图

这里写图片描述

2、进入基因详细信息页面
这里写图片描述

3、点击Genbank
这里写图片描述

4、如图所示可以下载到fasta格式的序列,注意这里下载的是基因或者蛋白质的全序列

如果你有一定的Python编程基础,可以查看这篇文章来批量下载大量基因序列:生物信息中的Python 04 | 批量下载基因与文献

这里写图片描述

当然,你也可以直接用CDS,各种基因元件来做进化树。

如果你有编程基础,可以参考这篇从 Genbank 文件中提取 CDS 等其他特征序列 来提取基因特征序列。

这里提供一种提取基因启动子区域的方法

  • 假如你希望得到promoter的基因,可以在如图所示的位置输入起始位点和终止位点
  • 一般promoter的位点不确定,可以通过将起始位点左右2kb基因视为promoter
  • 比如:如图起始位点为7638580,那么起始位点要减500,终止位点加1499,这时需要在from输入7638080,to输入7640079(得到长度为2kb的序列)
  • 点击Update view 按钮
  • 然后和同上一步下载fasta序列
    这里写图片描述

合并多个fasta文件

1、下载多个序列后,我们将下载的序列整理到特定文件夹下,比如D:\Download\fasta_files,就像这样:
mark

2、你的fasta_files文件夹里应该是这样的
这里写图片描述

3、返回D:\Download路径下,在文件夹空白地方Shift+右键,点击在此处打开命令窗口
这里写图片描述

4、输入
type fasta_files\*.fasta > all_sequence.fasta
mark

5、现在,在你的文件夹下应该类似这样的:
mark

6、得到整合文件 all_sequence.fasta(这个文件也可以通过记事本打开,下面软件为UE)
这里写图片描述

二、多序列比对


软件下载安装

Clustalw 下载链接:http://www.clustal.org/download/current/clustalw-2.1-win.msi

Clustalx 下载链接:http://www.clustal.org/download/current/clustalx-2.1-win.msi

MEGA 下载链接:http://www.megasoftware.net/releases/MEGA7.0.26_win64_setup.exe

序列比对

1、打开MEGA,进入序列比对分析
这里写图片描述

2、载入fasta序列
这里写图片描述

3、使用Clustalw 比对序列,参数默认点OK
这里写图片描述

4、跑出来的结果需要编辑第一列只留下物种名,序列去掉5’,3’端的空序列(因为要比对序列同源性,最好把显示 - 的序列去掉,使多序列的两端整齐,类似矩阵)
mark

5、导出fasta格式和MEGA格式两种格式
这里写图片描述

6、打开Clustalx 加载刚刚比对完的fasta格式(注意是比对完的,文件后缀名为.fas)
这里写图片描述

7、导出可视化文件,参数默认点OK
这里写图片描述

8、得到可视化的多序列比对结果,打开类似这样(打开用到的软件为Adobe Acrobat)
这里写图片描述

三、进化树分析


1、打开MEGA,载入meg文件
这里写图片描述

2、参数设置(这里是核酸序列)
这里写图片描述

3、得到进化树
这里写图片描述

这里写图片描述

4、导出与美化
这里写图片描述

美化参考:http://www.sohu.com/a/130616941_278730

四、保守位点分析


1、输入网址

MEME : http://meme-suite.org/tools/meme

2、上传fasta序列(这里的序列是整合后的文件,文件后缀.fasta),并输入参数(这里设置motif为10)
这里写图片描述

3、得到保守位点分析结果
这里写图片描述

这篇关于生物信息之多序列比对,进化树分析,保守位点分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1025367

相关文章

Java NoClassDefFoundError运行时错误分析解决

《JavaNoClassDefFoundError运行时错误分析解决》在Java开发中,NoClassDefFoundError是一种常见的运行时错误,它通常表明Java虚拟机在尝试加载一个类时未能... 目录前言一、问题分析二、报错原因三、解决思路检查类路径配置检查依赖库检查类文件调试类加载器问题四、常见

Python中的Walrus运算符分析示例详解

《Python中的Walrus运算符分析示例详解》Python中的Walrus运算符(:=)是Python3.8引入的一个新特性,允许在表达式中同时赋值和返回值,它的核心作用是减少重复计算,提升代码简... 目录1. 在循环中避免重复计算2. 在条件判断中同时赋值变量3. 在列表推导式或字典推导式中简化逻辑

Go语言开发实现查询IP信息的MCP服务器

《Go语言开发实现查询IP信息的MCP服务器》随着MCP的快速普及和广泛应用,MCP服务器也层出不穷,本文将详细介绍如何在Go语言中使用go-mcp库来开发一个查询IP信息的MCP... 目录前言mcp-ip-geo 服务器目录结构说明查询 IP 信息功能实现工具实现工具管理查询单个 IP 信息工具的实现服

使用Python从PPT文档中提取图片和图片信息(如坐标、宽度和高度等)

《使用Python从PPT文档中提取图片和图片信息(如坐标、宽度和高度等)》PPT是一种高效的信息展示工具,广泛应用于教育、商务和设计等多个领域,PPT文档中常常包含丰富的图片内容,这些图片不仅提升了... 目录一、引言二、环境与工具三、python 提取PPT背景图片3.1 提取幻灯片背景图片3.2 提取

Java程序进程起来了但是不打印日志的原因分析

《Java程序进程起来了但是不打印日志的原因分析》:本文主要介绍Java程序进程起来了但是不打印日志的原因分析,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Java程序进程起来了但是不打印日志的原因1、日志配置问题2、日志文件权限问题3、日志文件路径问题4、程序

Linux下如何使用C++获取硬件信息

《Linux下如何使用C++获取硬件信息》这篇文章主要为大家详细介绍了如何使用C++实现获取CPU,主板,磁盘,BIOS信息等硬件信息,文中的示例代码讲解详细,感兴趣的小伙伴可以了解下... 目录方法获取CPU信息:读取"/proc/cpuinfo"文件获取磁盘信息:读取"/proc/diskstats"文

Java字符串操作技巧之语法、示例与应用场景分析

《Java字符串操作技巧之语法、示例与应用场景分析》在Java算法题和日常开发中,字符串处理是必备的核心技能,本文全面梳理Java中字符串的常用操作语法,结合代码示例、应用场景和避坑指南,可快速掌握字... 目录引言1. 基础操作1.1 创建字符串1.2 获取长度1.3 访问字符2. 字符串处理2.1 子字

Python 迭代器和生成器概念及场景分析

《Python迭代器和生成器概念及场景分析》yield是Python中实现惰性计算和协程的核心工具,结合send()、throw()、close()等方法,能够构建高效、灵活的数据流和控制流模型,这... 目录迭代器的介绍自定义迭代器省略的迭代器生产器的介绍yield的普通用法yield的高级用法yidle

C++ Sort函数使用场景分析

《C++Sort函数使用场景分析》sort函数是algorithm库下的一个函数,sort函数是不稳定的,即大小相同的元素在排序后相对顺序可能发生改变,如果某些场景需要保持相同元素间的相对顺序,可使... 目录C++ Sort函数详解一、sort函数调用的两种方式二、sort函数使用场景三、sort函数排序

kotlin中const 和val的区别及使用场景分析

《kotlin中const和val的区别及使用场景分析》在Kotlin中,const和val都是用来声明常量的,但它们的使用场景和功能有所不同,下面给大家介绍kotlin中const和val的区别,... 目录kotlin中const 和val的区别1. val:2. const:二 代码示例1 Java