CDD注释[Ubuntu系统]

2023-12-14 16:08
文章标签 系统 ubuntu 注释 cdd

本文主要是介绍CDD注释[Ubuntu系统],希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

使用网页工具:

CD-search:http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi

使用RPS-BLAST将protein序列或者nucleotide序列比对到CDD数据库的PSSMs,得到注释结果。此工具一次只能搜索到一条序列。


结果如下:

#Batch CD-search tool	NIH/NLM/NCBI
#cdsid	QM3-qcdsearch-6A273CE59470C7A-27758A4251131776
#datatype	hitsConcise Results
#status	0
#Start time	2016-06-03T14:59:15	Run time	0:00:00:12
#status	successQuery	                     Hit type	PSSM-ID	From	To	E-Value	Bitscore	Accession	Short name	Incomplete	Superfamily
Q#1 - >At1g01220_1	specific	249743	819	877	2.51156e-10	56.0224	pfam00288	GHMP_kinases_N	 - 	cl21671
Q#1 - >At1g01220_1	superfamily	272091	819	877	2.51156e-10	56.0224	cl21671	GHMP_kinases_N superfamily	 - 	 - 
Q#1 - >At1g01220_1	specific	254869	962	1043	2.94031e-07	47.8594	pfam08544	GHMP_kinases_C	 - 	cl08484
Q#1 - >At1g01220_1	superfamily	254869	962	1043	2.94031e-07	47.8594	cl08484	GHMP_kinases_C superfamily	 - 	 - 
Q#1 - >At1g01220_1	multi-dom	254543	131	531	0	563.303	pfam07959	Fucokinase	 - 	 - 
Q#1 - >At1g01220_1	multi-dom	225325	718	1048	5.17247e-41	152.917	COG2605	COG2605	 - 	 - 
Q#2 - >At1g01220_2	superfamily	252914	1	82	8.30867e-23	87.0152	cl04867	LRAT superfamily	N	 - 
Q#3 - >At1g01350_1	specific	238093	277	318	2.90528e-09	50.9072	cd00162	RING	 - 	cl17238
Q#3 - >At1g01350_1	superfamily	276201	277	318	2.90528e-09	50.9072	cl17238	RING superfamily	 - 	 - 
Q#3 - >At1g01350_1	specific	250023	201	227	4.96868e-07	44.0832	pfam00642	zf-CCCH	 - 	cl11592
Q#3 - >At1g01350_1	superfamily	264437	201	227	4.96868e-07	44.0832	cl11592	zf-CCCH superfamily	 - 	 - 
Q#4 - >At1g01350_2	specific	199896	2	147	8.00992e-62	188.701	cd10910	limkain_b1_N_like	 - 	cl10034
Q#4 - >At1g01350_2	superfamily	275915	2	147	8.00992e-62	188.701	cl10034	LabA_like/DUF88 superfamily	 - 	 - 

-----------------------------------------------------------------------昏割线-------------------------------------------------------------------------------------------------------------

Batch CD-Search

http://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi

那能一次性比对多条protein序列(多达100,00条每次)

同时提供网页工具和脚本接口。

比对完毕后,可以下载注释结果。

序列:

>At1g01220_1
MSKQRKKADLATVLRKSWYHLRLSVRHPTRVPTWDAIVLTAASPEQAELYDWQLRRAKRMGRIASSTVTL
AVPDPDGKRIGSGAATLNAIYALARHYEKLGFDLGPEMEVANGACKWVRFISAKHVLMLHAGGDSKRVPW
ANPMGKVFLPLPYLAADDPDGPVPLLFDHILAIASCARQAFQDQGGLFIMTGDVLPCFDAFKMTLPEDAA
SIVTVPITLDIASNHGVIVTSKSESLAESYTVSLVNDLLQKPTVEDLVKKDAILHDGRTLLDTGIISARG
RAWSDLVALGCSCQPMILELIGSKKEMSLYEDLVAAWVPSRHDWLRTRPLGELLVNSLGRQKMYSYCTYD
LQFLHFGTSSEVLDHLSGDASGIVGRRHLCSIPATTVSDIAASSVILSSEIAPGVSIGEDSLIYDSTVSG
AVQIGSQSIVVGIHIPSEDLGTPESFRFMLPDRHCLWEVPLVGHKGRVIVYCGLHDNPKNSIHKDGTFCG
KPLEKVLFDLGIEESDLWSSYVAQDRCLWNAKLFPILTYSEMLKLASWLMGLDDSRNKEKIKLWRSSQRV
SLEELHGSINFPEMCNGSSNHQADLAGGIAKACMNYGMLGRNLSQLCHEILQKESLGLEICKNFLDQCPK
FQEQNSKILPKSRAYQVEVDLLRACGDEAKAIELEHKVWGAVAEETASAVRYGFREHLLESSGKSHSENH
ISHPDRVFQPRRTKVELPVRVDFVGGWSDTPPWSLERAGYVLNMAITLEGSLPIGTIIETTNQMGISIQD
DAGNELHIEDPISIKTPFEVNDPFRLVKSALLVTGIVQENFVDSTGLAIKTWANVPRGSGLGTSSILAAA
VVKGLLQISNGDESNENIARLVLVLEQLMGTGGGWQDQIGGLYPGIKFTSSFPGIPMRLQVVPLLASPQL
ISELEQRLLVVFTGQVRLAHQVLHKVVTRYLQRDNLLISSIKRLTELAKSGREALMNCEVDEVGDIMSEA
WRLHQELDPYCSNEFVDKLFEFSQPYSSGFKLVGAGGGGFSLILAKDAEKAKELRQRLEEHAEFDVKVYN
WSIFQRPPSCEVTVLPLPGIKVKRPRKISTLVAFGFGDNAVKRLCNGQPDS
>At1g01220_2
GVVLSCLDCFLKNGSLYCFEYGVSPSVFLTKVRGGTCTTAQSDTTDSVIHRAMYLLQNGFGNYDIFKNNC
EDFALYCKTGLLIMDKLGVGRSGQASSIVGAPLAALLSSPFKLLIPSPIGVATVTAGMYCMSRYATDIGV
RSDVIKVSVEDLALNLDVKTIEQGEEEEEDEEEDSDTDYVR
>At1g01350_1
MSDSGEPKPSQQEEPLPQPAAQETQSQQVCTFFKKPTKSKNIRKRTIDADEEDGDSKSESSILQNLKKVA
KPDSKLYFSSGPSKSSTTTSGAPERSVFHYDSSKEIQVQNDSGATATLETETDFNQDARAIRERVLKKAD
EALKGNKKKASDEKLYKGIHGYTDHKAGFRREQTISSEKAGGSHGPLRASAHIRVSARFDYQPDICKDYK
ETGYCGYGDSCKFLHDRGDYKPGWQIEKEWEEAEKVRKRNKAMGVEDEDDEADKDSDEDENALPFACFIC
REPFVDPVVTKCKHYFCEHCALKHHTKNKKCFVCNQPTMGIFNAAHEIKKRMAEERSKAEQGLRRLWPVG
EVVPKSK
>At1g01350_2
AVTRVWWDINRCPVPADVDVRRVGPCIKRALEKLGYSGPLTITAVGILTDVPHDFLRQVHSSGIALHHVP
TVSETALSGIGWAVVKWTWYNQPPANLMLISYEHIYLTTLDMLGRIGYNTVRSILPDDPQQAASSASPST
GSFLWESLLASLPAADDMDSGAPQEDKCGEMGEPALLCEQCRFTVQGFENFSTHLKSEEHAHESQYYRNE
DDETDGDDYVRDSEDDEEE
>At1g01660_1
MAELMAMGNDVVHVAVKSDVRESRSTLLWALRNLGAKKVCILHVYQPKTASPAARKLEELEAIMYETLHD
YFDFCQQEGVNEDDIYISCIEMNDVKQGILELIHESKIKKLVMGAASDHHYSEKMFDLKSRKAKYVYQHA
PSSCEVMFMCDGHLIYTKEANLEDCMGETESEAGQSKPKLYSSASPKCSAELVSAIVAYIDTRRDRDMLE
PNASEDQSESDRNDQLYRQLKQALMEVEESKREAYEECVRRFKAENTAVEAIRSAREYEAMYNEEAKLRK
EGKEALAKQRKMVEKTKQERDDALIIILNGRKLYNEELRRRVEAEEMLGKEKEEHERTKKEIEEVRAIVQ
DGTLYNEQLRHRKEMEESMKRQEEELEKTKKEKEEACMISKNLMQLYEDEVRQRKEAEELVKRRREELEK
VKKEKEEACSVGQNFMRLYEEEARRRKGTEEELSKVAAEKDAASSVCSEILLLLQSYTRRHGTPSGFSDE
DSVTRQPP
>At1g01660_2
SYFICPISQEVMREPRVAADGFTYEAESLREWLDNGHETSPMTNLKLAHNNLVPNHALRSAIQEWLQRNS
>At1g02230_1
MMNPVGFRFRPNDEEIVDHYLRPKNLDSDTSHVDEVISTVDICSFEPWDLPSKSMIKSRDGVWYFFSVKE
MKYNRGDQQRRRTNSGFWKKTGKTMTVMRKRGNREKIGEKRVLVFKNRDGSKTDWVMHEYHATSLFPNQM
MTYTVCKVEFKGEETEISSSSTGSEIEQIHSLIPLVNSSGGSEVGESQTFSVLSLETLKYLTLVFLPFFR
GESQIDDATTPIEEEWKTWLNNDGDEQRNIMFMQDHRSDYTPLKSLTGVFSDDSSDDNDSDLISPKTNSI
GTSSTCASFASSNHQIDQTQHSPDSTVQLVSLTQEVSQGPGQVTVIREHKLGEESVKKKRASFVYRMIHR
LVKKIHQC


结果:

#Batch CD-search tool	NIH/NLM/NCBI
#cdsid	QM3-qcdsearch-1C0005B737A3865C-39D60DE8A7221C8D
#datatype	hitsConcise Results
#status	0
#Start time	2016-06-04T01:48:41	Run time	0:00:00:14
#status	successQuery	                        Hit type	PSSM-ID	From	To	E-Value	Bitscore	Accession	Short name	Incomplete	Superfamily
Q#1 - >At1g01220_1	specific	249743	819	877	2.51156e-10	56.0224	pfam00288	GHMP_kinases_N	 - 	cl21671
Q#1 - >At1g01220_1	superfamily	272091	819	877	2.51156e-10	56.0224	cl21671	GHMP_kinases_N superfamily	 - 	 - 
Q#1 - >At1g01220_1	specific	254869	962	1043	2.94031e-07	47.8594	pfam08544	GHMP_kinases_C	 - 	cl08484
Q#1 - >At1g01220_1	superfamily	254869	962	1043	2.94031e-07	47.8594	cl08484	GHMP_kinases_C superfamily	 - 	 - 
Q#1 - >At1g01220_1	multi-dom	254543	131	531	0	563.303	pfam07959	Fucokinase	 - 	 - 
Q#1 - >At1g01220_1	multi-dom	225325	718	1048	5.17247e-41	152.917	COG2605	COG2605	 - 	 - 
Q#2 - >At1g01220_2	superfamily	252914	1	82	8.30867e-23	87.0152	cl04867	LRAT superfamily	N	 - 
Q#3 - >At1g01350_1	specific	238093	277	318	2.90528e-09	50.9072	cd00162	RING	 - 	cl17238
Q#3 - >At1g01350_1	superfamily	276201	277	318	2.90528e-09	50.9072	cl17238	RING superfamily	 - 	 - 
Q#3 - >At1g01350_1	specific	250023	201	227	4.96868e-07	44.0832	pfam00642	zf-CCCH	 - 	cl11592
Q#3 - >At1g01350_1	superfamily	264437	201	227	4.96868e-07	44.0832	cl11592	zf-CCCH superfamily	 - 	 - 
Q#4 - >At1g01350_2	specific	199896	2	147	8.00992e-62	188.701	cd10910	limkain_b1_N_like	 - 	cl10034
Q#4 - >At1g01350_2	superfamily	275915	2	147	8.00992e-62	188.701	cl10034	LabA_like/DUF88 superfamily	 - 	 - 
Q#5 - >At1g01660_1	specific	238947	11	152	1.00963e-46	157.823	cd01989	STK_N	 - 	cl00292
Q#5 - >At1g01660_1	superfamily	275515	11	152	1.00963e-46	157.823	cl00292	AANH_like superfamily	 - 	 - 
Q#6 - >At1g01660_2	specific	128780	2	65	5.29778e-30	98.8465	smart00504	Ubox	 - 	cl17238
Q#6 - >At1g01660_2	superfamily	276201	2	65	5.29778e-30	98.8465	cl17238	RING superfamily	 - 	 - 
Q#7 - >At1g02230_1	specific	251251	4	133	2.83212e-63	196.656	pfam02365	NAM	 - 	cl03558
Q#7 - >At1g02230_1	superfamily	251251	4	133	2.83212e-63	196.656	cl03558	NAM superfamily	 - 	 - 

------------------------------------------------------------------------------昏割线------------------------------------------------------------------------------------------------------

domain   领域,范围


这篇关于CDD注释[Ubuntu系统]的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/493167

相关文章

Windows 系统下 Nginx 的配置步骤详解

《Windows系统下Nginx的配置步骤详解》Nginx是一款功能强大的软件,在互联网领域有广泛应用,简单来说,它就像一个聪明的交通指挥员,能让网站运行得更高效、更稳定,:本文主要介绍W... 目录一、为什么要用 Nginx二、Windows 系统下 Nginx 的配置步骤1. 下载 Nginx2. 解压

如何确定哪些软件是Mac系统自带的? Mac系统内置应用查看技巧

《如何确定哪些软件是Mac系统自带的?Mac系统内置应用查看技巧》如何确定哪些软件是Mac系统自带的?mac系统中有很多自带的应用,想要看看哪些是系统自带,该怎么查看呢?下面我们就来看看Mac系统内... 在MAC电脑上,可以使用以下方法来确定哪些软件是系统自带的:1.应用程序文件夹打开应用程序文件夹

windows系统上如何进行maven安装和配置方式

《windows系统上如何进行maven安装和配置方式》:本文主要介绍windows系统上如何进行maven安装和配置方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不... 目录1. Maven 简介2. maven的下载与安装2.1 下载 Maven2.2 Maven安装2.

使用Python实现Windows系统垃圾清理

《使用Python实现Windows系统垃圾清理》Windows自带的磁盘清理工具功能有限,无法深度清理各类垃圾文件,所以本文为大家介绍了如何使用Python+PyQt5开发一个Windows系统垃圾... 目录一、开发背景与工具概述1.1 为什么需要专业清理工具1.2 工具设计理念二、工具核心功能解析2.

Linux系统之stress-ng测压工具的使用

《Linux系统之stress-ng测压工具的使用》:本文主要介绍Linux系统之stress-ng测压工具的使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、理论1.stress工具简介与安装2.语法及参数3.具体安装二、实验1.运行8 cpu, 4 fo

CSS 样式表的四种应用方式及css注释的应用小结

《CSS样式表的四种应用方式及css注释的应用小结》:本文主要介绍了CSS样式表的四种应用方式及css注释的应用小结,本文通过实例代码给大家介绍的非常详细,详细内容请阅读本文,希望能对你有所帮助... 一、外部 css(推荐方式)定义:将 CSS 代码保存为独立的 .css 文件,通过 <link> 标签

Ubuntu上手动安装Go环境并解决“可执行文件格式错误”问题

《Ubuntu上手动安装Go环境并解决“可执行文件格式错误”问题》:本文主要介绍Ubuntu上手动安装Go环境并解决“可执行文件格式错误”问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未... 目录一、前言二、系统架构检测三、卸载旧版 Go四、下载并安装正确版本五、配置环境变量六、验证安装七、常见

ubuntu20.0.4系统中安装Anaconda的超详细图文教程

《ubuntu20.0.4系统中安装Anaconda的超详细图文教程》:本文主要介绍了在Ubuntu系统中如何下载和安装Anaconda,提供了两种方法,详细内容请阅读本文,希望能对你有所帮助... 本文介绍了在Ubuntu系统中如何下载和安装Anaconda。提供了两种方法,包括通过网页手动下载和使用wg

ubuntu如何部署Dify以及安装Docker? Dify安装部署指南

《ubuntu如何部署Dify以及安装Docker?Dify安装部署指南》Dify是一个开源的大模型应用开发平台,允许用户快速构建和部署基于大语言模型的应用,ubuntu如何部署Dify呢?详细请... Dify是个不错的开源LLM应用开发平台,提供从 Agent 构建到 AI workflow 编排、RA

ubuntu系统使用官方操作命令升级Dify指南

《ubuntu系统使用官方操作命令升级Dify指南》Dify支持自动化执行、日志记录和结果管理,适用于数据处理、模型训练和部署等场景,今天我们就来看看ubuntu系统中使用官方操作命令升级Dify的方... Dify 是一个基于 docker 的工作流管理工具,旨在简化机器学习和数据科学领域的多步骤工作流。