CDD注释[Ubuntu系统]

2023-12-14 16:08
文章标签 系统 ubuntu 注释 cdd

本文主要是介绍CDD注释[Ubuntu系统],希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

使用网页工具:

CD-search:http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi

使用RPS-BLAST将protein序列或者nucleotide序列比对到CDD数据库的PSSMs,得到注释结果。此工具一次只能搜索到一条序列。


结果如下:

#Batch CD-search tool	NIH/NLM/NCBI
#cdsid	QM3-qcdsearch-6A273CE59470C7A-27758A4251131776
#datatype	hitsConcise Results
#status	0
#Start time	2016-06-03T14:59:15	Run time	0:00:00:12
#status	successQuery	                     Hit type	PSSM-ID	From	To	E-Value	Bitscore	Accession	Short name	Incomplete	Superfamily
Q#1 - >At1g01220_1	specific	249743	819	877	2.51156e-10	56.0224	pfam00288	GHMP_kinases_N	 - 	cl21671
Q#1 - >At1g01220_1	superfamily	272091	819	877	2.51156e-10	56.0224	cl21671	GHMP_kinases_N superfamily	 - 	 - 
Q#1 - >At1g01220_1	specific	254869	962	1043	2.94031e-07	47.8594	pfam08544	GHMP_kinases_C	 - 	cl08484
Q#1 - >At1g01220_1	superfamily	254869	962	1043	2.94031e-07	47.8594	cl08484	GHMP_kinases_C superfamily	 - 	 - 
Q#1 - >At1g01220_1	multi-dom	254543	131	531	0	563.303	pfam07959	Fucokinase	 - 	 - 
Q#1 - >At1g01220_1	multi-dom	225325	718	1048	5.17247e-41	152.917	COG2605	COG2605	 - 	 - 
Q#2 - >At1g01220_2	superfamily	252914	1	82	8.30867e-23	87.0152	cl04867	LRAT superfamily	N	 - 
Q#3 - >At1g01350_1	specific	238093	277	318	2.90528e-09	50.9072	cd00162	RING	 - 	cl17238
Q#3 - >At1g01350_1	superfamily	276201	277	318	2.90528e-09	50.9072	cl17238	RING superfamily	 - 	 - 
Q#3 - >At1g01350_1	specific	250023	201	227	4.96868e-07	44.0832	pfam00642	zf-CCCH	 - 	cl11592
Q#3 - >At1g01350_1	superfamily	264437	201	227	4.96868e-07	44.0832	cl11592	zf-CCCH superfamily	 - 	 - 
Q#4 - >At1g01350_2	specific	199896	2	147	8.00992e-62	188.701	cd10910	limkain_b1_N_like	 - 	cl10034
Q#4 - >At1g01350_2	superfamily	275915	2	147	8.00992e-62	188.701	cl10034	LabA_like/DUF88 superfamily	 - 	 - 

-----------------------------------------------------------------------昏割线-------------------------------------------------------------------------------------------------------------

Batch CD-Search

http://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi

那能一次性比对多条protein序列(多达100,00条每次)

同时提供网页工具和脚本接口。

比对完毕后,可以下载注释结果。

序列:

>At1g01220_1
MSKQRKKADLATVLRKSWYHLRLSVRHPTRVPTWDAIVLTAASPEQAELYDWQLRRAKRMGRIASSTVTL
AVPDPDGKRIGSGAATLNAIYALARHYEKLGFDLGPEMEVANGACKWVRFISAKHVLMLHAGGDSKRVPW
ANPMGKVFLPLPYLAADDPDGPVPLLFDHILAIASCARQAFQDQGGLFIMTGDVLPCFDAFKMTLPEDAA
SIVTVPITLDIASNHGVIVTSKSESLAESYTVSLVNDLLQKPTVEDLVKKDAILHDGRTLLDTGIISARG
RAWSDLVALGCSCQPMILELIGSKKEMSLYEDLVAAWVPSRHDWLRTRPLGELLVNSLGRQKMYSYCTYD
LQFLHFGTSSEVLDHLSGDASGIVGRRHLCSIPATTVSDIAASSVILSSEIAPGVSIGEDSLIYDSTVSG
AVQIGSQSIVVGIHIPSEDLGTPESFRFMLPDRHCLWEVPLVGHKGRVIVYCGLHDNPKNSIHKDGTFCG
KPLEKVLFDLGIEESDLWSSYVAQDRCLWNAKLFPILTYSEMLKLASWLMGLDDSRNKEKIKLWRSSQRV
SLEELHGSINFPEMCNGSSNHQADLAGGIAKACMNYGMLGRNLSQLCHEILQKESLGLEICKNFLDQCPK
FQEQNSKILPKSRAYQVEVDLLRACGDEAKAIELEHKVWGAVAEETASAVRYGFREHLLESSGKSHSENH
ISHPDRVFQPRRTKVELPVRVDFVGGWSDTPPWSLERAGYVLNMAITLEGSLPIGTIIETTNQMGISIQD
DAGNELHIEDPISIKTPFEVNDPFRLVKSALLVTGIVQENFVDSTGLAIKTWANVPRGSGLGTSSILAAA
VVKGLLQISNGDESNENIARLVLVLEQLMGTGGGWQDQIGGLYPGIKFTSSFPGIPMRLQVVPLLASPQL
ISELEQRLLVVFTGQVRLAHQVLHKVVTRYLQRDNLLISSIKRLTELAKSGREALMNCEVDEVGDIMSEA
WRLHQELDPYCSNEFVDKLFEFSQPYSSGFKLVGAGGGGFSLILAKDAEKAKELRQRLEEHAEFDVKVYN
WSIFQRPPSCEVTVLPLPGIKVKRPRKISTLVAFGFGDNAVKRLCNGQPDS
>At1g01220_2
GVVLSCLDCFLKNGSLYCFEYGVSPSVFLTKVRGGTCTTAQSDTTDSVIHRAMYLLQNGFGNYDIFKNNC
EDFALYCKTGLLIMDKLGVGRSGQASSIVGAPLAALLSSPFKLLIPSPIGVATVTAGMYCMSRYATDIGV
RSDVIKVSVEDLALNLDVKTIEQGEEEEEDEEEDSDTDYVR
>At1g01350_1
MSDSGEPKPSQQEEPLPQPAAQETQSQQVCTFFKKPTKSKNIRKRTIDADEEDGDSKSESSILQNLKKVA
KPDSKLYFSSGPSKSSTTTSGAPERSVFHYDSSKEIQVQNDSGATATLETETDFNQDARAIRERVLKKAD
EALKGNKKKASDEKLYKGIHGYTDHKAGFRREQTISSEKAGGSHGPLRASAHIRVSARFDYQPDICKDYK
ETGYCGYGDSCKFLHDRGDYKPGWQIEKEWEEAEKVRKRNKAMGVEDEDDEADKDSDEDENALPFACFIC
REPFVDPVVTKCKHYFCEHCALKHHTKNKKCFVCNQPTMGIFNAAHEIKKRMAEERSKAEQGLRRLWPVG
EVVPKSK
>At1g01350_2
AVTRVWWDINRCPVPADVDVRRVGPCIKRALEKLGYSGPLTITAVGILTDVPHDFLRQVHSSGIALHHVP
TVSETALSGIGWAVVKWTWYNQPPANLMLISYEHIYLTTLDMLGRIGYNTVRSILPDDPQQAASSASPST
GSFLWESLLASLPAADDMDSGAPQEDKCGEMGEPALLCEQCRFTVQGFENFSTHLKSEEHAHESQYYRNE
DDETDGDDYVRDSEDDEEE
>At1g01660_1
MAELMAMGNDVVHVAVKSDVRESRSTLLWALRNLGAKKVCILHVYQPKTASPAARKLEELEAIMYETLHD
YFDFCQQEGVNEDDIYISCIEMNDVKQGILELIHESKIKKLVMGAASDHHYSEKMFDLKSRKAKYVYQHA
PSSCEVMFMCDGHLIYTKEANLEDCMGETESEAGQSKPKLYSSASPKCSAELVSAIVAYIDTRRDRDMLE
PNASEDQSESDRNDQLYRQLKQALMEVEESKREAYEECVRRFKAENTAVEAIRSAREYEAMYNEEAKLRK
EGKEALAKQRKMVEKTKQERDDALIIILNGRKLYNEELRRRVEAEEMLGKEKEEHERTKKEIEEVRAIVQ
DGTLYNEQLRHRKEMEESMKRQEEELEKTKKEKEEACMISKNLMQLYEDEVRQRKEAEELVKRRREELEK
VKKEKEEACSVGQNFMRLYEEEARRRKGTEEELSKVAAEKDAASSVCSEILLLLQSYTRRHGTPSGFSDE
DSVTRQPP
>At1g01660_2
SYFICPISQEVMREPRVAADGFTYEAESLREWLDNGHETSPMTNLKLAHNNLVPNHALRSAIQEWLQRNS
>At1g02230_1
MMNPVGFRFRPNDEEIVDHYLRPKNLDSDTSHVDEVISTVDICSFEPWDLPSKSMIKSRDGVWYFFSVKE
MKYNRGDQQRRRTNSGFWKKTGKTMTVMRKRGNREKIGEKRVLVFKNRDGSKTDWVMHEYHATSLFPNQM
MTYTVCKVEFKGEETEISSSSTGSEIEQIHSLIPLVNSSGGSEVGESQTFSVLSLETLKYLTLVFLPFFR
GESQIDDATTPIEEEWKTWLNNDGDEQRNIMFMQDHRSDYTPLKSLTGVFSDDSSDDNDSDLISPKTNSI
GTSSTCASFASSNHQIDQTQHSPDSTVQLVSLTQEVSQGPGQVTVIREHKLGEESVKKKRASFVYRMIHR
LVKKIHQC


结果:

#Batch CD-search tool	NIH/NLM/NCBI
#cdsid	QM3-qcdsearch-1C0005B737A3865C-39D60DE8A7221C8D
#datatype	hitsConcise Results
#status	0
#Start time	2016-06-04T01:48:41	Run time	0:00:00:14
#status	successQuery	                        Hit type	PSSM-ID	From	To	E-Value	Bitscore	Accession	Short name	Incomplete	Superfamily
Q#1 - >At1g01220_1	specific	249743	819	877	2.51156e-10	56.0224	pfam00288	GHMP_kinases_N	 - 	cl21671
Q#1 - >At1g01220_1	superfamily	272091	819	877	2.51156e-10	56.0224	cl21671	GHMP_kinases_N superfamily	 - 	 - 
Q#1 - >At1g01220_1	specific	254869	962	1043	2.94031e-07	47.8594	pfam08544	GHMP_kinases_C	 - 	cl08484
Q#1 - >At1g01220_1	superfamily	254869	962	1043	2.94031e-07	47.8594	cl08484	GHMP_kinases_C superfamily	 - 	 - 
Q#1 - >At1g01220_1	multi-dom	254543	131	531	0	563.303	pfam07959	Fucokinase	 - 	 - 
Q#1 - >At1g01220_1	multi-dom	225325	718	1048	5.17247e-41	152.917	COG2605	COG2605	 - 	 - 
Q#2 - >At1g01220_2	superfamily	252914	1	82	8.30867e-23	87.0152	cl04867	LRAT superfamily	N	 - 
Q#3 - >At1g01350_1	specific	238093	277	318	2.90528e-09	50.9072	cd00162	RING	 - 	cl17238
Q#3 - >At1g01350_1	superfamily	276201	277	318	2.90528e-09	50.9072	cl17238	RING superfamily	 - 	 - 
Q#3 - >At1g01350_1	specific	250023	201	227	4.96868e-07	44.0832	pfam00642	zf-CCCH	 - 	cl11592
Q#3 - >At1g01350_1	superfamily	264437	201	227	4.96868e-07	44.0832	cl11592	zf-CCCH superfamily	 - 	 - 
Q#4 - >At1g01350_2	specific	199896	2	147	8.00992e-62	188.701	cd10910	limkain_b1_N_like	 - 	cl10034
Q#4 - >At1g01350_2	superfamily	275915	2	147	8.00992e-62	188.701	cl10034	LabA_like/DUF88 superfamily	 - 	 - 
Q#5 - >At1g01660_1	specific	238947	11	152	1.00963e-46	157.823	cd01989	STK_N	 - 	cl00292
Q#5 - >At1g01660_1	superfamily	275515	11	152	1.00963e-46	157.823	cl00292	AANH_like superfamily	 - 	 - 
Q#6 - >At1g01660_2	specific	128780	2	65	5.29778e-30	98.8465	smart00504	Ubox	 - 	cl17238
Q#6 - >At1g01660_2	superfamily	276201	2	65	5.29778e-30	98.8465	cl17238	RING superfamily	 - 	 - 
Q#7 - >At1g02230_1	specific	251251	4	133	2.83212e-63	196.656	pfam02365	NAM	 - 	cl03558
Q#7 - >At1g02230_1	superfamily	251251	4	133	2.83212e-63	196.656	cl03558	NAM superfamily	 - 	 - 

------------------------------------------------------------------------------昏割线------------------------------------------------------------------------------------------------------

domain   领域,范围


这篇关于CDD注释[Ubuntu系统]的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/493167

相关文章

JWT + 拦截器实现无状态登录系统

《JWT+拦截器实现无状态登录系统》JWT(JSONWebToken)提供了一种无状态的解决方案:用户登录后,服务器返回一个Token,后续请求携带该Token即可完成身份验证,无需服务器存储会话... 目录✅ 引言 一、JWT 是什么? 二、技术选型 三、项目结构 四、核心代码实现4.1 添加依赖(pom

Ubuntu如何升级Python版本

《Ubuntu如何升级Python版本》Ubuntu22.04Docker中,安装Python3.11后,使用update-alternatives设置为默认版本,最后用python3-V验证... 目China编程录问题描述前提环境解决方法总结问题描述Ubuntu22.04系统自带python3.10,想升级

基于Python实现自动化邮件发送系统的完整指南

《基于Python实现自动化邮件发送系统的完整指南》在现代软件开发和自动化流程中,邮件通知是一个常见且实用的功能,无论是用于发送报告、告警信息还是用户提醒,通过Python实现自动化的邮件发送功能都能... 目录一、前言:二、项目概述三、配置文件 `.env` 解析四、代码结构解析1. 导入模块2. 加载环

linux系统上安装JDK8全过程

《linux系统上安装JDK8全过程》文章介绍安装JDK的必要性及Linux下JDK8的安装步骤,包括卸载旧版本、下载解压、配置环境变量等,强调开发需JDK,运行可选JRE,现JDK已集成JRE... 目录为什么要安装jdk?1.查看linux系统是否有自带的jdk:2.下载jdk压缩包2.解压3.配置环境

Linux查询服务器系统版本号的多种方法

《Linux查询服务器系统版本号的多种方法》在Linux系统管理和维护工作中,了解当前操作系统的版本信息是最基础也是最重要的操作之一,系统版本不仅关系到软件兼容性、安全更新策略,还直接影响到故障排查和... 目录一、引言:系统版本查询的重要性二、基础命令解析:cat /etc/Centos-release详

更改linux系统的默认Python版本方式

《更改linux系统的默认Python版本方式》通过删除原Python软链接并创建指向python3.6的新链接,可切换系统默认Python版本,需注意版本冲突、环境混乱及维护问题,建议使用pyenv... 目录更改系统的默认python版本软链接软链接的特点创建软链接的命令使用场景注意事项总结更改系统的默

在Linux系统上连接GitHub的方法步骤(适用2025年)

《在Linux系统上连接GitHub的方法步骤(适用2025年)》在2025年,使用Linux系统连接GitHub的推荐方式是通过SSH(SecureShell)协议进行身份验证,这种方式不仅安全,还... 目录步骤一:检查并安装 Git步骤二:生成 SSH 密钥步骤三:将 SSH 公钥添加到 github

Linux系统中查询JDK安装目录的几种常用方法

《Linux系统中查询JDK安装目录的几种常用方法》:本文主要介绍Linux系统中查询JDK安装目录的几种常用方法,方法分别是通过update-alternatives、Java命令、环境变量及目... 目录方法 1:通过update-alternatives查询(推荐)方法 2:检查所有已安装的 JDK方

Linux系统之lvcreate命令使用解读

《Linux系统之lvcreate命令使用解读》lvcreate是LVM中创建逻辑卷的核心命令,支持线性、条带化、RAID、镜像、快照、瘦池和缓存池等多种类型,实现灵活存储资源管理,需注意空间分配、R... 目录lvcreate命令详解一、命令概述二、语法格式三、核心功能四、选项详解五、使用示例1. 创建逻

使用Python构建一个高效的日志处理系统

《使用Python构建一个高效的日志处理系统》这篇文章主要为大家详细讲解了如何使用Python开发一个专业的日志分析工具,能够自动化处理、分析和可视化各类日志文件,大幅提升运维效率,需要的可以了解下... 目录环境准备工具功能概述完整代码实现代码深度解析1. 类设计与初始化2. 日志解析核心逻辑3. 文件处