如何向NCBI的SRA上传数据

2023-11-21 14:40
文章标签 数据 上传 ncbi sra

本文主要是介绍如何向NCBI的SRA上传数据,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

首先访问SRA的提交界面,https://submit.ncbi.nlm.nih.gov/subs/sra/,在没有登陆NCBI时,网页内容如下所示

2013053-8ae182f19b246691.png
未登录时

点击Log in, 会进入一个新的网页用于登陆或者创建新的NCBI账户。

2013053-2cfee2bff63c33f5.png
登陆NCBI

在创建完账号或者登陆之后,返回之前的SRA上传页面,界面就变成了如下。

2013053-c531c7173a558bda.png
登陆后

他提示了有三种方法可以递交:

  • Aspera浏览器插件
  • Aspera命令行和FTP上传
  • Amzon S3方式

个人比较喜欢用Aspera命令行的方式(FTP对于国内用户或许有点慢)

在Apeara命令和FPT上传选项中点击如下的蓝色小按钮

2013053-12445da8ef63f7bd.png
预上传文件夹

点击之后,页面就会发生变化,跳出每个用户专门的预上传地址,还有专门的上传说明文字。

2013053-33746b7f18a19ff3.png
上传地址

有了地址之后,下一步就是安装Aspera, 在Aspera上选择合适的版本,我装的就是Linux版本。

wget https://download.asperasoft.com/download/sw/connect/3.8.1/ibm-aspera-connect-3.8.1.161274-linux-g2.12-64.tar.gz
tar xf ibm-aspera-connect-3.8.1.161274-linux-g2.12-64.tar.gz
./ibm-aspera-connect-3.8.1.161274-linux-g2.12-64.sh

安装的内容存放在~/.aspera/connect下。所使用到的命令如下

ascp -i <path/to/key_file> -QT -l100m -k1 -d <path/to/folder/containing files> subasp@upload.ncbi.nlm.nih.gov:uploads/每个人都不同

<path/to/key_file>要点击上图中的Get the key file下载,然后上传到服务器上。
<path/to/folder/containing files> 是你需要上传的数据的本地路径。

或者你对你自己的FTP速度有足够自信的话,可以尝试用FTP上传,在FTP upload中找到地址、用户名和密码,以及要上传的目录,

2013053-0c88e7bdea212981.png
FTP upload

之后就随便找一个图形化的FTP工具上传即可,例如FileZilla

2013053-6e9ae2079d2919a9.png
FileZilla

所有数据上传之后,你可以点击页面的New submission创建一个新的上传任务。

然后就是一步一步的填写信息,将你预先上传的数据和你的项目进行关联。这里的SUBXXXX是临时的,完成上传后就自动无效,并且还可以反悔中途取消掉。

2013053-0501688340d6c14d.png
填写信息

这篇关于如何向NCBI的SRA上传数据的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/402989

相关文章

Linux下利用select实现串口数据读取过程

《Linux下利用select实现串口数据读取过程》文章介绍Linux中使用select、poll或epoll实现串口数据读取,通过I/O多路复用机制在数据到达时触发读取,避免持续轮询,示例代码展示设... 目录示例代码(使用select实现)代码解释总结在 linux 系统里,我们可以借助 select、

C#使用iText获取PDF的trailer数据的代码示例

《C#使用iText获取PDF的trailer数据的代码示例》开发程序debug的时候,看到了PDF有个trailer数据,挺有意思,于是考虑用代码把它读出来,那么就用到我们常用的iText框架了,所... 目录引言iText 核心概念C# 代码示例步骤 1: 确保已安装 iText步骤 2: C# 代码程

Pandas处理缺失数据的方式汇总

《Pandas处理缺失数据的方式汇总》许多教程中的数据与现实世界中的数据有很大不同,现实世界中的数据很少是干净且同质的,本文我们将讨论处理缺失数据的一些常规注意事项,了解Pandas如何表示缺失数据,... 目录缺失数据约定的权衡Pandas 中的缺失数据None 作为哨兵值NaN:缺失的数值数据Panda

C++中处理文本数据char与string的终极对比指南

《C++中处理文本数据char与string的终极对比指南》在C++编程中char和string是两种用于处理字符数据的类型,但它们在使用方式和功能上有显著的不同,:本文主要介绍C++中处理文本数... 目录1. 基本定义与本质2. 内存管理3. 操作与功能4. 性能特点5. 使用场景6. 相互转换核心区别

python库pydantic数据验证和设置管理库的用途

《python库pydantic数据验证和设置管理库的用途》pydantic是一个用于数据验证和设置管理的Python库,它主要利用Python类型注解来定义数据模型的结构和验证规则,本文给大家介绍p... 目录主要特点和用途:Field数值验证参数总结pydantic 是一个让你能够 confidentl

JAVA实现亿级千万级数据顺序导出的示例代码

《JAVA实现亿级千万级数据顺序导出的示例代码》本文主要介绍了JAVA实现亿级千万级数据顺序导出的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 前提:主要考虑控制内存占用空间,避免出现同时导出,导致主程序OOM问题。实现思路:A.启用线程池

SpringBoot分段处理List集合多线程批量插入数据方式

《SpringBoot分段处理List集合多线程批量插入数据方式》文章介绍如何处理大数据量List批量插入数据库的优化方案:通过拆分List并分配独立线程处理,结合Spring线程池与异步方法提升效率... 目录项目场景解决方案1.实体类2.Mapper3.spring容器注入线程池bejsan对象4.创建

PHP轻松处理千万行数据的方法详解

《PHP轻松处理千万行数据的方法详解》说到处理大数据集,PHP通常不是第一个想到的语言,但如果你曾经需要处理数百万行数据而不让服务器崩溃或内存耗尽,你就会知道PHP用对了工具有多强大,下面小编就... 目录问题的本质php 中的数据流处理:为什么必不可少生成器:内存高效的迭代方式流量控制:避免系统过载一次性

Python使用FastAPI实现大文件分片上传与断点续传功能

《Python使用FastAPI实现大文件分片上传与断点续传功能》大文件直传常遇到超时、网络抖动失败、失败后只能重传的问题,分片上传+断点续传可以把大文件拆成若干小块逐个上传,并在中断后从已完成分片继... 目录一、接口设计二、服务端实现(FastAPI)2.1 运行环境2.2 目录结构建议2.3 serv

C#实现千万数据秒级导入的代码

《C#实现千万数据秒级导入的代码》在实际开发中excel导入很常见,现代社会中很容易遇到大数据处理业务,所以本文我就给大家分享一下千万数据秒级导入怎么实现,文中有详细的代码示例供大家参考,需要的朋友可... 目录前言一、数据存储二、处理逻辑优化前代码处理逻辑优化后的代码总结前言在实际开发中excel导入很