1 min read

三种向NCBI提交SRA高通量测序原始数据的方法

将测序原始数据提交到SRA已经逐渐成为投稿的必备条件。对于高通量测序数据来说,动辄几百兆或者更大文件的传输是一个相对比较耗时的部分。NCBI提供了3种方式来提交这部分数据:

  1. 网页形式(包括浏览器上传和Aspera Connect插件上传);
  2. Aspera命令行方式提交;
  3. FTP方式提交。

第一种方式

网页提交应当是用户最熟悉的方式,跟日常上网的操作一样。但是,如果不使用Aspera Connect插件,一次只能提交一个文件。而且整个提交过程中没有进度提示,是最低效率的方式。然而,通过使用Aspera Connect插件,可以同时提交多个文件并看到进度。

一般情况下,使用Aspera插件在网页上提交是最方便的、推荐的上传方式。

不过,有时候由于浏览器、网络等存在问题,浏览器并不能正确调用Aspera软件。那就只能用其它方式传输了。

后面两种,都属于先将文件上传到临时文件夹(preloaded),随后再与SRA中的meta table中的文件列表一一对应起来的方法。

第二种方式

第二种方式是我最近一次使用的方式。当时,在浏览器上无法正确启动Aspera软件,并且使用时出现多次蓝屏。当你选择这种方式,需要打开一个命令行,输入网页上提示的命令即可。

下图即网页上面的提示。注意你需要下载一个key file在命令中使用。同时,还有把所有文件放在一个文件夹中。相应文件夹中的所有文件都会被上传。

命令运行时的界面如下:

这种方式传输速度也很快。我用WIFI是的连接速度在30 Mbps左右。

第三种方式

第三种方式,应当是最传统的文件传输方式,即FTP方式。选择FTP方式时,网页上会显示FTP服务器的地址、用户名、密码、用户目录等信息。需要注意的是,你并没有服务器根目录的访问权限,因此需要在设置FTP服务器时指定目录(FileZilla)。

首先,打开站点管理器,新建站点,填写主机、用户名、密码等信息。

其次,进入“高级”标签页,在上面把用户目录填写上。

这时候就可以连接了。需要注意的是,连接之后,需要在用户目录中新建一个子文件夹(必选操作)。然后才能将文件通过FTP传输到用户目录的新建子文件夹内。

根据我的使用情况,FTP传输的速度只有第二种方法的十分之一不到。除非你网络环境很好,否则不值得推荐。

===================================

综上所述,上传文件首选带有Aspera插件的浏览器模式,其次是Aspera命令行模式,再次FTP模式。