635 字
3 分钟
cngb数据下载
cngb数据库中的数据有公开数据和需要申请权限才能下载的,这里以公开数据举例
在网页中直接下载目前是无法下载的,目前不知道是什么问题,可能是http/https的下载权限比较严格,ftp下载匿名访问是没有问题的
以这个文件链接为例:
https://ftp.cngb.org/pub/SciRAID/stomics/STDS0000056/stomics/10DPI_1.h5ad
在Linux环境中下载指令如下:
wget -c -r -nH -nd -P ./ ftp://ftp.cngb.org/pub/SciRAID/stomics/STDS0000056/stomics/10DPI_1.h5ad --ftp-user=anonymous --ftp-password=anonymous@example.com
-c
(--continue
)- 作用:启用断点续传。如果下载中断,重新运行此命令会从上次中断的位置继续下载,而不是重新开始。
- 适用场景:大文件下载时特别有用,避免因网络问题导致重复下载。
-r
(--recursive
)- 作用:递归下载,即不仅下载指定文件,还会下载该目录下的所有文件和子目录(如果适用)。
- 适用场景:如果你想下载整个目录而不仅仅是单个文件,可以加上这个参数。但在这个命令中,由于指定的是具体文件(
10DPI_1.h5ad
),-r
可能不会产生额外效果。
-nH
(--no-host-directories
)- 作用:下载时不创建以服务器主机名(如
ftp.cngb.org
)命名的目录。 - 示例:
- 默认行为:
wget
可能会创建一个ftp.cngb.org
文件夹,然后把文件放在里面。 - 使用
-nH
:直接下载到当前目录(或-P
指定的目录),不创建额外层级。
- 默认行为:
- 作用:下载时不创建以服务器主机名(如
-nd
(--no-directories
)- 作用:不保留远程服务器的目录结构,所有文件都直接下载到目标目录(
-P
指定的目录或当前目录)。 - 示例:
- 默认行为:
wget
会尝试在本地重建远程目录结构(如pub/SciRAID/stomics/...
)。 - 使用
-nd
:所有文件直接下载到目标目录,不创建子目录。
- 默认行为:
- 作用:不保留远程服务器的目录结构,所有文件都直接下载到目标目录(
-P ./
(--directory-prefix=./
)- 作用:指定下载文件的存储目录。
./
表示当前目录(也可以写绝对路径,如-P /home/user/data
)。 - 适用场景:如果你想下载到特定目录而不是当前工作目录,可以用这个参数。
- 作用:指定下载文件的存储目录。
ftp://ftp.cngb.org/pub/SciRAID/stomics/STDS0000056/stomics/10DPI_1.h5ad
- 作用:指定要下载的文件的 FTP 地址。
--ftp-user=anonymous
- 作用:指定 FTP 登录用户名。
anonymous
是公共 FTP 服务器的默认匿名用户。
- 作用:指定 FTP 登录用户名。
--ftp-password=anonymous@example.com
- 作用:指定 FTP 登录密码。对于匿名 FTP,通常可以随便填一个邮箱格式的字符串(如
anonymous@example.com
),有些服务器会检查但大多数不会
- 作用:指定 FTP 登录密码。对于匿名 FTP,通常可以随便填一个邮箱格式的字符串(如