Skip to content

1.1 构建单细胞 RNA seq 分析环境

关于电脑规格

在进行 scRNA-seq 解析时,选择 Windows 还是 Mac 的操作系统可能是一个让人困惑的问题。结论是,无论是 Windows 还是 Mac 都可以进行解析。过去常有人建议“如果可以的话,买 Mac 更好”,现在依然有一些书籍和网络文章推荐使用 Mac。推荐 Mac 的理由包括:许多从事生物信息学的用户使用 Mac,因此存在更多适用于 Mac 的工具,且信息共享基本上都是在 Mac 上进行的。然而,随着 Windows Subsystem for Linux 2 (WSL2) 的发布,在 WSL2 上运行 Ubuntu 进行解析已变得非常普遍。因此,并非必须使用 Mac。本书的内容也针对 Windows 用户进行了编排,请放心。基于此,作者推荐配置以下最低规格的电脑:

  • 操作系统:Mac 或 Windows 均可
  • 最大 CPU 核心数:8
  • CPU 芯片:Apple Silicon 或 Intel?建议购买 Intel
  • 最大内存:16~32GB
  • 台式机或笔记本:笔记本也可以
  • 存储空间:500GB

在这些配置中,内存最为重要。内存难以后期扩展,并且生物信息学的处理常需要使用名为 Docker 的虚拟化环境软件,Docker 会大量占用内存。如果内存只有 8GB,进行生物信息学处理时可能会导致无法进行其他操作(如在解析过程中使用 PowerPoint 会非常卡)。至少需要 16GB 内存。如果使用 Cell Ranger 从 fastq 文件中获取读数,建议配置 32~64GB 内存。

目前,购买 Mac 时大多数会选择 Apple Silicon 的 CPU 芯片。虽然 Apple Silicon 在处理性能上优于 Intel,但作者不推荐购买 Apple Silicon 的 Mac。原因是:生物信息学的某些库可能不兼容,且可能遇到 Intel 芯片不存在的未知错误,这些错误在网上难以找到解决方案。Intel 芯片的信息更为丰富,适合初学者。此外,Apple Silicon 与 Docker 的兼容性不好,可能会降低 Docker 环境的处理性能。因此,建议选择 Intel 芯片的 Mac 或 Windows。

至于台式机还是笔记本,台式机通常适用于计算量极大的任务,如分子模拟。对于本书介绍的 scRNA-seq 解析,笔记本完全能够胜任。笔者个人推荐笔记本,因为它便于携带。

存储方面,可以通过外接 HDD 扩展,因此优先级相对较低。然而,scRNA-seq 解析产生的文件每个样本通常为 2~10GB,如果存储容量过小,本地存储很快会被占满。最近 1TB 的硬盘价格已降至约 5000 日元,因此建议准备一个外接硬盘。