Skip to content

1.1.The building block of life

Source

这本书的英文原版位于 https://www.sc-best-practices.org/preamble.html ,感谢他们为编写这份教程所付出的巨大努力

生命是我们所知的用来区分活体与死亡或无生命实体的特征。大多数生命定义中都包含一个共同的实体——细胞。细胞形成开放系统,能够维持内稳态,具有新陈代谢,生长,适应环境,繁殖,对刺激作出反应,并自我组织。因此,细胞是生命的基本构建块。细胞最早于 1665 年被英国科学家罗伯特·胡克发现。胡克使用非常原始的显微镜研究了一片薄薄的软木片,令他惊讶的是,这片软木片看起来像蜂窝。他将这些微小的单位称为“细胞”。

图 2.1 罗伯特·胡克绘制的软木细胞图。图片来自《显微图谱》。

1839 年,Matthias Jakob Schleiden 和 Theodor Schwann 首次描述了细胞理论。细胞理论描述了所有生物体都是由细胞构成的。细胞作为功能单位,由其他细胞产生,因此它们是繁殖的基本单位。

自细胞理论的早期定义以来,研究人员发现细胞内存在能量流动,遗传信息以 DNA 的形式从一个细胞传递到另一个细胞,并且所有细胞具有几乎相同的化学成分。存在两种类型的细胞:真核细胞和原核细胞。真核细胞含有细胞核,核膜包裹染色体;而原核细胞仅有类核区,没有细胞核。细胞核包含细胞的基因脱氧核糖核酸 DNA,这也是“真核”的名称来源:_ 核 _ 在拉丁语中意为“核心”或“种子”。真核生物由单个细胞(单细胞)或多个细胞(多细胞)组成,而原核生物是单细胞生物。真核细胞进一步通过其高度的分隔性与原核细胞区分,即膜结合的细胞器执行高度专业化的功能并为细胞提供关键支持。

与原核细胞相比,真核细胞的体积平均大约为原核细胞的 10000 倍,含有丰富的细胞器和由微管、微丝和中间丝构成的细胞骨架。DNA 复制机制读取储存在细胞核 DNA 中的遗传信息以自我复制并保持生命循环。真核 DNA 被分为若干线性束,称为染色体,在核分裂过程中由微管主轴分离。理解隐藏在 DNA 中的遗传信息是理解许多进化和疾病相关过程的关键。_ 测序 _ 是破译 DNA 核苷酸顺序的过程,主要用于揭示特定 DNA 片段、完整基因组甚至复杂微生物组携带的遗传信息。DNA* 测序 * 允许研究人员确定 DNA 分子和基因组中基因和调控元件的位置和功能,并揭示诸如开放阅读框(ORF)或 CpG 岛等遗传特征,指示启动子区域。另一个非常常见的应用领域是进化分析,通过比较不同生物的同源 DNA 序列。此外,DNA 测序还可以用于研究突变与疾病之间的关联,有时甚至是疾病抵抗性,这被认为是最有用的应用之一。

一个非常流行的例子是镰状细胞病,这是一组血液疾病,由红细胞中的携氧蛋白血红蛋白的异常引起。这导致严重的健康问题,包括疼痛、贫血、手脚肿胀、细菌感染和中风。镰状细胞病的原因是从每个父母遗传了两个异常的 β- 珠蛋白基因(HBB)副本。基因缺陷是由单个核苷酸突变引起的,其中一个 GAG 密码子变为 β- 珠蛋白基因的 GTG 密码子。这导致在第 6 位氨基酸谷氨酸被缬氨酸取代(E6V 替代),从而导致上述疾病。不幸的是,由于大多数疾病是由复杂的调控过程引起的,因此并不总是能找到这样“简单”的单个核苷酸突变与疾病之间的关联。

2.2. 测序简史

2.2.1. 第一代测序

尽管 DNA 早在 1869 年由弗里德里希·米歇尔首次分离出来,但科学界花了超过 100 年的时间才开发出高通量测序技术。1953 年,沃森、克里克和富兰克林发现了 DNA 的结构;1965 年,罗伯特·霍利测序了第一个 tRNA。七年后,在 1972 年,沃尔特·菲尔斯首次测序了一个完整的基因(噬菌体 MS2 的衣壳蛋白),他使用 RNA 酶消化病毒 RNA,分离出寡核苷酸,最后通过电泳和色谱法分离它们【JOU et al., 1972】。同时,弗雷德里克·桑格开发了一种使用放射性标记、部分消化的片段的 DNA 测序方法,称为“链终止法”,更为常见的是“桑格测序”。尽管桑格测序至今仍在使用,但它存在一些缺点,包括缺乏自动化且耗时。在 1987 年,Leroy Hood 和 Michael Hunkapiller 开发了 ABI 370,这是一种自动化桑格测序过程的仪器。其最重要的创新成就是用荧光染料代替放射性分子进行 DNA 片段的自动标记。这一改变不仅使方法更安全,还使计算机能够分析获取的数据【Hood et al., 1987】。

优点:

  • 桑格测序简单且成本低。
  • 如果操作正确,错误率非常低(<0.001%)。

缺点:

  • 桑格方法只能测序约 300 到 1000 个碱基对(bp)的短 DNA 片段。
  • 桑格测序在前 15 到 40 个碱基时的质量通常不是很好,因为这是引物结合的地方。
  • 测序在 700 到 900 个碱基后会退化。
  • 如果测序的 DNA 片段已经被克隆,某些克隆载体序列可能会进入最终序列。
  • 桑格测序每个测序碱基比二代或三代测序更昂贵。

2.2.2. 第二代测序

九年后的 1996 年,Mostafa Ronaghi、Mathias Uhlen 和 Pȧl Nyŕen 引入了一种新的 DNA 测序技术,称为焦磷酸测序(pyrosequencing),开启了二代测序的时代。二代测序,也被称为下一代测序(NGS),主要得益于实验室中进一步的自动化、计算机的使用和反应的微型化。焦磷酸测序通过测量在测序过程中焦磷酸合成产生的发光来进行。这一过程也被称为“合成测序”(sequencing-by-synthesis)。两年后,Shankar Balasubramanian 和 David Klenerman 在 Solexa 公司开发并改进了这种利用荧光染料的合成测序新方法。Solexa 的技术也构成了今天市场主导的 Illumina 测序仪的基础。2005 年开发的 Roche 454 测序仪是首个在单一自动化机器中完全自动化焦磷酸测序过程的测序仪。之后还引入了许多其他平台,如 SOLiD 系统的“连接测序”(sequencing-by-ligation,2007 年)和 Life Technologies 的 Ion Torrent(2011 年),其使用“合成测序”检测新合成 DNA 时释放的氢离子。

优点:

  • 二代测序在所需化学品方面通常是最便宜的选择。
  • 稀少的材料也可以用作输入。
  • 高灵敏度,能够检测低频变异和全面覆盖基因组。
  • 高通量,可以进行样本多重分析。
  • 能够同时测序数千个基因。

缺点:

  • 测序机器昂贵,通常需要与同事共享。
  • 二代测序仪是大型固定设备,不适合现场工作。
  • 通常,二代测序产生许多短的测序片段(读数),对于新基因组来说使用起来较为困难。
  • 测序结果的质量依赖于参考基因组。

2.2.3. 第三代测序

第三代测序,现今也被称为下一代测序,给市场带来了两项创新。首先是长读长测序,这种测序能够获取比通常的 Illumina 短读长测序仪生成的更长的核苷酸片段(根据测序仪的不同,长度在 75 到 300 个碱基对之间)。这对于组装没有参考基因组的新基因组尤为重要。其次,实时测序的能力是第三代测序的另一个重大进步。结合便携式测序仪,这些小型测序仪不需要复杂的化学设备,使测序变得“现场可用”,甚至可以远离实验室设施进行样本采集。

Pacific Biosciences(PacBio)在 2010 年引入了零模波导(ZMW)测序,使用包含单个 DNA 聚合酶的所谓纳米孔。这允许通过附在纳米孔下方的探测器直接观察任何单个核苷酸的掺入过程。每种类型的核苷酸都用特定的荧光染料标记,在掺入过程中发出荧光信号,随后这些信号被测量为序列读数。从 PacBio 测序仪获得的读数通常为 8 到 15 千碱基(kb),最长可达 70kb。

牛津纳米孔技术(Oxford Nanopore Technologies)在 2012 年推出了 GridION。GridION 及其后续产品 MinION 和 Flongle 是便携式的 DNA 和 RNA 测序仪,能够产生超过 2 兆碱基(Mb)的读数。值得注意的是,这种测序设备甚至可以放在一个人的手掌中。牛津纳米孔测序仪通过观察核酸通过蛋白质纳米孔时发生的电流变化来识别核苷酸序列【Jain et al., 2016】。

优点:

  • 长读长测序允许组装大型新基因组。
  • 测序仪便携,适用于现场工作。
  • 可能直接检测 DNA 和 RNA 序列的表观遗传修饰。
  • 速度快。第三代测序仪速度快。

缺点:

  • 一些第三代测序仪的错误率高于第二代测序仪。
  • 试剂通常比第二代测序更贵。

2.3. NGS 流程概述

尽管存在多种 NGS 技术,但测序 DNA(因此也包括反转录的 RNA)的基本步骤大体相同。差异主要在于各自测序技术的化学原理。

  1. 样本和文库准备:第一步,通过将 DNA 样本片段化并与接头分子连接,制备所谓的文库。接头分子在文库片段与基质的杂交中起作用,并提供引物结合位点。

  2. 扩增和测序:在第二步中,文库被转化为单链分子。在扩增步骤(如聚合酶链反应)中,生成 DNA 分子的簇。所有这些簇在单次测序运行期间执行独立的反应。

  3. 数据输出和分析:测序实验的输出取决于测序技术和化学原理。有些测序仪生成荧光信号,并将其存储在特定的输出文件中,而其他测序仪可能生成电信号并将其存储在相应的文件格式中。一般来说,生成的数据量,即原始数据,非常大。这些数据需要复杂且计算量大的处理。在原始数据处理章节中将进一步讨论这一点。

2.4. RNA 测序

到目前为止,我们介绍测序时隐含的假设是正在测序 DNA。然而,仅仅知道一个生物体的 DNA 序列及其调控元件的位置,无法告诉我们细胞的动态和实时操作。例如,通过结合不同的 mRNA 剪接位点和来自同一 mRNA 前体的外显子,一个基因可以编码多种蛋白质。这种可变剪接事件在真核生物中自然发生且常见;然而,某些变异可能会导致非功能性酶和诱发疾病状态。这就是 RNA 测序(RNA-Seq)的作用所在。RNA-Seq 大体遵循 DNA 测序的协议,但包括一个逆转录步骤,在此过程中从 RNA 模板合成互补 DNA(cDNA)。测序 RNA 使科学家能够在测序时获取细胞、组织或生物体的快照,表现为基因的表达谱。这些信息可用于检测疾病状态在治疗反应下的变化、不同环境条件下的变化、基因型比较和其他实验设计。

现代 RNA 测序与例如基于微阵列的测定或 RT-qPCR 不同,它们需要探针设计以专门针对感兴趣的区域,而 RNA-Seq 允许对转录本进行无偏采样。获得的基因表达谱进一步支持检测基因异构体、基因融合、单核苷酸变异和许多其他有趣的特性。现代 RNA 测序不受先验知识的限制,允许捕获已知和新发现的特征,生成可用于探索性数据分析的丰富数据集。

2.5. 单细胞 RNA 测序

2.5.1. 概述

RNA 测序主要可以通过两种方式进行:要么通过测序感兴趣来源的细胞混合 RNA(总体测序),要么通过分别测序各个细胞的转录组(单细胞测序)。与实验上复杂的单细胞测序相比,混合所有细胞的 RNA 通常更便宜且更简单。总体 RNA-Seq 产生的是细胞平均表达谱,这些谱通常更容易分析,但也隐藏了一些复杂性,例如细胞表达谱的异质性,而这种异质性可能有助于回答研究问题。例如,一些药物或干扰可能只影响特定的细胞类型或细胞类型之间的相互作用。在肿瘤学中,可能存在导致复发的稀有耐药肿瘤细胞,这在简单的总体 RNA-Seq 上甚至在培养的细胞中都很难识别。

为了揭示这些关系,研究单细胞水平的基因表达是至关重要的。然而,单细胞 RNA-Seq(scRNA-Seq)也存在一些注意事项。首先,单细胞实验通常更昂贵且更难以正确进行。其次,由于分辨率的提高,下游分析变得更加复杂,更容易得出错误的结论。

总体来说,单细胞实验遵循与总体 RNA-Seq 实验相同的步骤(见上文),但需要若干调整。与总体测序一样,单细胞测序需要裂解、逆转录、扩增和最终测序。此外,单细胞测序需要进行细胞分离,并物理上分隔到更小的反应室或其他形式的细胞标记,以便能够将获得的转录组映射回其原始细胞。因此,这些也是大多数单细胞测定差异的步骤:单细胞分离、转录扩增以及根据测序仪的不同,测序。在解释不同测序方法如何工作之前,我们现在将更仔细地讨论转录本定量。

2.5.2. 转录本定量

转录本定量是将测序得到的转录本与基因序列进行比对并计数这些命中的过程。这些计数最终形成计数表。关于这一计算过程的更多细节将在下一章中描述。转录本定量主要有两种方法:全长定量和标签定量。全长定量协议试图通过测序读数均匀覆盖整个转录本,而标签定量协议仅捕获转录本的 5' 或 3' 端。转录本定量方法对捕获的基因有很大影响,因此分析人员必须了解所使用的定量过程。

全长测序仅限于基于板的协议(见下文),其文库准备与总体 RNA-seq 测序方法相似。全长协议不一定总能实现均匀覆盖,因此基因体内的特定区域仍可能存在偏差。全长协议的主要优点是能够检测剪接变体。标签定量协议仅测序转录本的 3' 或 5' 端。这种方法的缺点是不能(必然)覆盖整个基因长度,难以明确比对读数到转录本并区分不同的异构体【Archer et al., 2016】。然而,这种方法允许使用唯一分子标识符(UMIs),这对于解决转录本扩增过程中的偏差非常有用。

转录本扩增过程是任何 RNA-seq 测序运行中的关键步骤,确保转录本的丰度足以进行质量控制和测序。在这个过程中,通常使用聚合酶链反应(PCR),从原始分子的相同片段中复制。如果复制品和原始分子无法区分,就很难确定样本中原始分子的数量。使用 UMIs 是量化原始未重复分子的常见解决方案。UMIs 作为分子条形码,有时也称为随机条形码。这些“条形码”由短的随机核苷酸序列组成,作为唯一标签添加到样本中的每个分子上。UMIs 必须在文库生成期间的扩增步骤之前添加。准确识别 PCR 重复对于下游分析非常重要,以排除或注意到扩增偏差【Aird et al., 2011】。

扩增偏差是指那些被优先扩增的 RNA/cDNA 序列,因此这些序列将被更频繁地测序,导致更高的计数。它对任何基因表达分析都有不利影响,因为不太活跃的基因可能会突然显示出高表达。这尤其适用于在 PCR 步骤的后期扩增的序列,此时的错误率可能已经比 PCR 早期阶段高。虽然可以通过计算检测和去除这些序列,例如去除具有相同比对坐标的读数,但一般建议在可能的情况下,总是设计带有 UMIs 的实验。使用 UMIs 还允许在不损失准确性的情况下进行基因计数的归一化【Kivioja et al., 2012】。

ADD A FIGURE HERE.

2.5.3. 单细胞测序协议

目前,存在三种类型的单细胞测序协议,主要根据其细胞分离协议进行分类:基于微流体设备的策略,其中细胞被封装在水凝胶液滴中;基于孔板的协议,其中细胞被物理分离到孔中;以及商用的 Fluidigm C1 微流体芯片解决方案,它将细胞加载并分离到小反应室中。这三种方法在转录本的恢复能力、测序的细胞数量以及许多其他方面有所不同。在以下小节中,我们将简要讨论它们的工作原理、优缺点以及数据分析人员应注意的可能偏差。

2.5.3.1. 基于微流体设备的协议

基于微流体设备的单细胞策略将细胞捕获在水凝胶液滴中,从而分隔成单细胞反应室。最广泛使用的协议包括 inDrop[Klein et al., 2015], Drop-seq[Macosko et al., 2015] 和商用的 10x Genomics Chromium[Zheng et al., 2017],这些协议能够每秒生成数千个液滴。这种大规模并行过程以相对较低的成本生成大量液滴。尽管这三种协议在细节上有所不同,但纳升级的液滴中封装的细胞总是设计为同时捕获微珠和细胞。封装过程使用带有 PCR 把手、细胞条形码、4-8bp 长的唯一分子标识符(UMI)和聚 T 尾巴的特殊微珠。在裂解后,细胞的 mRNA 瞬间释放并被附着在微珠上的带条形码的寡核苷酸捕获。接下来,收集液滴并破裂以释放附着在微粒上的单细胞转录组(STAMPs)。随后进行 PCR 和逆转录以捕获和扩增转录本。最后进行片段化,在转录本上随机切割并附加测序接头。这个过程生成的测序文库已经准备好进行测序,如上所述。基于微流体的协议中,只有大约 10% 的细胞转录本被恢复 [Islam et al., 2014]。值得注意的是,这种低测序率足以稳健地识别细胞类型。

所有三种基于微流体设备的方法都会产生特定的偏差。使用的微珠材料在不同协议之间有所不同。Drop-seq 使用易碎树脂制成的微珠,因此微珠以泊松分布方式封装,而 InDrop 和 10X Genomics 的微珠是可变形的,其微珠占有率超过 80%[Zhang et al., 2019]。此外,Drop-Seq 中使用表面固定引物可能会影响捕获效率。InDrop 使用光切割释放引物,而 10X Genomics 溶解微珠。这种差异还影响逆转录过程的位置。在 Drop-seq 中,逆转录在微珠从液滴中释放后进行,而在 InDrop 和 10X Genomics 协议中,逆转录发生在液滴内 [Zhang et al., 2019]。

2019 年,Zhang 等人的比较发现,在微珠质量方面,10X Genomics 优于 inDrop 和 Drop-seq,因为前两种系统中的细胞条形码存在明显的不匹配。此外,10X Genomics 中来自有效条形码的读数比例为 75%,而 InDrop 仅为 25%,Drop-seq 为 30%。

10X Genomics 在灵敏度方面也显示出类似的优势。在比较过程中,10X Genomics 平均从 3000 个基因中捕获了大约 17000 个转录本,而 Drop-seq 从 2500 个基因中捕获了 8000 个转录本,InDrop 从 1250 个基因中捕获了 2700 个转录本。10X Genomics 的技术噪声最低,其次是 Drop-seq 和 InDrop[Zhang et al., 2019]。

实际生成的数据表明存在大量的协议偏差。10X Genomics 倾向于捕获和扩增较短的基因和高 GC 含量的基因,而 Drop-seq 则偏向低 GC 含量的基因。虽然 10X Genomics 在各方面都表现优于其他协议,但其每个细胞的成本大约是其他协议的两倍。此外,除了微珠外,Drop-seq 是开源的,如果需要,协议可以更容易地进行调整。InDrop 是完全开源的,甚至微珠也可以在实验室中制造和修改。因此,InDrop 是这三种协议中最灵活的。

优点:

  • 允许高

效地对大量细胞进行测序,以识别组织的整体组成并表征稀有细胞类型。 - 可以包含 UMIs。

缺点:

  • 与其他方法相比,转录本的检测率较低。
  • 只捕获 3' 端而不是全转录本,因为细胞条形码和 PCR 把手仅添加到转录本的末端。

2.5.3.2. 基于板材

基于孔板的协议通常将细胞物理分离到微孔板中。第一步通过例如荧光激活细胞分选(FACS)进行细胞分选,根据特定的细胞表面标志物对细胞进行分选;或者通过微量移液。然后将选定的细胞放入含有细胞裂解缓冲液的各个孔中,随后进行逆转录。这允许在单个实验中分析数百个细胞,每个细胞捕获 5000 到 10000 个基因。基于孔板的测序协议包括但不限于 SMART-seq2、MARS-seq、QUARTZ-seq 和 SRCB-seq。一般来说,这些协议在多重化能力上有所不同。例如,MARS-seq 允许使用三个条形码级别,即分子、细胞和板级标签,具备稳健的多重化能力。而 SMART-seq2 则不允许早期多重化,限制了细胞数量。Mereu 等人在 2020 年的系统比较研究中发现,QUARTZ-seq2 能够比 SMART-seq2、MARS-seq 或 SRCB-seq 每个细胞捕获更多的基因【Mereu et al., 2020】,这意味着 QUARTZ-seq2 能够很好地捕获细胞类型特异性标志基因,从而自信地进行细胞类型注释。

优点:

  • 每个细胞恢复许多基因,允许进行深入的表征。
  • 在文库制备之前收集信息是可能的,例如通过 FACS 分选,将细胞大小和任何使用的标签的强度等信息与孔坐标关联。
  • 允许全长转录本的恢复。

缺点:

  • 基于孔板的实验规模受限于其单个处理单元的较低通量。
  • 片段化步骤消除了链特异性信息【Hrdlickova et al., 2017】。
  • 根据协议的不同,基于孔板的协议可能需要大量的移液步骤,劳动强度大,导致潜在的技术噪声和批次效应。

2.5.3.3. Fluidigm C1

商用的 Fluidigm C1 系统是一种微流体芯片,以自动化方式加载和分离细胞到小反应室中。CEL-seq2 和 SMART-seq(版本 1)协议在其工作流程中使用了 Fluidigm C1 芯片,使得 RNA 提取和文库制备步骤可以一起进行,从而减少了所需的手工劳动。然而,Fluidigm C1 需要相对均一的细胞混合物,因为细胞会根据其大小到达微流体芯片上的不同位置,这可能引入潜在的位置偏差。由于扩增步骤是在单独的孔中进行的,因此可以实现全长测序,有效减少许多其他单细胞 RNA-seq 测序协议的 3' 偏差。该协议通常也更昂贵,因此主要适用于对特定细胞群体的广泛检查。

优点:

  • 允许全长转录本覆盖。
  • 可以恢复剪接变体和 T/B 细胞受体库的多样性。

缺点:

  • 仅允许测序最多 800 个细胞 [Fluidigm, 2022].
  • 每个细胞的成本比其他协议更高。
  • 仅约 10% 的提取细胞被捕获,使得该协议不适用于稀有细胞类型或低输入样本。
  • 使用的阵列仅捕获特定大小的细胞,这可能导致捕获的转录本存在偏差。

2.5.3.4. 纳米孔单细胞转录组测序

长读长单细胞测序方法很少使用 UMI [Singh et al., 2019],或者未进行 UMI 校正 [Gupta et al., 2018],因此将新 UMI 读取分配给新 UMI。由于长读长测序仪的测序错误率较高,这会引起严重问题 [Lebrigand et al., 2020]。Lebrigand 等人引入了 ScNaUmi-seq(带有 UMI 的单细胞纳米孔测序),它结合了纳米孔测序与细胞条形码和 UMI 分配。条形码分配通过将纳米孔读取中发现的细胞条形码序列与 Illumina 读取中恢复的相同区域或基因的序列进行比较来指导 [Lebrigand et al., 2020]。然而,这实际上需要两个单细胞文库。scCOLOR-seq 使用全长条形码中核苷酸对互补的方式计算识别无误差条形码。这些条形码随后用作指南以校正剩余的错误条形码 [Philpott et al., 2021]。修改后的 UMI 工具方向网络方法用于校正 UMI 序列重复。

优点:

  • 恢复剪接和序列异质性信息

缺点:

  • 纳米孔试剂昂贵。
  • 高细胞条形码恢复错误率。
  • 根据协议,条形码分配需要 Illumina 数据指导,这需要进行两次测序实验。

2.5.3.5. Summary

总而言之,我们强烈建议湿实验室和干实验室的科学家根据研究目的选择测序协议。是否需要对特定细胞类型群体进行深入表征?在这种情况下,基于孔板的方法可能更适合。相反,基于液滴的测定更能捕获异质混合物,允许对测序细胞进行更广泛的表征。此外,如果预算是一个限制因素,选择的协议应更加经济高效和稳健。在分析数据时,要注意测序测定的特定偏差。对于所有单细胞测序协议的详细比较,我们推荐 Mereu 等人的“Benchmarking single-cell RNA-sequencing protocols for cell atlas projects”论文【Mereu et al., 2020】。

2.5.4. single-cell vs single-nuclei

到目前为止,我们一直在讨论单细胞测定,但也可以只测序细胞核。单细胞分析并不总能为特定组织或器官(例如大脑)提供无偏见的细胞类型视图。在组织解离过程中,一些细胞类型更容易受损,因此难以捕获。例如,在小鼠新皮层中,快发放的副钙蛋白阳性中间神经元和皮质下投射的谷氨酸能神经元的比例低于预期【Tasic et al., 2018】。相反,非神经元细胞在解离过程中比神经元更能存活,在成年人大脑新皮层的单细胞悬浮液中过度代表【Darmanis et al., 2015】。此外,单细胞测序高度依赖新鲜组织,这使得利用组织生物库变得困难。另一方面,细胞核对机械力更具抵抗力,可以在不使用组织解离酶的情况下从冷冻组织中安全分离【Krishnaswami et al., 2016】。这两种选择在不同组织和样本类型中有不同的适用性,结果的偏差和不确定性尚未完全揭示。已有研究表明,细胞核能准确反映细胞的所有转录模式【Ding et al., 2020】。在实验设计中选择单细胞还是单细胞核主要由组织样本类型驱动。然而,数据分析应意识到解离能力将对潜在可观察的细胞类型产生强烈影响。因此,我们强烈鼓励湿实验室和干实验室科学家之间就实验设计进行讨论。

To get a more elaborate understanding of the experimental assays we recommend the following papers:

2.7. References#

[expARC+11]

Daniel Aird, Michael G. Ross, Wei-Sheng Chen, Maxwell Danielsson, Timothy Fennell, Carsten Russ, David B. Jaffe, Chad Nusbaum, and Andreas Gnirke. Analyzing and minimizing pcr amplification bias in illumina sequencing libraries. Genome Biology, 12(2):R18, Feb 2011. URL: https://doi.org/10.1186/gb-2011-12-2-r18, doi:10.1186/gb-2011-12-2-r18.

[expBHM+18]

Trygve E. Bakken, Rebecca D. Hodge, Jeremy A. Miller, Zizhen Yao, Thuc Nghi Nguyen, Brian Aevermann, Eliza Barkan, Darren Bertagnolli, Tamara Casper, Nick Dee, Emma Garren, Jeff Goldy, Lucas T. Graybuck, Matthew Kroll, Roger S. Lasken, Kanan Lathia, Sheana Parry, Christine Rimorin, Richard H. Scheuermann, Nicholas J. Schork, Soraya I. Shehata, Michael Tieu, John W. Phillips, Amy Bernard, Kimberly A. Smith, Hongkui Zeng, Ed S. Lein, and Bosiljka Tasic. Single-nucleus and single-cell transcriptomes compared in matched cortical cell types. PLOS ONE, 13(12):1–24, 12 2018. URL: https://doi.org/10.1371/journal.pone.0209648, doi:10.1371/journal.pone.0209648.

[expDSZ+15]

Spyros Darmanis, Steven A. Sloan, Ye Zhang, Martin Enge, Christine Caneda, Lawrence M. Shuer, Melanie G. Hayden Gephart, Ben A. Barres, and Stephen R. Quake. A survey of human brain transcriptome diversity at the single cell level. Proceedings of the National Academy of Sciences, 112(23):7285–7290, 2015. URL: https://www.pnas.org/doi/abs/10.1073/pnas.1507125112, arXiv:https://www.pnas.org/doi/pdf/10.1073/pnas.1507125112, doi:10.1073/pnas.1507125112.

[expDAS+20]

Jiarui Ding, Xian Adiconis, Sean K. Simmons, Monika S. Kowalczyk, Cynthia C. Hession, Nemanja D. Marjanovic, Travis K. Hughes, Marc H. Wadsworth, Tyler Burks, Lan T. Nguyen, John Y. H. Kwon, Boaz Barak, William Ge, Amanda J. Kedaigle, Shaina Carroll, Shuqiang Li, Nir Hacohen, Orit Rozenblatt-Rosen, Alex K. Shalek, Alexandra-Chloé Villani, Aviv Regev, and Joshua Z. Levin. Systematic comparison of single-cell and single-nucleus termrna-sequencing methods. Nature Biotechnology, 38(6):737–746, Jun 2020. URL: https://doi.org/10.1038/s41587-020-0465-8, doi:10.1038/s41587-020-0465-8.

[expGCH+18]

Ishaan Gupta, Paul G. Collier, Bettina Haase, Ahmed Mahfouz, Anoushka Joglekar, Taylor Floyd, Frank Koopmans, Ben Barres, August B. Smit, Steven A. Sloan, Wenjie Luo, Olivier Fedrigo, M. Elizabeth Ross, and Hagen U. Tilgner. Single-cell isoform termrna sequencing characterizes isoforms in thousands of cerebellar cells. Nature Biotechnology, 36(12):1197–1202, Dec 2018. URL: https://doi.org/10.1038/nbt.4259, doi:10.1038/nbt.4259.

[expHHS87]

L E Hood, M W Hunkapiller, and L M Smith. Automated termDNA sequencing and analysis of the human genome. Genomics, 1(3):201–212, November 1987.

[expIZJ+14]

Saiful Islam, Amit Zeisel, Simon Joost, Gioele La Manno, Pawel Zajac, Maria Kasper, Peter Lönnerberg, and Sten Linnarsson. Quantitative single-cell termrna-seq with unique molecular identifiers. Nature Methods, 11(2):163–166, Feb 2014. URL: https://doi.org/10.1038/nmeth.2772, doi:10.1038/nmeth.2772.

[expKMA+15]

Allon M. Klein, Linas Mazutis, Ilke Akartuna, Naren Tallapragada, Adrian Veres, Victor Li, Leonid Peshkin, David A. Weitz, and Marc W. Kirschner. Droplet barcoding for single-cell transcriptomics applied to embryonic stem cells. Cell, 161(5):1187–1201, May 2015. PMC4441768[pmcid]. URL: https://doi.org/10.1016/j.cell.2015.04.044, doi:10.1016/j.cell.2015.04.044.

[expKGN+16]

Suguna Rani Krishnaswami, Rashel V. Grindberg, Mark Novotny, Pratap Venepally, Benjamin Lacar, Kunal Bhutani, Sara B. Linker, Son Pham, Jennifer A. Erwin, Jeremy A. Miller, Rebecca Hodge, James K. McCarthy, Martijn Kelder, Jamison McCorrison, Brian D. Aevermann, Francisco Diez Fuertes, Richard H. Scheuermann, Jun Lee, Ed S. Lein, Nicholas Schork, Michael J. McConnell, Fred H. Gage, and Roger S. Lasken. Using single nuclei for termrna-seq to capture the transcriptome of postmortem neurons. Nature Protocols, 11(3):499–524, Mar 2016. URL: https://doi.org/10.1038/nprot.2016.015, doi:10.1038/nprot.2016.015.

[expMBS+15]

Evan Z. Macosko, Anindita Basu, Rahul Satija, James Nemesh, Karthik Shekhar, Melissa Goldman, Itay Tirosh, Allison R. Bialas, Nolan Kamitaki, Emily M. Martersteck, John J. Trombetta, David A. Weitz, Joshua R. Sanes, Alex K. Shalek, Aviv Regev, and Steven A. McCarroll. Highly parallel genome-wide expression profiling of individual cells using nanoliter droplets. Cell, 161(5):1202–1214, May 2015. URL: https://doi.org/10.1016/j.cell.2015.05.002, doi:10.1016/j.cell.2015.05.002.

[expMLM+20] (1,2,3)

Elisabetta Mereu, Atefeh Lafzi, Catia Moutinho, Christoph Ziegenhain, Davis J. McCarthy, Adrián Álvarez-Varela, Eduard Batlle, Sagar, Dominic Grün, Julia K. Lau, Stéphane C. Boutet, Chad Sanada, Aik Ooi, Robert C. Jones, Kelly Kaihara, Chris Brampton, Yasha Talaga, Yohei Sasagawa, Kaori Tanaka, Tetsutaro Hayashi, Caroline Braeuning, Cornelius Fischer, Sascha Sauer, Timo Trefzer, Christian Conrad, Xian Adiconis, Lan T. Nguyen, Aviv Regev, Joshua Z. Levin, Swati Parekh, Aleksandar Janjic, Lucas E. Wange, Johannes W. Bagnoli, Wolfgang Enard, Marta Gut, Rickard Sandberg, Itoshi Nikaido, Ivo Gut, Oliver Stegle, and Holger Heyn. Benchmarking single-cell termrna-sequencing protocols for cell atlas projects. Nature Biotechnology, 38(6):747–755, Jun 2020. URL: https://doi.org/10.1038/s41587-020-0469-4, doi:10.1038/s41587-020-0469-4.

[expSAEC+19]

Mandeep Singh, Ghamdan Al-Eryani, Shaun Carswell, James M. Ferguson, James Blackburn, Kirston Barton, Daniel Roden, Fabio Luciani, Tri Giang Phan, Simon Junankar, Katherine Jackson, Christopher C. Goodnow, Martin A. Smith, and Alexander Swarbrick. High-throughput targeted long-read single cell sequencing reveals the clonal and transcriptional landscape of lymphocytes. Nature Communications, 10(1):3120, Jul 2019. URL: https://doi.org/10.1038/s41467-019-11049-4, doi:10.1038/s41467-019-11049-4.

[expSNL+17]

Valentine Svensson, Kedar Nath Natarajan, Lam-Ha Ly, Ricardo J. Miragaia, Charlotte Labalette, Iain C. Macaulay, Ana Cvejic, and Sarah A. Teichmann. Power analysis of single-cell termrna-sequencing experiments. Nature Methods, 14(4):381–387, Apr 2017. URL: https://doi.org/10.1038/nmeth.4220, doi:10.1038/nmeth.4220.

[expTYG+18]

Bosiljka Tasic, Zizhen Yao, Lucas T. Graybuck, Kimberly A. Smith, Thuc Nghi Nguyen, Darren Bertagnolli, Jeff Goldy, Emma Garren, Michael N. Economo, Sarada Viswanathan, Osnat Penn, Trygve Bakken, Vilas Menon, Jeremy Miller, Olivia Fong, Karla E. Hirokawa, Kanan Lathia, Christine Rimorin, Michael Tieu, Rachael Larsen, Tamara Casper, Eliza Barkan, Matthew Kroll, Sheana Parry, Nadiya V. Shapovalova, Daniel Hirschstein, Julie Pendergraft, Heather A. Sullivan, Tae Kyung Kim, Aaron Szafer, Nick Dee, Peter Groblewski, Ian Wickersham, Ali Cetin, Julie A. Harris, Boaz P. Levi, Susan M. Sunkin, Linda Madisen, Tanya L. Daigle, Loren Looger, Amy Bernard, John Phillips, Ed Lein, Michael Hawrylycz, Karel Svoboda, Allan R. Jones, Christof Koch, and Hongkui Zeng. Shared and distinct transcriptomic cell types across neocortical areas. Nature, 563(7729):72–78, Nov 2018. URL: https://doi.org/10.1038/s41586-018-0654-5, doi:10.1038/s41586-018-0654-5.

[expZLL+19] (1,2,3)

Xiannian Zhang, Tianqi Li, Feng Liu, Yaqi Chen, Jiacheng Yao, Zeyao Li, Yanyi Huang, and Jianbin Wang. Comparative analysis of droplet-based ultra-high-throughput single-cell termrna-seq systems. Molecular Cell, 73(1):130–142.e5, Jan 2019. URL: https://doi.org/10.1016/j.molcel.2018.10.020, doi:10.1016/j.molcel.2018.10.020.

[expZTB+17]

Grace X. Y. Zheng, Jessica M. Terry, Phillip Belgrader, Paul Ryvkin, Zachary W. Bent, Ryan Wilson, Solongo B. Ziraldo, Tobias D. Wheeler, Geoff P. McDermott, Junjie Zhu, Mark T. Gregory, Joe Shuga, Luz Montesclaros, Jason G. Underwood, Donald A. Masquelier, Stefanie Y. Nishimura, Michael Schnall-Levin, Paul W. Wyatt, Christopher M. Hindson, Rajiv Bharadwaj, Alexander Wong, Kevin D. Ness, Lan W. Beppu, H. Joachim Deeg, Christopher McFarland, Keith R. Loeb, William J. Valente, Nolan G. Ericson, Emily A. Stevens, Jerald P. Radich, Tarjei S. Mikkelsen, Benjamin J. Hindson, and Jason H. Bielas. Massively parallel digital transcriptional profiling of single cells. Nature Communications, 8(1):14049, Jan 2017. URL: https://doi.org/10.1038/ncomms14049, doi:10.1038/ncomms14049.

[expZVP+17]

Christoph Ziegenhain, Beate Vieth, Swati Parekh, Björn Reinius, Amy Guillaumet-Adkins, Martha Smets, Heinrich Leonhardt, Holger Heyn, Ines Hellmann, and Wolfgang Enard. Comparative analysis of Single-Cell termRNA sequencing methods. Mol Cell, 65(4):631–643.e4, February 2017.