单细胞转录组分析中,为什么需要去除双细胞doublet removal?

生信学长
2025年08月13日
单细胞分析
单细胞转录组分析中,为什么需要去除双细胞doublet removal?

单细胞RNA测序实验中,理想情况下每个油滴应该只包含一个细胞。然而实际操作中,部分油滴会意外包入两个或多个细胞,形成所谓的"doublet"。为什么需要在下游分析前移除这些doublet细胞?它们会对分析结果造成什么影响?


Doublet形成流程
Doublet形成流程

图 1 单细胞捕获过程中doublet形成的机制:从细胞悬液制备到最终的质控过滤流程。

在10x Genomics等液滴微流控平台中,细胞悬液通过微流控芯片被分散到含有反应试剂的纳升级油滴中。虽然平台设计目标是每个油滴包含单个细胞,但由于泊松分布的随机性,一定比例的油滴会包含多个细胞,这就是doublet的来源。

Doublet的识别特征

Doublet细胞最显著的特征是异常高的基因检测数量和UMI计数。由于doublet实际上是两个细胞的转录本混合,其总RNA含量约为单细胞的两倍。这种特征使得doublet在基因数-UMI散点图中形成明显的高表达区域,与正常单细胞群体分离。

Doublet检测
Doublet检测

图 2 单细胞与双细胞在基因检测数和UMI计数上的分布差异,红色为doublet,蓝色为正常singlet。

更复杂的是,doublet还会表现出多种细胞类型的混合转录特征。例如,如果一个doublet包含一个T细胞和一个B细胞,那么它会同时表达T细胞和B细胞的标记基因,在聚类分析中可能被错误识别为一种新的细胞类型或过渡状态。

浓度依赖的doublet比例

Doublet的形成率与细胞悬液的浓度密切相关。根据泊松分布原理,细胞浓度越高,多个细胞同时进入同一油滴的概率就越大。在标准的10x实验中,当目标捕获10,000个细胞时,预期的doublet率约为8-10%。

浓度效应
浓度效应

图 3 细胞浓度与doublet形成率的关系:浓度增加会显著提高doublet比例。

这种浓度依赖性解释了为什么在设计单细胞实验时需要仔细优化细胞浓度。过低的浓度会降低细胞捕获效率,而过高的浓度则会增加doublet比例,两者都会影响最终的数据质量。

对下游分析的影响

如果不移除doublet,会对后续分析造成多重负面影响。首先,doublet会在聚类分析中形成虚假的细胞亚群,导致错误的细胞类型注释。其次,在差异表达分析中,doublet的异常高表达会影响统计检验的结果,产生假阳性信号。

在轨迹分析中,doublet经常被误认为是细胞状态转换的中间态,从而构建出错误的发育轨迹。在细胞-细胞通讯分析中,doublet的混合转录特征可能被错误解读为共表达模式,导致虚假的调控网络推断。

最后总结,

Doublet removal是单细胞数据质控的重要环节,直接关系到下游分析结果的可靠性。随着DoubletFinder、Scrublet等专业算法的发展,doublet检测的准确性不断提高。对于追求高质量单细胞分析的研究者来说,在数据预处理阶段投入时间进行细致的doublet检测和移除,是确保分析结果科学性的必要步骤。


以上就是今天的内容,希望对你有帮助!欢迎点赞、在看、关注、转发。