测序技术存在不可能三角,各类技术互为补充。
基因测序技术包括 Sanger 测序技术、高通量测序技术、单分子测序技术。此处需要先明晰一下各个测序技术之前的关系。Sanger 测序、高通量测序、单分子测序之间并非是代际关系,不适合用“一代”“二代”“三代”或“四代”来进行指代。各个测序技术之间方法学不同、测序原理不同,在测序精确度、单位时间数据产量、平均序列读长、单位数据量成本等主要评价指标上各有优劣,各自有独特的定位和适用场景,更多是互补关系。
1975 年,英国生物化学家 Fred Sanger 发明了采用 DNA 聚合酶和双脱氧链终止测定 DNA 核苷酸序列的方法,此后这种方法又被称为Sanger 测序法。Sanger 测序法的原理是:由于 ddNTP 的 2′和 3′都不含羟基,其在DNA的合成过程中不能形成磷酸二酯键,因此可以用来中断 DNA 合成反应,在4 个DNA合成反应体系中分别加入一定比例带有放射性同位素标记的ddNTP(分为:ddATP,ddCTP,ddGTP 和 ddTTP),通过凝胶电泳和放射自显影后可以根据电泳带的位置确定待测分子的 DNA 序列。

Sanger 测序的独特优势是一次可以读取 600-1000bp 左右的碱基,读长高于高通量测序,同时准确率高,可达到 99.99%,是验证测序准确性的“金标准”。不过,Sanger 测序技术一个反应只能得到一条序列,测序通量低,且测序成本较高,一次人全基因组测序可能需要花费上千万美金,无法满足现代科学发展对生物基因序列获取的迫切需求。
高通量测序是一种大规模平行测序法,是将待测基因处理成短的DNA片段,通过簇生成或者单分子多拷贝聚集的方式“种”在检测芯片表面,然后通过生化循环完成一个个酶促反应实现循环列阵合成测序。 高通量测序包含三种主要方式,分别是桥式 PCR 扩增与边合成边测序结合的测序技术、乳液 PCR 与半导体合成测序技术、DNA 纳米球与联合探针锚定聚合技术结合的测序技术。
高通量测序技术以其出色的成本效益、高通量和准确性,成功弥补了Sanger 测序在成本、通量和人力需求等方面的不足。它能够一次性对数百万至数十亿条核酸分子进行序列测定,显著降低了测序成本,提高了测序速度,并保持了高准确性。这一技术突破使得个人全基因组测序成本从数十万美金降低至数百美金,有力推动了基因测序技术在各个领域的广泛应用。
然而,高通量测序技术的读长较短,一般为 50bp-300bp,在结构变异检测和基因组组装等对读长有更高要求的场景中,这一缺陷变得尤为明显。另外,高通量测序建库的时间和方法相对单分子测序更具挑战性。因此,高通量测序技术需要提升读长和操作(特别是建库)的简便性。
尽管高通量测序技术具有高通量和高准确性的优势,但由于读长较短,导致其只能覆盖人类基因组约 85%的区域。越来越多的证据表现,尚未覆盖的15%,特别是其中的结构变异等区域,与疾病的发生发展有更密切的关系。比如,在罕见病诊断中,高通量测序的检出率大概只有 50%,在遗传性乳腺癌诊断中,大约只能发现 10%明确的致病位点。 长读长测序有望解决这些问题,成了基因测序技术重要的发展方向。2023年1月,《Nature Methods》杂志将“2022 年度方法”授予长读长测序技术。2022年 4 月,《科学》杂志刊登的人类基因组完成最后 8%,就是利用了长读长测序的优势。 目前,长读长测序的典型技术是单分子测序。单分子测序技术测序过程无需进行PCR 扩增,实现了长读长和单分子级别的测序,一次可读取长达数万碱基的片段,大大降低了拼接难度,减少了过去无法定位的漏洞。不过,相较高通量测序技术,单分子测序技术的单个碱基错误率在 1%-10%左右,高于高通量测序技术。单分子测序技术可以细分为两种技术,分别是纳米孔测序和单分子荧光测序。
纳米孔测序的核心是利用直径为 1-2nm 的纳米孔,该纳米孔被固定在电阻膜上,再利用膜两边的电势差配合马达蛋白的牵引力,将单个单链核酸分子进入纳米孔,通过识别各种碱基通过纳米孔时产生的信号变化,从而实现测序。根据技术路径,可以将纳米孔测序技术分为链测序法、标签测序法和外切酶测序法;根据纳米孔类型,可以将纳米孔测序仪分为生物纳米孔和固态纳米孔。目前最具有代表性的纳米孔测序仪来自 Oxford Nanopore,其采用的是生物纳米孔。国内,齐碳科技采用的是生物纳米孔,儒翰基因、罗岛纳米、丽纳芯、纳生科技采用的是固态纳米孔。
纳米孔测序技术的优势体现在多个方面:(1)长读长:纳米孔测序的读长可达到 5000bp 以上,相比高通量测序的50bp—300bp,能够更快地完成测序,使得基因组拼接更加完整。(2)实时测序:高通量测序在上机测序之后,需等到测序完成后,才能够拿到数据报告进行分析。纳米孔测序可以实时传输数据、实时分析,研究人员能够更快地获得数据并进行后续分析。 (3)小巧、便携:高通量测序一般仪器较大,且基于荧光学原理,拥有大量精密零件,仪器移动后需要专业工程师校准后再使用。纳米孔测序仪小巧,便携性强,方便在各种场景下使用。 (4)DNA、RNA 直接测序:纳米孔测序可以直接对 RNA 链进行测序,能够保留并检测 RNA 碱基修饰信息,对 poly (A)尾长进行相对准确的估算,同时进行全长异构体分析,还原真实 RNA 特征。 基于这些优势,疾控、海关、医院等场所对纳米孔测序的需求在快速增长。

目前全球最具有代表性的单分子荧光测序技术是 PacBio 的单分子实时测序(SMRT)技术平台,核心是一种被称为零模波导(Zero-Mode Waveguide, ZMW)的纳米结构。 其测序原理是:DNA 聚合酶和模板结合,4 色荧光标记4 种碱基,在碱基配对阶段,不同碱基的加入,会发出不同光,根据光的波长与峰值可判断进入的碱基类型。同时这个 DNA 聚合酶是实现超长读长的关键之一,读长主要跟酶的活性保持有关,主要受激光对其造成的损伤所影响。
单分子实时测序技术的优势体现在: (1)准确性:通过滚环复制,消除了碱基读取不准的缺陷,实现了超过99.9%的准确率。简单来说就是单分子测序反应中产生的每个错误都被记录下来,通过多次重复测序进行纠正。 (2)长读长:提供 15000-20000 个碱基对或更长的读长,使研究者能够更好地组装参考级基因组和测序全长 RNA 转录本。 (3)均一的基因组覆盖率:通过消除 PCR 扩增所带来的偏差,使研究者能够分析其他技术通常难以获取的基因组区域,如难以测序的AT 和GC 富含区域、高度重复区域、长同源聚合物和回文序列。(4)直接甲基化检测:通过直接从样本中提取 DNA 进行测序而不进行扩增,可以通过测量碱基的插入动力学来检测碱基修饰。这允许在单个实验中捕获序列和甲基化信息,无需额外的预处理步骤。 单分子实时测序技术的不足是成本高昂,仪器也较大,优缺点明显,更适合对单分子测序准确性要求高,对成本不敏感的客户。