5 月 18 日,自然遗传学上发表了一项涵盖 26.6 万名女性的遗传研究的分析。该研究表明,人类基因组中有 32 种新的乳腺癌风险变异体,DNA 变异可能与患乳腺癌的风险相关。其中,有 15 个变异体与 1 种或多种特定的乳腺癌亚型独立相关;15 个变异体中的 7 个与肿瘤等级有关。这项研究是与许多机构的研究人员合作进行的,包括美国国家癌症研究所,哈佛大学的 T.H.Chan 公共卫生学院,剑桥大学和荷兰的癌症研究所。
这一发现为更精确更个体化的乳腺癌分子诊断打下了基础。
分子诊断是指应用分子生物学方法检测患者体内遗传物质的结构或表达水平的变化而做出诊断的技术,它将实验室医学与分子遗传学的知识和技术结合起来。从技术的角度来说,主要分为基因测序、基因芯片和聚合酶链式反应(PCR)等。
三种技术临床应用的侧重点有所不同,其中 PCR 主要用于病原微生物核酸检测;基因芯片主要用于个体化用药基因检测,基因测序则主要用于 NIPT、肿瘤监测、胚胎植入前遗传学诊断 / 胚胎植入前遗传学筛查(PGS/PGD)、心血管疾病筛查等。
得益于分子生物学和基因组技术领域的发现,在过去的发展中,分子诊断发生了巨大的变革。
图|分子诊断发展历程(来源:Molecular Diagnostics 第三版)
分子诊断萌芽期
1949 年,Linus Pauling 等人在医学词汇中引入了 “分子疾病”(Molecular Disease)一词,他们发现是血红蛋白分子出现缺陷导致了镰状细胞贫血。他们的发现为分子诊断奠定了基础,尽管这场革命要在许多年之后才正式发生。
分子诊断的种子萌芽于重组 DNA 技术。cDNA 基因的克隆和测序,在当时为研究人员提供了各种基因序列的基础知识。1976 年,Kan YW 等人首次利用从胎儿成纤维细胞中分离的 DNA 进行了地中海贫血的产前诊断;此外,该团队还于 1978 年确定了非裔人群的镰状细胞等位基因。这一突破为研究人员提供了为其他遗传疾病建立类似诊断方法的手段,如苯丙酮尿症、囊性纤维化等。然而,当时必须克服一个重大的技术瓶颈,只有通过从受影响个体构建基因组 DNA 库,才能鉴定致病性变异,以便首先克隆变异等位基因,然后确定其核苷酸序列。许多人珠蛋白基因突变最早是通过这种方法识别出来的。
同时,人们开发了一系列针对患者 DNA 中的致病性变异体的检测方法,为检测遗传病相关的基因奠定了基础。第一种方法是使用对抗切割试剂的保护来检测 RNA/RNA 或 RNA/DNA 异源双链体中的错配碱基 (Myers 等,(1985)Science 230:1242)。此外,也可以使用变性梯度凝胶电泳(DGGE)来测定突变体或野生型片段在含有变性剂梯度的聚丙烯酰胺凝胶中的移动(Myers 等,(1985)Nature 313:495)。利用这种方法,人们鉴定出许多变异序列等位基因,这使得设计短合成寡核苷酸作等位基因特异探针成为可能。这种实验设计很快就被用于检测地中海贫血相关的基因突变,Orkin SH 及 M. Pirastu 的研究团队均于 1983 年发表了相关成果。
尽管世界各地的不同实验室都在加紧努力,但由于当时技术存在未克服的难点,耗费时间长、成本高,且在 DNA 水平上对遗传性疾病的诊断欠成熟,因此分子诊断在当时仍不适合走向临床。随着聚合酶链式反应(Polymerase chain reaction,PCR)于 1983 年被发现,分子诊断进入了黄金时代。
聚合酶链式反应引发大革命
1985 年,美国 PE-Cetus 公司人类遗传研究室的 Mullis 等人阐述了具有划时代意义的 PCR 技术。其原理类似于 DNA 的体内复制,只是在试管中提供体外合成合适的条件——模版 DNA,寡核苷酸引物,dNTP,DNA 聚合酶,合适的缓冲体系,DNA 变性、复性及延伸的温度与时间。
最初使用的大肠杆菌 DNA 聚合酶 Klenow 片段不耐热,每次加热变性 DNA 后都要重新补加,耗时、费力、易出错。1988 年,Saiki 等人在黄石公园温泉中分离的一株水生嗜热杆菌 (thermus aquaticus, Taq) 中提取到一种耐高温 DNA 聚合酶,这种酶耐高温的性质使其热变性时不会被钝化,不必在每次扩增反应后再加新酶,从而极大地提高了 PCR 扩增的效率。Taq 酶的发现使得 PCR 真正变为现实,为其自动化铺平了道路,极大地促进了分子诊断的发展。PCR 技术的问世,标志着传统基因诊断发展到更全面的分子诊断技术。
图|水生嗜热杆菌(来源:Wikipedia)
PCR 最强大的特点是它的指数扩增能产生大量的目标序列拷贝,缩短了检测所用的时间。此外,PCR 显著减少了常规分子诊断中放射性的使用,这使得分子诊断能够进入临床阶段为人们提供服务,例如遗传疾病筛查、产前诊断,以及鉴定未知的基因变异。
PCR 的发现也为基于扩增 DNA 的多种检测方案的设计和开发提供了基础。一般来说,PCR 要么用于产生待分析的 DNA 片段,要么是检测方法的一部分。1985 年,Saiki 等人首先应用 PCR 放大β球蛋白基因的片段,用标记的寡核苷酸探针杂交和限制性内切酶水解,电泳分离后根据片段大小诊断镰状细胞贫血。在接下来的几年里,研究人员发现了更多的基因变异的检测方法,根据检测等位基因变异的方式,这些技术大致可分为三类:
1、酶法
Saiki 等人于 1985 年公布的 PCR-RFLP(限制性片段长度多态性聚合酶链反应)是第一种被广泛使用的检测方法,其原理是先 PCR 扩增相应目的片段,而后进行限制性内切酶切反应,电泳后观察比较限制性图谱来分析序列之间的差异。PCR-RFLP 大大提高了目的 DNA 的含量和相对特异性,而且方法简便,分型时间短。
随后,基于二级结构对原 DNA 序列的依赖性,人们设想了许多利用酶来检测变异等位基因的方法。Mashal 等人于 1995 年发现,T4 核酸内切酶能够识别出 12 中错配的碱基并在错配碱基的附近进行切割,酶切产物跑变形胶或中性胶即可检测出是否有突变。Saleeba 等人则是利用对抗切割试剂的保护,检测 RNA/RNA 或 RNA/DNA 双链体中的错配碱基。另一种用于变异检测的方法是寡核苷酸连接检测(OLA),由 Landegren 等人于 1988 年发明,寡核苷酸连接检测也是最广泛使用的下一代测序方法的主要原理之一。
2、电泳
这一类检测方法的特点是根据突变等位基因在变性或非变性条件下不同的电泳迁移率,设计用于筛选已知或未知突变的不同方法。
单链构象多态性(SSCP)和异源双链分析是最早用于检测基因组位点分子缺陷的方法之一。单链构象多态性是一种基于单链 DNA 构象差别的点突变检测方法,相同长度的单链 DNA 如果顺序不同,甚至单个碱基不同,就会形成不同的构象,在电泳时泳动的速度不同。将 PCR 产物经变性后,进行单链 DNA 凝胶电泳时,靶 DNA 中若发生单个碱基替换等改变时,就会出现泳动变位(Mobility Shift),多用于鉴定是否存在突变及诊断未知突变。异源双链分析则是由于突变和野生型 DNA 形成的异源杂合双链 DNA 存在碱基不配对区,可以形成环形不配对的部分,在非变性凝胶中电泳时,会产生与相应的同源双 DNA 不同的迁移率。异源双链分析对一些不能用 SSCP 检出的突变有互补作用,两者结合使用,可使突变检出率提高到近 100%。这种方法具有自动化的潜力,使高通量分析成为可能。
变性梯度凝胶电泳(DGGE)和温度梯度凝胶电泳(TGGE)同样适用于变异等位基因的检测。
DGGE 的原理基于当双链 DNA 在变性梯度凝胶中进行到与 DNA 变性湿度一致的凝胶位置时,DNA 发生部分解链,电泳适移率下降,当解链的 DNA 链中有一个碱基改变时,会在不同的时间发生解链,因影响电泳速度变化的程度而被分离。在 DGGE 的基础上,又发展出了温度梯度凝胶电泳。DGGE 和 TGGE 均有商品化的电泳装置,该法一经建立,操作也较简便,适合于大样本的检测筛选。
3、固相技术
这套技术构成了目前大多数基因突变检测技术的基础,因为它们具有易于自动化的额外优势,因此非常适合用于高通量突变检测。
借助反向点杂交技术,可以快速、准确、简便地检测已知突变,这种技术由 Saiki 等人于 1989 年研发,用于检测导致地中海贫血的基因变体,其原理是将寡核苷酸片段固定在膜上,作为扩增 DNA 的杂交靶点。此后这项技术不断发展,2002 年,Gemignani 等人首次将 DNA 寡核苷酸微阵列用于检测基因突变。
根据检测目的和检测特性不同,PCR 技术逐渐细分出二代 PCR 技术(半定量检测)及三代 PCR 技术(绝对定量检测)。与此同时,一代 DNA 测序技术(读长长、准确度高、通量低)和二代 DNA 测序技术(读长短、通量高)也相继被发明并被人们广泛使用。
后基因组时代的分子诊断
1990 年,人类基因组计划正式启动。2001 年 2 月,随着人类基因组序列初稿的公布,10 万个人类全长 cDNA 的测序已完成,分子生物学随之进入了一个前所未有的时代。
人类基因组序列初稿公布后,摆在研究人员面前最大的挑战是改进现有的突变检测技术,以实现对基因组突变的稳定、经济、快速且高通量的分析。自 2005 年以来,基因组技术得到了迅速的发展,部分旧的方法已经发展到适应日益增长的自动配型和高通量筛选的需求,新的高通量测序技术也已经问世。
利用变性高效液相色谱(DHPLC)检测致病性变异体的多态性变化是这一阶段内出现的新技术之一。DHPLC 在部分变性条件下,通过杂合与纯合二倍体在柱中保留时间的差异,发现 DNA 突变。DHPLC 既能够自动化、高通量进行,且除 PCR 之外,无需进行 PCR 引物修饰、购买特殊试剂、检测标记信号或作其它的样品处理,因此具有高通量检测、自动化程度高、灵敏度和特异性较高、检测 DNA 片段和长度变动范围广、相对价廉等优点,使其成为最强大的基因突变检测手段之一。此外,Ronaghi 分别于 1996 年与 1998 年提出了在固相与液相载体中进行测序的方法——焦磷酸测序(Pyrosequencing)。焦磷酸测序是由 4 种酶催化的同一反应体系中的酶级联化学发光反应,适用于对已知的短序列的测序分析,其可重复性、精确性和检测速度都十分优秀,为大通量、低成本、适时、快速、直观地进行单核苷酸多态性研究和临床检验提供了非常理想的技术操作平台。该技术进行改进后可以满足上百个核苷酸序列的测序工作,可以满足对重要微生物的鉴定与分型,特定 DNA 片段的突变检测和克隆鉴定等方面的应用。
这一阶段,PCR 技术出现了众多变体,其中一个重要进展是实时 PCR(Real-time PCR)的问世。1991 年,Holland 等人首先报告了使用不可延伸的寡聚核苷酸杂交探针,利用 DNA 聚合酶的 5'端外切酶活性检测 PCR 产物。该方法允许在反应的中间阶段直接检测 PCR 产物,将扩增和检测结合在一个步骤中,速度大大提高。20 世纪 90 年代中期,由电脑控制的较为完备的实时 PCR 系统纷纷出现,可以准确测定特定序列扩增出的单一拷贝,标志着实时 PCR 技术走向成熟。目前,实时 PCR 由于具有高通量、自动化程度高、体积小等优点,在分子诊断领域有着广泛的应用。
蛋白质组学也取得了长足的发展,有望成为分子诊断中不可或缺的工具。2001 年,Knezevic 等人使用抗体芯片对口腔鳞状细胞癌组织进行分析,发现上皮细胞的蛋白表达模式与口腔癌的进程相关;次年,Robinson 等人使用自体抗原微阵列鉴定在自身免疫性疾病中诱导免疫响应的蛋白质,同年,Hanash 等人提出白血病可根据不同的蛋白谱(Protein Profiling)分为不同的亚型。这些研究表明蛋白质组模式分析可以作为多种疾病的筛查工具。如今,质谱仪已经成为高通量蛋白质组学测序的利器,能够解析体液中的许多蛋白质和肽,可能将彻底改变基于蛋白质的疾病诊断。
分子诊断的发展不仅对疾病筛查产生积极影响,也为其他学科提供了技术手段。例如,有助于阐明不同个体间由遗传变异决定的、涉及药物代谢、药物疗效和不良反应等方面的差异,以预测个体对药物治疗的反应,并合理设计新药物或改进现有药物;确定可能含有非转基因种子的转基因产品,或含有添加剂和经基因改造或由转基因生物或动物品系基因型生产的调味品。同时,分子诊断也为法医学带来了重大变革。