微星检测方法概述

微卫星序列是分布在人类基因组中数百万个位点(基因座)的短串联重复序列。

通常是1-6重复序列(如单核苷酸、双核苷酸重复序列等。)串联排列10-50次。

微卫星不稳定性(MSI/MSI-H),由于DNA复制过程中错配修复(MMR)基因的功能缺陷,导致串联序列发生插入和缺失突变,导致MS序列长度发生变化。

这种类型的体细胞突变会导致抑癌基因的失活或其他非编码调控序列的破坏,从而起到致癌作用。

作为一种独特的分子表型,MSI存在于许多癌症中,包括结直肠癌、子宫内膜癌、胃癌、前列腺癌、卵巢癌和胶质母细胞瘤。

MSI可以预测实体瘤免疫检查点阻断治疗的疗效。因此,MSI状态的检测对肿瘤的临床诊断和预后具有重要意义。

目前,主要有三种MSI检测方法:

IHC法通过细胞核内四种DNA错配修复蛋白(MLH1,PMS2,MSH2,MSH6)的表达,使用相应的抗体来确定细胞内是否存在错配修复功能缺陷。

如果其中任何一个蛋白缺失,就会判断为错配修复缺陷(dMMR),相当于MSI-H;如果四种蛋白都表达,则判断错配修复功能正常(pMMR),即MSI-L或MSS。

它的优势在于应用广泛,可以确定肿瘤细胞中缺失哪些MMR蛋白。

然而,IHC本身是主观的,受抗体质量和实验因素的影响,有时一些定性的蛋白质变化不能被检测出来,这导致MMR结果偶尔出现假阳性。

多重荧光PCR结合毛细管电泳主要是通过PCR扩增出一个特定的微卫星序列,然后通过毛细管电泳比较肿瘤组织和正常组织微卫星序列长度的差异来判断该位点是否存在MSI现象。

这种检测方法是公认的MSI检测的金标准,也是应用最广泛的方法。

首先,使用了美国国家癌症研究所(NCI)推荐的五个基因座:

通过以下方法判断结肠直肠癌的MSI状态:

研究表明,MSS与MSI-L在肿瘤生物学特性上并无明显差异,因此MSI-L在临床上也被归为MSS。

后来有人指出,二核苷酸重复序列的位点敏感性低于单核苷酸重复序列,存在高度的个体多态性,需要与匹配的肿瘤和正常样本进行比较才能得出结果。因此,降低了检测的灵敏度。

因此,提出了五联体组,其包含五个单核苷酸重复位点:

不需要配对正常样本,性能较高,但在MSH6缺陷型肿瘤中性能不高。

目前使用较多的是Promega系统,包括:

PCR检测方法不仅弥补了IHC因非截短的错义突变而不能检测MSI的缺陷,而且具有良好的重复性。

但检测到的基因(面板)数量少,通量低,不能提供特定的基因突变信息,实验周期长。

随着高通量测序技术的发展,使用全基因组测序(WGS)、全外显子测序(WES)或靶向基因测序(TGS)来检测MSI变得越来越普遍。

与PCR相比,NGS方法具有更高的通量、更宽的基因范围、更高的灵敏度和特异性,并且可以使用一个测序数据与靶突变检测和肿瘤突变负荷(TMB)一起使用。

在已公布的NGS方法中,一般以PCR检测的结果作为金标准,以结果的一致性作为比较标准来评价NGS检测的性能。

NGS检测方法有很多种,大多数都需要配对正态样本。我们可以把这些方法分为两类。

在这里,你可能需要解释什么是重复计数。

上图中,我们假设微卫星位点是10个连续的A,在这个位点上有10个阅读比对,每个阅读比对的长度不同。由此,我们可以计算重复计数。

Repeat是所有读取的长度,count是每个长度支持的读取次数。

分析流程和原理大致可以用下面的流程图来描述。

包括MSIsensor、mSINGs、MANTIS、Cortes-Ciriano、MSI-ColonCore等。

分析流程与上面类似。

包括MSIseq指数、MSIseq/NGS分类器、Nowak等。

MSIsensor由MS基因座两端5bp的侧翼序列定位,算法原理如下

MSINGs方法还计算了各站点的不稳定性,以不稳定站点的比例作为样本的分值。如果大于阈值,则认为是不稳定的。

MANTIS还根据肿瘤及其配对正常样本的重复计数分布计算样本的不稳定状态。

它将样本中每个位点的重复计数分布作为一个向量,对这两个向量计算欧氏距离、余弦相似度等度量得分,取所有位点的平均值作为样本的不稳定得分。

具体计算方法如下:

如你所见,这种方法受到了严格的控制。

该方法基于RNA-seq数据。通过计算两个指标的比值PI/PD,如果比值小于0.9,则认为该样本为MSI。

其中PI代表微卫星位点插入突变的比例,PD代表微卫星位点缺失突变的比例。

该方法通过计算样本中单核苷酸替换率、小片段碱基插入和缺失率等突变信息构建特征,然后应用机器学习算法构建分类器。

具体功能包括:

该方法使用WES数据,选择线性回归、决策树、随机森林和朴素贝叶斯四种算法。最优算法是决策树,不需要成对的正态样本。

出自:字母学习手册。