前一期系列推文,我们介绍了Ki-67的概念、发现、及其作为乳腺癌预后生物标志物、及对化疗反应的预测作用等内容,那么本期,我们就来看看国际Ki-67乳腺癌工作组对推进Ki-67指数评估方法的标准化而做的研究吧!
上述许多已发表研究中出现的一个核心问题是缺乏Ki-67指数评估方法的标准化。IKBCWG成立于2009年,旨在解决乳腺癌中Ki-67评估方法缺乏标准化的问题,包括所有分析前和分析变量。此外,IKBCWG希望提供一个中央存储库,让病理学界对当前与Ki-67相关的研究以及涉及Ki-67的临床实践进行评估。表1列出了IKBCWG确定的对乳腺癌Ki-67评估的有效性和可重复性具有潜在影响的变量。与乳腺癌的其他生物标志物(如ER、PR和HER-2)一样,使用哪种类型的标本(空心针活检或手术切除)对Ki-67进行评估这一问题被提出。在回顾过去10年已发表研究的文献时,Kalvala等人证明,来自同一患者的这2个标本结果一致性从70.3%到92.7%不等,Ki-67的评估方法再次由各个实验室独有的方法确定。Kalvala及其同事得出结论,无法确定哪个是首选标本,但更重要的结论是,迫切需要就Ki-67检测达成共识。但IKBCWG对120例乳腺癌进行的一项更明确的研究,使用 Ki-67指数的定量图像分析评估证明,与相应的切除标本比较,空心针活检组织检查分析比手术切除样品获得更高(~5%)的Ki-67评分。此外,有人提出,这种差异与固定等分析前因素有关。其他人已经研究了此类分析前因素的影响,在2016年对小鼠使用HT-69异种移植物的研究中,对切除肿瘤来说,延长福尔马林固定时间对Ki-67指数有显著影响。事实上,当固定时间从24h延长到48h时,该指数从15%下降到5%。在一项对人类乳腺癌手术标本的研究中发现了Ki-67指数的类似下降,固定时间越长,减少的幅度就越大。应该注意的是,在同一标本中,观察ER或HER-2表达随固定时间的变化时,并未发现IHC信号的平行下降。他们还研究了固定不当(如3h)的影响,这导致Ki-67指数急剧下降(但同样,在对同一样本进行的ER或HER-2 IHC研究中无该现象)。但在另一项采用空心针乳腺癌活检的研究中,未发现短暂固定对Ki-67指数的影响,即使在固定45至90min的标本中,也显示出与常规固定标本的高度总体一致性。显然,空心针活检的固定时间不如切除标本那么重要,因此更有理由推荐空心针活检标本。
世界各地的各种实验室采用4种主要方法来计算 Ki-67 指数。这些包括:(a) "目测"估计;(b) 视觉计数,使用显微镜或查看软件(实时计数);(c) 对相机拍摄的或数字图像进行手动计数;(d) 自动(即基于图像分析)计数方法。Ki-67指数的 "目测"一般是指对Ki-67阳性肿瘤细胞的百分比进行估计,通常在10×物镜下进行,目前仍被广泛采用;据文献记载,目测是一种比正式计数更节省时间的方法。但许多已发表的研究也说明目测的Ki-67评估方法不准确的、可重复性差。例如,在一项对27例胃肠道神经内分泌癌的研究中,Ki-67的评估也是临床上需要的肿瘤分类,将Ki-67指数的"目测"与2000个细胞的手工和数字计数进行比较,当与量化的Ki-67分数相比较时,"目测"被证明是一种不适当的方法,只有55%至93%的病例有正确的分数。在另一个乳腺癌Ki-67指数测定的比较中,"目测"与实际计数方法的相关性非常差。作为对Ki-67计数方法系统评估的一部分,在IKBCWG的第一期出版物中,在单个核心组织微阵列(TMA)背景下,8个不同的实验室(每个实验室都有发表一项或更多Ki-67研究的病历记录)使用他们自己的Ki-67评估方法对100个乳腺癌样本进行评估,并在这组“专家”中比较结果。他们使用了广泛的方法,有些使用了“目测”,有些使用了“实时计数”。类内相关系数(ICC)被用来评估实验室间的变异性(良好的可靠性一般指ICCs在0.6-0.8之间,优秀的可靠性指ICCs超过0.8)。由IKBCWG主办的这组实验的首次评估显示,计算出的ICC在0.59(当玻片局部免疫染色时)和0.71(当玻片集中免疫染色时)之间。IKBCWG的结论是,鉴于这种差异性,乳腺癌Ki-67评估的临床效用仍然难以捉摸,并且怀疑评分方法的差异性是造成这种不一致的主要原因。在第二项研究中,IKBCWG通过指示实验室采用标准化的规定评分系统直接解决了上述问题。这种方法在核心区的顶部和底部计数了250个细胞,观察者使用模拟台式细胞学细胞计数器的“虚拟”细胞计数器,并以“打字机”方式观察每个肿瘤细胞,计数为阳性或阴性。当参与研究的16个实验室中的每一个都观察到相同的切片时,使用这种标准化方法获得了非常高的ICC,例如0.94。尽管如此,在检查个别病例时,在某些病例中仍然存在临床上重要的差异,其中发现了10% -20%的临界范围。在IKBCWG的第三项研究中,对3种不同的Ki-67评分方法进行了直接比较,承认这是一个比先前研究中使用的规定的“打字机”计数方法更“真实”的测试,计数方法如下:(a) 全局,计算了4个区域的100个单元格;(b)全局加权(包括总面积的加权估计);(c) 热点,计算500个细胞的单个视野。在这3种方法中,只有未加权的全局分数符合指定的成功标准,ICC为0.87。这一发现的意义在于,在手动选择区域且无需特殊仪器的情况下,在TMA上对Ki-67进行评分时可以获得观察者间的高度一致。在后续研究中使用整个切片而不是TMA,发现相同的ICC 为0.87。然而,在KBCWG的后两项研究中,注意到仍有少量但数量可观的个案表明实验室之间存在巨大差异。数字病理学和图像分析提供了显著提高诊断病理学准确和可重复的可能性,包括对生物标志物的评估。在IKBCWG进行的下一项国际研究中,该方法类似于第一项研究,在这项研究中,实验室被邀请使用他们倾向的任何技术来评估Ki-67指数。在这项采用图像分析的研究中,集中免疫染色的载玻片被送到14个不同的实验室进行Ki-67指数的数字扫描和自动评估;这些实验室总共使用了10种不同的图像分析程序。使用ICC明显高于0.8的标准的实验是成功的,ICC自动平均分数为0.83,远高于早期研究中手动评分时发现的0.71。因此,基于非标准化图像分析的Ki-67评估的ICC与使用标准化方法进行视觉评估的Ki-67评估的 ICC相当。事实上,在后续研究中,通过限制参与者仅使用3种更流行的图像分析系统(HALO、QuantCenter和QuPath)中的一种,获得了更好的ICC,平台内 ICC超过0.97,平台间ICC为0.95。这些IKBCWG研究强烈表明,图像分析比手动计数技术更容易标准化,并且可在乳腺癌的Ki-67评估中产生高度可重复的独立于平台、独立于操作员和独立于供应商的评分。然而,应注意的是,无论采用视觉或自动评分系统,使用标准化的评估方法对切除的活体组织获得的ICC几乎是相同的(表2)。表2. IKBCWG研究中记录的Ki-67评估可重复性概要抗体名称 | 产品编号 | 克隆号 | 细胞定位 |
Ki-67 | RMA-0731 | MXR002 | 胞核 |
MAB-0672 | MX006 | 胞核 |
参考文献:
Gown Allen M.The Biomarker Ki-67: Promise, Potential, and Problems in Breast Cancer[J]. Applied Immunohistochemistry & Molecular Morphology, DOI:10.1097/PAI.0000000000001087.更多信息,请详询:800-8581156 或 400-889-9853