我也来解读下HARMONi两次OS数据的意义

用户头像
子悠论道
 · 上海  

$康方生物(09926)$ $Summit Therapeutics(SMMT)$

这两天大家争论比较多,不过我觉得有些非专业人士对数据本身还有些理解上偏差。所以查了些资料,单就数据客观评论一下。首先请看数据事实:

5月30日,SMMT已公布HARMONi的3期数据:最终分析显示,OS风险降低21%(HR=0.79,p=0.057),未达到统计显著性(阈值p=0.0448);不过SMMT说要继续随访。当天SMMT股价跌30%=18.21$,康方跌3.7%=80.7HK$。

9月7日,SMMT在WCLC2025年会上公布了HARMONi继续随访4.5个月后的数据,显示OS风险降低22%(HR=0.78,p=0.0332)。这里看到OS HR得到改善,且p值更加显著(小于试验设定阈值p=0.0448)。

其它亚组数据,脑转移信号,安全指标之类的对本文不甚重要,所以就不展开了。

好了,基于以上事实。我们来解答几个问题。

问题一:为何通过更长随访,OS值(HR和p值)会变化?

简单答案是:因为更长的随访时间积累了更多的“死亡事件”(总事件数增加),使得统计分析的数据更成熟、更稳定。

以下是详细解释:

总事件数(Number of Events)是关键

生存分析(如OS)的统计效力(Statistical Power)主要不依赖于随访患者的“数量”,而是依赖于观察到“事件”(在这里是死亡)的“数量”。

风险比(HR)的精确度和p值的显著性高度依赖于总事件数。事件数越多,估计值就越稳定,置信区间也越窄。

更长的随访如何起作用

初始最终分析时:试验达到了预设的最终分析所需的事件数(例如,计划需要观察到330次死亡事件)。此时计算出的HR=0.79,p=0.057。这个p值非常接近统计学显著性边界(p<0.05),但未跨越。这意味着药物很可能有效,但基于当前(尚未完全成熟)的数据,统计学上的证据还不够强,不能排除偶然性的可能。

更长随访后:试验并未停止,研究人员继续对存活的患者进行随访。在此期间:

一些原本在初步分析时还存活的患者,可能发生了死亡事件(增加了事件数)。

数据变得更加“成熟”,我们对每一位患者的生存时间有了更完整的了解。

事件数增加的影响:事件总数的增加提高了统计检验的效能。就像一个更大的样本量能让调查结果更精确一样,更多的事件数让HR的估计更可靠。这使得原本可能被偶然性或数据不成熟所掩盖的治疗效益变得清晰起来。

HR从0.79变为0.78的意义

HR值本身的变化(0.79 -> 0.78)很小,这并不奇怪,也不一定是重点。这只是一个点估计值的微调,表明治疗效益的方向和幅度是基本一致的。

真正的变化在于p值(0.057 -> 0.0332)。p值变得显著了,这是因为随着事件数增加,HR估计值的置信区间收窄了

举例理解:假设初始分析的HR=0.79,其95%置信区间可能是[0.62, 1.01]。这个区间跨过了1(无效线),所以p>0.05。

更长随访后,HR=0.78,其95%置信区间可能变为[0.62, 0.98]。这个区间完全处于1的下方,表明HR显著小于1,因此p<0.05。

总结原因:更长的随访增加了死亡事件数,提高了统计效能,收窄了HR的置信区间,从而使原本处于临界状态的统计学证据达到了显著性水平。

问题二:这个随访后的结果,会影响三期试验的最终分析结果吗?

有人看到最新的OS和p值,会觉得HARMONi试验最终成功。不过答案是:它并不会改变或取代“最终分析”的官方结果,但它具有非常重要的支持和补充价值。

最终分析的不可更改性

临床试验的统计分析计划(SAP)是事先严格规定的法律和科学文件。它明确定义了什么是主要终点(这里似乎是OS)、在什么时间点进行最终分析(通常是在达到预设的事件数时)。

监管机构(如美国的FDA、中国的NMPA)审批药物所依据的,正是这个预先设定好的、正式的最终分析结果。这个结果是试验的“主要结论”,是不能事后更改的。

由于HARMONi设定的是PFS,OS双终点,因此从监管审批的角度看,OS的正式结果是“HR=0.79, p=0.057”,这是一个阴性结果(即OS未达到统计学显著性)。

但更长随访结果也有其价值

支持性证据:虽然不能取代主要终点分析,但更成熟的数据(HR=0.78, p=0.0332)是一个极其有力的支持性证据。它强烈表明初始分析的趋势是真实的,而非偶然。这可以增强医生、患者和监管机构对药物疗效的信心。

影响监管决策:在审批决策中,监管机构会全面审视所有数据。如果一个主要终点是“临界显著”但多个次要终点(如PFS)显著且高度一致,并且更成熟的OS数据也显示出显著效益,监管机构仍然可能批准该药物。他们会认为,最终分析时p=0.057很可能是由于事件数不足导致的“假阴性”,而更成熟的数据揭示了其真实疗效。

标签和指南:更显著的OS数据可以帮助药物在获得批准后,在其产品说明书中获得更有利的疗效声明。

临床实践和指南:对于医生和医学指南制定者来说,更成熟、更显著的OS数据是决定是否使用该药物的重要依据。一个p=0.0332的OS结果远比p=0.057更有说服力。

后续研究的基础:这个积极的结果为药物在其他适应症或联合疗法的研究奠定了基础。

—————————————————————————————————————-

最后说说我的看法:其实在5月30日数据出来后,就已经是HARMONi III期试验的最终分析结果,这个没有什么好争论的。SMMT大跌30%已经反应了该结果。但我们要关注的是最新的数据,相比前一次的数据,是更好了,还是更差了;病人生存时长是更获益了,还是更缩短了;是更有利于FDA审批通过,还是更不利于FDA审批通过;是对AK112后续试验更有信心了,还是更没信心了。有了这些答案,然后你再决定自己的买卖吧。