我把计算过程简要的列一下吧,更清晰。
问题,为啥$康方生物(09926)$ 的Harmoni-A可以做到OS双显著,$Summit Therapeutics(SMMT)$ 的Harmoni 却不行(只有PFS显著)?
鼠博@TfR1lyxxx快乐鼠鼠
说是杜根故意的。我同意。
我从计算角度解释清楚,主要是alpha分配问题。
计算如下:@二郎山的叔
核心都在一个点上:α 是怎么分配的(我回复里说了康方的hr值是估计得,计算得有个数,还是修改下正文吧),以及用了什么“消耗函数”。
一、
Summit 的 HARMONi 研究:alpha 被 PFS 提前“用光”
1. 设计背景
• 主要终点:PFS(第一次期中分析即宣布成功)。
• 关键次要终点:OS(计划 2 次期中 + 1 次最终)。
• 多重性控制:PFS 与 OS 采用序贯检验(hierarchical)——只有 PFS 显著后才去检验 OS。
• alpha α 总预算:单侧 2.5%(FDA 常规)。
• 具体分配:
- PFS 第一次期中就把几乎全部的alpha α(≈2.5%)“吃掉”了。
- OS 第一次期中分析只分到 α=0.0001(万分之一)。
• 消耗函数:Lan-DeMets O’Brien-Fleming 近似(α-spending function)。这种函数在信息量少(事件数少)时极其“吝啬”,需要的 HR 极极端才能显著。
2. 计算细节
• 2025-04 公布的中期 OS 事件成熟度仅 39%(≈155/398 例)。
• 在 α=0.0001、Lan-DeMets OF 边界下,HR 必须 ≤0.55–0.60 才能跨线。
• 实际 HR=0.777 → 远未过界 → 统计学不显著。
3.
结论
PFS 提前“锁走”了 α,OS 中期只拿到 0.01% 的显著性预算;在 Lan-DeMets OF 边界下,0.777 的 HR 不可能显著。
Summit 自己已经公告:由于 α 被消耗,最终分析也无法翻盘(见高盛与summit的电话会议纪要6月份)。
二、
康方生物的 HARMONi-A:为什么能做到 OS 双显著?
1. 设计差异
• 独立的中国桥接试验(代号 HARMONi-A),并非 Summit 全球 HARMONi 的子集。
• 主要终点:PFS(同样先显著)。
• 关键次要终点:OS,但α 分配策略不同。
- ![]()
![]()
![]()
康方在方案里给 OS 留了足够的 α(假设二八分,单侧 0.0207,接近 2.5% 总预算的 80% 以上)。
- 仍用 Lan-DeMets OF,但 α 剩余量远高于 Summit。
• 样本量虽不大(≈320 例),但事件驱动设计——等到 OS 事件数足够才做最终分析,而不是像 Summit 那样早期“抢跑”。
2. 数据结果
• 假设最终 OS 分析成熟度达 68%(≈220/320 例)。
• 假设HR≈0.73,在单侧 α=0.0207 的 OF 边界下成功跨线 → 统计学显著且临床有意义。
3. 关键原因
- α 没有提前被 PFS 全部拿走;
- 最终分析而不是早期期中;
- 事件数足够,HR 0.73 刚好过边界。
三、总结![]()
Summit 的 HARMONi 用Lan-DeMets O’Brien-Fleming α-spending把 α 几乎全给了 PFS,导致 OS 中期只剩 0.01%,HR 0.777 无法显著;
康方 HARMONi-A 采用独立的 α 分配与最终分析策略,假设给 OS 留了约 2% 的 α,在假设成熟度 68% 时 假设HR 0.73 成功跨线,实现 OS 统计学显著。
~~~~~~~~~~~~~~~~~~~~~~~~~~~必胜的分割线~~~~~~~~~~~~~~
具体计算过程和消耗函数计算如下:
把 α(显著性水平)和 HR(风险比)之间的“计算关系”拆分,就能看懂 Lan-DeMets 的边界到底是怎么把 HR 卡住的。
1. 先把 α 变成 Z 值(单侧正态分位数)
Zα = Φ⁻¹(1-α)
举例:
• α = 0.025 → Z0.025 = 1.96
• α = 0.0001 → Z0.0001 ≈ 3.72
---
2. 再把 Z 值折合成“边界处的对数 HR”
Lan-DeMets O’Brien-Fleming 边界公式(简化版):
log(HR_boundary) = – Zα × √(V⁻¹(t))
其中
• V(t) = 信息分数 t = 当前事件数 / 最终事件数
• √(V⁻¹(t)) ≈ 1/√t
所以近似有:
log(HR_boundary) ≈ – Zα / √t
反求 HR_boundary:
HR_boundary = exp(– Zα / √t)
---
3. 代入实际数字就知道结果了
Summit 的 OS 第一次期中
• t = 39% ≈ 0.39
• α = 0.0001 → Zα = 3.72
HR_boundary = exp(–3.72 / √0.39)
≈ exp(–3.72 / 0.624)
≈ exp(–5.96)
≈ 0.0026
显然 0.777 远大于 0.0026,所以跨不过去。
康方 HARMONi-A 最终分析
• t = 68% ≈ 0.68
• α = 0.0207 → Zα = 2.04
HR_boundary = exp(–2.04 / √0.68)
= exp(–2.04 / 0.825)
≈ exp(–2.47)
≈ 0.77
实际 HR = 0.73,已经低于 0.77 左右,所以显著。
---
总结![]()
α → Zα → 根据信息分数 t 计算 HR_boundary;
HR_boundary = exp(– Zα / √t)。
α 越小或 t 越小,HR_boundary 会极端接近 0,导致 OS 极难显著。
这是上面的计算过程。下面是一些基本知识点,不愿看不看了![]()
~~~~~~~~~~~~~~~~~~~~~~~耐心和勇敢的分割线~~~~~~~~~~~~~~~
需要大学数学正态分布的知识 自行补一下,小白记住如下也可操作:
先把名词解释下:
- α(alpha):显著性水平。
- HR(hazard ratio):风险比。
- p-value(在零假设(HR = 1)下,获得当前或更极端结果的概率,所谓失效概率。
三者之间的关系一句话就能串起来:
α 是事先设定的门槛;p-value 是事后算出的“距离门槛有多远”;HR 决定 p-value 的大小。
上面计算看不懂就算了,下面几句话记一下,用起来好用,也比较重要:
- HR 越远离 1(保护效应越强),|log(HR)| 越大 → Z 越大 → p-value 越小。
- 事件数 E 越大,同样的 HR 会给出更小的 p-value。
-
Lan-DeMets 只是把 α 随信息时间 t 切成多个门槛(αₜ),每一步都要满足 pₜ ≤ αₜ,而不是固定 α = 0.025。
绝世高手的口诀:
“HR 决定 Z,Z 决定 p,p 去撞 α;撞过就显著,撞不过就拉倒。”