用户头像
加小钱
 · 上海  

$莱美药业(SZ300006)$
药物研发临床试验是个大学问
一般认为小样本实验具有偶然性,而大样本实验具有必然性。FDA的标准是大样本规模300+。
但认真学过统计学的,都知道,所有实验的假设是,样本具有正态分布,实验样本数量越大,越能代表真实世界样本结果。
但是,但是
我们忽略了小样本的数据价值。
如,我们做19个样本,得到5个人可以活过2年以上,我们担心的是这5人是特例,可能不符合整体样本的正泰分布规律。
但是,作为生死(0/1,非黑即白)的样本实验数据,实验者你怎么能有这样好的运气,这19人都抽样都是在置信区间之外的特例?
如果再做一次50人的样本,得到与19人几乎一直实验效果数据,那你怎么可能运气这么好,又抽到的50人实验者还是属于置信区间之外特例。
唯一可以解释两个小样本都得到比较一致的效果数据的原因,只能是两次小样本实验都在置信区间之内,也就是小样本的效果数据能代表大样本效果数据。
实验目标的数据越是0/1这类非黑即白的,则多次小样本的一致数据结果越能代表大样本数据结果。
说简单点
如纳米碳铁2期结果跟1期观察到的结果数据是一致的话,那么没有理由担心随后的大样本数据会是与1、2期小样本结果是截然相反的。
这也是大批新药2期结果出来后,大量资本会蜂拥而入的原因。