原创 老郑 医学论文与统计分析
最近不少朋友咨询样本量如何计算,其中有一些我给予回复,有一些我都没有回复。有些朋友的问法实在让我不知如何说起。
1.拷问灵魂的咨询问题
“郑老师,我做了一个临床研究,请问我的样本量怎么算”
我应该告诉你怎么算?我连什么研究都不知道。你大概不知道样本量计算有上百种之多,我应该如何跟你讲呢?
其他类似还包括“想请教下样本量计算具体怎么操作”、“学生又忘记了如何估算临床样本量了”。
说实话,对于这样的问题,我很无奈。
2. 样本量计算要掌握的关键信息
样本量计算与以下的特征有关:
第一,你的研究方案是什么?是实验性研究还是观察性研究、还是诊断性试验。实验性的话,是随机设计还是配对设计?观察性研究的话,是横截面调查还是并病例对照或者是队列研究。
第二,你的研究结局是什么类型的结局?定量和定性数据样本量计算方式是不同的。如果是多结局的话,既包括定量又包括定性,一般情况下,要分别求出各个结局的样本量而后取最大值,或者设置你研究的主要结局指标作为你样本量估算的依据。
第三,比较的组数。
第四,各组的结局预期值或者文献参考值,比如实验组和对照组和均数和标准差、定性结局的话,各组的率。
第五,研究设计设定的Za(阿尔法)值和Zb(贝塔)值和单双测检验设置。一般Za为1.96(双侧a=0.05)或者1.64(单侧a=0.05),Zb为1.28(单侧b=0.1),或者0.84(单侧b=0.2)。1-b即为检验效能(Power),一般不小于0.8,这是非常重要的一个指标。
第六,其他还有更多的细节。这里不再更多表述。
3. 咨询样本量计算的正确姿势
很多朋友知道一点样本量计算方式,有些完全不知道,一般情况下,我建议对样本量计算的学习。一般我会推送相关的样本量计算文章给她先学习,再进行交流。
所以,咨询样本量时,诸位要提供的关键信息是你的研究方案。它应该是涉及以下的基本信息,总结来说还是PICOS等要素。
S:研究设计方案
P:研究对象
I & C: 你的研究因素和分组情况
O: 你的结局指标是什么?定量还是定性?有几个,要分主次吗?
比如“郑老师,我这是一项针对糖尿病患者的随机对照研究研究,主要探讨针灸的疗效,实验组是针灸 安慰剂,对照组是安慰剂,我们的结局有两个,一个是有效率,一个是生命质量得分”,应该如何计算样本量?
我的答案是:你应该先看2组定量数据样本量计算的方法和2组定性数据样本量计算方法,分别求之,取最大值作为你的样本量,或者你先设置好哪个结局指标作为你主要结局在指标。
郑老师公众号有基本的样本量计算的推文,可以方便大家学习,既有公式法、又有PASS软件法,还有它们的书写方式。
4. 多说两句
本人被咨询的问题,比重最大的就是样本量的计算问题。可见国内医学统计学教学欠缺对 样本量的计算。但是必须要说的是,任何研究设计都需要考虑样本量的计算。
样本量计算要反复推敲。一般我建议,大家应该基于公式法和PASS软件法分别求样本量。如果得到一致结果,才能说明你计算方法无误。
样本量计算参数设置时,有些时候无法改动,包括研究设计方案、结局指标、a值和b值。需要做的最头大的工作是寻找各组的结局预期值或者文献参考值,定量的均数差值和标准差,定性的两组率。一般情况,需要根据文献记载的数据作者为参数或者以自己预调查的结果作为参数。
5. 最后的疑惑:样本量太大怎么办?
“郑老师,我的样本量算出来太大怎么办,有没有办法解决?”
我的答案是:凉拌!
所有参数都是根据你的研究方案、研究目的、研究内容而定,除了微调,基本没有回旋的余地,如果你已经找到了文献参考值最大的组间差别,已经设置了单侧检验,已经将检验效能改为0.8,但你的样本量很大,怎么办?当然不太有办法解决。
最后华山一条路:修改原始研究方案。但是我这里善意提醒诸位,除非情况特殊,修改研究方案是一种学术不规范的表现。