计算样本量的公式(指南解读系列|BMJ)

准确估计样本量是临床试验可靠性和可重复性的重要保证,今天的指南解读系列也将基于BMJ,分享临床预测模型样本估计中需要注意的问题,减少计算预测模型样本大小时的混乱。

指南解读系列|BMJ:计算样本量的公式

计算临床预测模型样本量的四个步骤

计算样本量的公式(指南解读系列|BMJ)

关于临床预测模型,我们分享了如何构建临床预测模型(点击回顾):计算样本量的公式

样本量本量的内容包括:计算样本量的公式

根据不同的研究目的,临床预测模型需要足够的样本量:

1)预测因素效应研究:

根据预期效应量(如OR、HR)、样本量计算预测因素和事件发生率;

2)模型开发:

3)模型验证:

单级模型:至少100个事件;

多层次模型:>50组(每组50名受试者)

准确估计样本量是临床试验可靠性和可重复性的重要保证,今天的指南解读系列也将基于BMJ,分享临床预测模型样本估计中需要注意的问题,减少计算预测模型样本大小时的混乱。

以二分类结果的研究为例,根据以往的经验,我们通常认为每个变量至少需要包括10个事件,这是一个被广泛接受的默认规则(也称为10EPV”,10eventspervariable)。但事实上,一些预测因素会产生两个或多个β多个变量之间的相互作用也会增加模型参数的数量,因此预测模型通常需要更多的参数。10EPV目前还没有定论的改进建议,还需要结合具体研究情况进行具体判断。

理想情况下,模型开发的样本量越大越好。然而,考虑到研究效率和成本等实际问题,需要估计能够同时支持有效性和安全性的最高样本量。

此外,作者强调,不建议将数据分为模型培训和测试样本,而是使用所有数据进行内部验证(本指南不适用于外部验证)。

本文主要从四个步骤引导样本量估计,每一步都能得到样本量结果,最终取最大值:

从根本上说,样本尺寸必须能够准确估计预测模型的截距,以确保开发的模型能够准确预测平均结果值或结果的整体比例。因此,最直接的方法是准确估计模型截距(空模型)所需的样本量。

比如二分类结局,n样本量大小,有结局事件的比例(φ)95%的信心范围:

绝对误差范围(δ)为:

样本量计算公式如下:

模型开发所需的样本量也需要满足准确预测预测值范围的要求。vanSmeden等人[4]认为总样本的大小和结局事件的比例是模型平均预测精度的三个主要因素(asmeasuredbythemeanabsolutepredictionerror,MAPE)的公式:

其中n样本量大小,φ为预期结局事件的比例(≤0.5),P为预测变量的数量。

减少过拟合对模型的预测性能非常重要。当样本量太小或模型性能太好时,应特别注意检查此问题。通过减少开发模型的预测可变性,即减少极端预测(如预测概率接近0或1),可以处理过拟合问题。

Riley等人[5][6]建议在开发模型时注意较小的收缩率(≤0.1,即预期收缩因子S≥0.9)下确定样本量和预测变量的数量。

比如二分类结局,R(cs)^2保守指标是评估模型性能Cox-SnellR^2,它反映了模型的噪声比,可以影响多参数估计和模型潜在过拟合(近0时,考虑到参数估计不可靠,过拟合;接近1时,反之亦然)。

4样本量是否保证开发模型和样本量R(cs)^2优化调整值差异小?

这里的“R(cs)^2优化调整值指R(cs)^2/max(R(cs)^2),它是目标人群中模型拟合度的无偏估计。

例如对于二分类结局,收缩因子公式为(建议δ≤0.05):

(详见指南原文[1]。

[1]EnsorJ,HarrellFE,ReitsmaJB,etal.Calculatingthesamplesizerequiredfordevelopingaclinicalpredictionmodel[J].RMDOpen,2022,368:-.

[3]时景璞.在临床研究中,样本量的估计方法[J].(10)中国组织工程研究:1569-1571.

[4]vanSmedenM,MoonsKG,deGrootJA,etal.Samplesizeforbinarylogisticprediction

models:Beyondeventspervariablecriteria.StatMethodsMedRes2022;28:2455-74.

10.1177/.29966490

[5]RileyRD,SnellKI,EnsorJ,etal.Minimumsamplesizefordevelopingamultivariable

predictionmodel:PARTII-binaryandtime-to-eventoutcomes.StatMed2022;38:1276-96.

10.1002/sim.

[6]VanHouwelingenJC,LeCessieS.Predictivevalueofstatisticalmodels.StatMed

1990;9:1303-25.10.1002/sim.

地址:广州市天河区珠江东路高德置地秋广场F座位找到了45368158个原始计算样本量的公式设计图片,包括计算样本量的公式图片、材料、海报、证书背景和源文件PSD、PNG、JPG、AI、CDR等格式素材!

你可能还喜欢下面这些文章

毕业证样本网创作《计算样本量的公式(指南解读系列|BMJ)》发布不易,请尊重! 转转请注明出处:https://www.czyyhgd.com/180394.html

(0)
上一篇 2022年4月29日
下一篇 2022年4月29日

相关推荐

客服微信
客服微信
返回顶部