统计学样本容量的确定(临床试验中样本量的统计考虑)

样本量估计方法,即样本量的计算公式,应根据研究背景、研究假设、设计模型和主要评价指标的数据特征进行正确选择。

考虑临床试验中样本量确定的统计

样本量确定(samplesizedetermination),又称样本量估计(samplesizeestimation),是指为满足统计的准确性和可靠性(I类错误的控制和检验效能的保证)计算出所需的样本量,它是临床试验设计中一个极为重要的环节,直接关系到研究结论的可靠性、可重复性,以及研究效率的高低。样本量估计也是一个成本-平衡效果和检验效率的过程。ICHE9(1998)指出,临床试验的样本量必须足够大,以可靠地回答研究假设中提出的相关问题;同时,它不会造成太大的浪费。样本量的估计方法应在研究方案中详细说明,包括方差、平均值、反应率、阳性事件发生率、差值等。本文适用于确认性试验。

统计学样本容量的确定(临床试验中样本量的统计考虑)

估计样本量需要考虑的主要因素

在确定临床研究的目的后,首先考虑试验设计,包括比较选择(如标准比较、阳性比较、安慰剂比较、剂量比较等)、比较类型(如效率试验、非效率试验、等效性试验)、设计类型(如平行设计、交叉设计、分析设计、组序设计等)、主要指标(定量、定性、生存时间)等其次,考虑统计分析方法,并提出效应量(effectsize)假设;然后根据统计分布、检验水平等试验特点定义统计特征(significantlevel)、检验效能(power)、单侧、双侧、分配比等。;然后用正确的样本量估计方法计算样本量;最后,根据协变量、试验中的脱落率、去除率和依从性进行适当调整。

1.研究目的和试验设计

(1)研究目的

就临床试验而言,确认性研究的研究目的主要体现在有效性评价和安全性评价两个方面。有效性评价常用于样本量估计。

(2)比较类型及其检验假设临床试验中常用的比较类型有效性(superioritytrial)、等效性试验(包括生物等效性试验)(equivalencetrial)、非劣效试验(non-inferioritytrial)等等。以两组效应量为平均值的正指标比较为例,设高效、等效和非劣效的界值Δ,说明他们的检验假设和推断结论。

优效性试验:试验的目的是验证试验组的效果是否优于对照组如果研究没有设定优效界值,其试验假设如下:

此时,若P≤α,可以推断,试验组的疗效优于对照组。等效性试验:试验的目的是验证试验组的效果是否等于对照组。如果研究设定等效界值Δ,检验假设如下:

非劣质试验:试验的目的是验证试验组的效果是否不如对照组。如果研究设置非劣效界值Δ,检验假设如下:

H0:μT-μC≤-Δ;

H1:μT-μC>-Δ。

此时,若P≤α,可以推断,试验组的疗效不亚于对照组。

(3)设计类型

临床试验的设计模型相对简单,包括平行设计、交叉设计、分析设计、序列设计、组随机设计和适应性设计。详细介绍这些设计可以参考相关文献。

2.主要指标

临床试验的样本量通常根据主要指标进行相应的假设。II、III临床试验的主要指标一般是有效性评价指标,上市后IV临床试验的主要指标可以是有效性评价指标,也可以是安全性评价指标,或两者兼而有之。如果样本量的估计应同时根据主要有效性指标和主要安全指标进行估计,则应对设计中的有效性和安全性提出统计假设,并逐一计算样本量,最终样本量应为最大的。主要指标应在研究计划中明确定义,通常根据专业知识确定。它应该是专业领域的共识或高度认可的指标,通常来自某一标准或指南,或来自专业领域的权威辩论或专家共识。主要指标不应太多,一般只有一个。当主要指标有多个时,样本量估计应考虑假设检验的多重性。

在定义主要指标的过程中,不仅要说明指标的含义,还要注明测量点、测量方法和计算方法。由于样本量估计和数据分析需要进行,因此明确指标的类型非常重要。例如,有些指标可以有不同的类型,如定量、定性(如有效和无效)、等级(如恢复、显性、有效、无效)和生存时间。不同类型的样本量估计方法也不同。因此,方案中对主要指标的定义应具体于指标类型。

3.效应量

效应量是估计样本量所需的最重要参数之一。根据不同的指标类型,常见的效应量包括:平均组间差或标准化差、组间差或比率(RR、HR)、OR,或相关系数、回归系数等。效应量参数的确定主要基于以下三种方式:

(1)本项目以前的任何研究结果。即同一项目的预测试和探索性测试(I期或II期临床试验)、单中心试验结果等作为确定参数的依据。由于这些研究结果是内部证据,因此是首选。

(2)基于他人的研究结果。当本项目之前的研究不能提供确切的参数数据或尚未进行研究时,参数的确定可以作为公开发表的研究结果的基础。因为这些研究结果是外部证据,所以它们是次要的选择。如果有不止一份类似的研究报告被公开发表,最好是meta对样本量估计的参数进行分析。

(3)基于本试验的预期结果。如果本试验没有以前的研究结果(无论是自己的还是他人的),或以前的研究数据无法获得本试验设计所需的参数(如本试验采用交叉设计,以前的研究数据来自两个平行组设计的研究),则可以以预期的形式预设,通常以广泛的效应量表达。如果你对试验药物或设备有足够的信心,预期效果很大(如果设置为0.8),此时所需样本量较小。如果对试验药物或设备缺乏信心,则预期效果较小(如设置为0.2),此时所需样本量较大。如果对试验药物或设备有信心,预期效应量为中等水平(如设置为0.5),此时所需样本量也为中等大小。

此外,对于单臂设计或配对双臂设计,如果确定标准控制参数(或目标值),其方式的优先顺序大致为国际标准、国家标准、行业标准(包括指南等)权威机构认可的企业标准和外部证据(类似研究的综合结果,如meta分析结果)。

4.统计特征

样本量估计需要考虑的统计特征主要有统计分布、检验水准、检验效能、单双侧和平衡与否等。

统计分布:样本量估计方法的选择与主要指标的统计分布假设密切相关。基于正态分布的假设将选择参数方法,基于非正态分布的假设将选择非参数方法。同样,由于生存分析的样本量估计方法Weibull假设分布族不同。

检验水平:检验水平即I类错概率,用α表示,双侧0.05最常用的水平。设置单侧高效检验α=0.025双单侧设置等效性或非劣效性检验的情况α=0.025情况的本质仍然是双侧0.05检验水平。但在某些情况下,检验水平的设置会有所不同。例如,为了控制整体I类错误概率α,每次检查的名义检验水平涉及多次检验(如定义多个主要指标)α*小于或等于α;考虑期中分析α消耗,每次检查α*将小于α。另外,对于生物等效性检测,习惯取双侧α为0.1。

检验效率:使用1-β表示,β代表II类错概率。检验效率是指设定的α在此基础上,原假设H0为假而拒绝检验结果H0的概率。检验效能越高,发现差别的可能性越大,但同时所需样本量也越大。临床试验中,检验效能通常不得低于80%。通过对检验效率的敏感性分析,可以为研究人员提供不同的样本量方案。

单侧和双侧检查:单侧检查的样本量将明显小于双侧检查的样本量。一般来说,医学研究领域的统计检查通常采用双侧检查。如果采用单侧检查,则需要给出足够的理由。需要指出的是,一般意义上的检验水平0.05如果单侧水平为0.025事实上,本质仍然是双侧0.05水平。

平衡或不平衡设计:所谓的平衡设计,即每组的样本量相同。当其他条件保持不变时,平衡设计效率最高,即试验所需的总样本量最小。因此,研究设计应尽可能采用平衡设计。不平衡设计是指比较组之间的样本量有明显的差异,这种差异通常是倍数关系,例如,新药III在临床试验中,由于安慰剂对照的疗效相对确定,出于伦理考虑,安慰剂对照组的样本量会少一些,而试验组的样本量会比较大,比如对照组的两三倍。

样本量估计原理和方法

1.样本量估计原理

样本量估计的方法通常来自于检验统计量计算公式。一般来说,统计推断的效应量可以认为是给定模型参数θ的函数f(θ),用T表示f(θ)如果数据来自正态分布或根据中心极限定理,则无偏估计统计量为:确定统计样本容量

基于t检验统计服从非中心t样本量可通过迭代计算分布,即统计样本容量的确定

当统计量T=logHR我们也可以先求出Var(T),然后代入公式(4)计算样本量,此时收到的样本量计算公式可以拆解成所需阳性事件数(numberofevents)这也是目前最常用的与个体阳性事件概率的表达方式。

2.样本量估计方法

样本量估计方法,即样本量的计算公式,应根据研究背景、研究假设、设计模型和主要评价指标的数据特征进行正确选择。由于样本量计算公式较多,本文不详细介绍,读者可参考2012年至2014年连续发布的《中国卫生统计》nQuery和SAS软件实现系列文章(共19篇)[9]。本系列文章以样本量估计专业软件nQueryAdvisor7.0为此,系统介绍了常用的样本量估计方法,给出了计算公式及其权威来源,并通过实例进行了解释SAS9.2软件实现的程序方便读者应用。表1列出了常用的样本量估计方法,可视为通过统计检验方法正确选择样本量估计方法的索引。

样本量估计的其他考虑

1.调整样本量

根据统计方法估计的样本量是在给定条件下满足临床试验所需的最小样本量。在实际试验过程中,由于病例的脱落和消除、病例依从性差等原因,可评估的样本量会减少。因此,需要在样本量估计的基础上适当扩大样本量,以确保最终有效样本量能够满足最小样本量的要求。从分析的角度来看,需要确保最终可评估的样本量(即符合方案数据集(per-protocolset)例数)应大于通过样本量估计方法获得的样本量。样本量的调整通常考虑不超过20%的脱落率。如何确定具体的脱落率取决于不同的研究项目。确定的依据主要来自专业判断,或通过以往的研究数据meta分析是重要的参考。

当亚组分析的结果是主要疗效指标时,应确保最终亚组可评估病例达到最小样本量。临床试验结果可能受年龄、性别、病情程度等预后因素(协变量)的影响。样本量一般不考虑预后因素,主要是因为随机分组可以平衡各组之间的协变量。

2.再估计样本量

再估计样本量较多地用于适应性设计。适应性设计再估计样本量常用的三种方法如下。

(1)组序设计:每组样本量固定,每次期中分析的目的是决定是否终止试验(成功或失败)或进入下一个周期。

(2)固定期中分析:每次期中分析重新估计参数,对样本量进行新的估计和调整,但不检查检验假设。

(3)上述两种方法的结合:每次期中分析既对参数重新进行估计,并据此对样本量做出新的估计和调整;又对检验假设进行检验,以判断是否终止试验(成功或失败)或进入下一周期的试验。上述三种方法均属于期中分析的样本量估计问题,详细过程可参阅文献[9]。需要指出,基于期中分析的再估计样本量应尽可能地在盲态下进行。

样本量估计在临床试验方案中的要求

在临床试
验方案中,需要对样本量估计进行清晰和完整的阐述,应至少包含以下内容:试验的研究假设,对照的类型,比较

你可能还喜欢下面这些文章

毕业证样本网创作《统计学样本容量的确定(临床试验中样本量的统计考虑)》发布不易,请尊重! 转转请注明出处:https://www.czyyhgd.com/186785.html

(0)
上一篇 2022年5月1日
下一篇 2022年5月1日

相关推荐

客服微信
客服微信
返回顶部