体外诊断试剂临床试验统计方法探讨
【摘 要】本文探讨了体外诊断试剂临床试验常用的统计方法。根据使用条件、限制和接受准则的不同分析了定性分析方法中的四格表统计、Kappa检验、配对卡方检验和定量分析方法中的线性相关性分析、回归分析、偏倚估计、Bland -Altman一致性分析。 om/1/view-7267123
【关键词】统计方法;定性分析;定量分析
临床试验是二三类体外诊断试剂除校准质控品外申请注册上市必不可少的环节,通常评估考核试剂和对比试剂或金标准方法的可比性。临床试验结果统计方法种类繁多,每种方法有一定的使用条件和局限性,在设计临床试验方案的时候,如果没有充分考虑到试验的各种因素,容易造成统计方法的选择不合适而得出错误的试验结果或者是分析不全面不充分,直接影响考核试剂的评估。因此,统计方法的选择至关重要。笔者作为体外诊断试剂产品注册技术审评员,根据多年的技术审评经验,将从定性和定量两个方面对体外诊断试剂临床试验中常用的统计方法的使用条件、限制和接受准则进行探讨。
1 定性分析
定性分析包括与金标准比对和与对比试剂比对。通常用四格表进行统计。
与金标准比较通常用敏感度(真阳性率)和特异度(真阴性率)来表示两种方法的符合性:敏感度=a/(a+c);特异度=d/(b+d);总符合率=(a+d)/(a+b+c+d)。而与对比试剂比较通常用阴阳性符合率来表示:阴性符合率=a/(a+c);阳性符合率=d/(b+d); 总符合率=(a+d)/(a+b+c+d)。虽然两种比对方法的四格表形式是一样的,但表示的意义不同。阴性符合率不等于敏感度,阳性符合率不等于特异度,两者不能混用,因为对比试剂准确度不一定100%。
定性分析除了进行四格表统计符合性之外还需进行统计学检验(可使用SPSS统计软件),通常使用Kappa检验或配对χ2检验。
Kappa是作为评价判断的一致性程度的重要指标,取值在0~1之间。Kappa≥0.75,表示两者结果的一致性较好,0.4≤Kappa<0.75,表示一致性一般,若Kappa<0.4,表示一致性较差。在临床试验中具体Kappa为多少可接受,应与临床的实际情况相符。如化学发光类试剂的一致性要求高,金标类试剂一致性要求低,另外跟临床的预期用途有关,如用于初筛的试剂一致性要求低,用于辅助诊断或辅助用药的试剂一致性要求高。如果一致性较差,可用其他方法进一步检验。配对χ2检验考察两种检验方法的检出率有无差别。χ2值越大,差异越大;偏差越小,χ2值就越小,若量值完全相等时,χ2值就为0,表明两种方法检出率没有差别。Kappa检验重在检验两者的一致性,配对χ2检验重在检验两者间的差异。如检测结果不是四格表形式,而是以九格表、十六格表等其他形式,如两种试剂检测结果以"-、+、++、+++"表示,则需要用增加配对χ2检验或Kappa检验。对同一样本数据,这两种检验可能给出矛盾的结论。主要原因是两者对所提供的有统计学意义的结论要求非常严格所致。
2 定量分析
2.1相关性分析 在进行相关性分析之前需进行离群值检验,离群值的个数一般不得超过2.5%,即在100个样本的临床试验中,不得出现3个离群值。如出现3个或3个以上离群值,应寻找原因,如仅仅是样本问题,则更换这些样本;如找不到原因,又影响"等效"的分析时,停止试验并通知试验申请者。
相关性分析通常用散点图来辅助分析。首先以考核试剂每次测定值(作Y轴)与相对应的对比试剂每次测定值(作X轴)作散点图;目测线性,找出线性范围,删去非线性段,如线性范围宽还可以增加分段统计。如线性范围太短,则停止评价。对线性段作相关分析,根据EP9-A2要求相关系数r>0.975[1](或r2≥0.95),如r<0.975, 应扩大样本量以扩大数据范围。线性相关系数反映的是两变量线性关系的密切程度,无法评价两系统的随机误差和系统误差。
2.2回归分析 回归分析比较常用的方法是直线回归分析,Deming回归和Passing-Bablok回归。三种方程的基本形式都一致,为Y=bX+a,但回归系数b的估计方法不同。传统的直线回归分析前提条件是正态分布;对照试剂应是金标准或近似(较好的),无明显的系统误差和随机误差。若两种试剂都存在误差,则不能满足最小二乘法估计的条件,可考虑Deming回归。该法考虑了两试剂的随机误差,且假定两种试剂的标准差比值恒定。Deming法适用于两个试剂的测量误差有着独立的、均数为0的正态分布,误差的方差为成比例的(在数据范围内,方差并不必须恒定的)。如异常值较多,可选用Passing-Bablok法。即任取两点确定直线,屡次反复,得到多条直线并计算斜率,而后对多个斜率值取中位数并调整。该法假定两器械随机误差遵循同一种分布,标准差比值恒定。线性回归斜率b一般推荐在0.9~1.1之间可接受。
2.3偏倚估计 按下列方程式计算平均偏倚B及试验系统与对照系统测定值差值的标准差SD。将医学决定水平预期偏倚的可信区间与允许误差的限值相比较(允许误差推荐为小于或等于1/2CLIA88或者室间质评可接受范围)。预期偏倚可信区间小于规定的允许误差的限值,试验系统可被接受;预期偏倚可信区间大于规定的允许误差的限值, 试验系统不被接受。
2.4 Bland-Altman法 Bland-Altman法是1986年Bland和Altman提出的,并发表在Lancet杂志上[2]。该方法的基本思想是利用两组数据的均值和差值,分别以均值为横轴,差值为纵轴做散点图,计算差值的均值(d)以及差值的95%分布范围(即为一致性界限,LoA,d±1.96Sd,其中Sd为差值的标准差),认为95%的差值应位于该一致性界限范围内。分析散点的分布与一致性界限的位置关系,并且与临床上可接受的界限值相比,如果一致性界限在临床上可接受,则认为两种方法之间的一致性较好,可以互换。检测项目不同,方法学不同,临床上可接受的界限值不同,界限值还与临床预期用途有关,可参考室间质评的相关要求。当样本量较小时,由于抽样误差的影响,有时不一定满足95%的差值落在LoA范围内,这时,可以考虑LoA的可信区间(LoA CI)。计算LoA CI所对应的标准误一般为1SE(d)=Sd/,一致性界限的上、下限的标准误近似等于1.71SE(d)[3]。在临床试验统计分析中,除了用两种试剂的结果的差值反映一致性外,还可以用两种测量结果之间的比值(或差值与均值的百分比)进行Bland-Altman分析。由于检测结果的差值或比值都与两种试剂的测量值都有关,因此横坐标应为两者的均值,而不是对比试剂的测量值。
在应用Bland-Altman分析时,需要注意一定的应用条件[4],均值和差值应相互独立,即两种试剂的测量结果应具有方差齐性,差值应服从正态分布,在测量范围内的差值不随着测量结果变化的扩大而变化。假如不满足条件,如Bland-Altman图呈喇叭状,建议通过对数转换达到要求,也可以通过对用比值来进行分析。
一致性分析時,一般不建议用配对t检验来评估两个试剂的检测结果的一致性。配对t检验的本质是对"差异"的检验,而非对"一致"的检验[4]。因为配对t检验主要是比较均数的差异,只能反映总体均数可能相同,却不能反映数据的一致性,即对系统误差敏感,却无法检出随机误差。
3 结语
体外诊断试剂临床试验应根据预期用途来选择是用定量还是定量的分析方法。但在实际的临床试验过程中,由于很多因素的影响,会出现一些不符的结果,需要查找原因,在定量分析的时候可以辅助定性分析,在定性分析的时候也可以辅助定量分析。不管是定性还是定量,统计分析方法有多种,一定要清楚每种方法使用的前提条件,否则不满足使用条件得出的结果可能没有实际意义。由于每种分析方法都有一定的局限性,可以多种分析方法联合分析,往往更全面更可靠。如在定量分析的时候,可以线性相关分析、回归分析与Bland-Altman法结合起来分析。
参考文献:
[1] NCCLS.Method comparison and bias estimation using patient samples[S].EP9-A2.Wayne,Pennsylvania:2002.
[2] 萨建,定量测量结果的一致性评价及Bland_Altman法的应用[J].中国卫生统计,2011,28(4):409-411.
[3] 陈卉.Bland-Altman分析在临床测量方法一致性评价中的应用[J].中国卫生统计,2007,24(3):308-309.
[4] 李镒冲,李晓松.两种测量方法定量测量结果的一致性评价[J].现代预防医学,2007,34(17):3263-3266.编辑/成森