核保医学研究中关于混杂因素的探讨-不知不识网

[摘要] 核保医学应用中对混杂因素的识别和控制非常重要，可以把混杂理解为在分析的过程中所遇到的一种逻辑现象，同时也是影响分析结果的重要因素。每个人健康状况的变化也并非归因于某一孤立的因素，这些因素相互影响和制约，构成了一个复杂的网络，而忽视混杂因素会不可避免的导致核保分析出现混杂偏倚，如何对混杂因素进行准确识别和有效控制将是未来核保医学重点关注的研究内容。

[关键词] 核保医学；混杂因素；混杂偏倚

[中图分类号] R19 [文献标识码] A [文章编号] 1672-5654（2015）02（a）-0153-02

核保医学通过对各类与风险结局相关的健康因素进行分析的方式完成风险评估，如评估高血压作为风险因素对重大疾病发生率的影响、酗酒行为对意外死亡发生的影响等等。针对被保险人健康因素分析的结论是基于对各类风险因素进行评估的结果，使人群发生率升高的因素，可以认为是影响发生率的危险因素，控制其中某个或多个因素时，事件发生率就会下降。而每个人健康状况的变化也并非归因于某一孤立的因素，而是一系列的因素相互作用的结果，这些因素相互影响和制约，构成了一个复杂的网络。

核保医学属于观察性研究，需要从应用角度利用专业知识进行分析，判断某一外部因素与暴露因素是否有关，对结局的发生是否会产生影响。其中混杂因素的识别和控制非常重要，也是影响分析结果的重要因素。某些因素是否为混杂因素？是否需要调整？调整后所得到的结果是接近真实结果还是更加背离真实结果？这些问题都是在核保应用研究方面所重点关注的。

1混杂的识别和判断

在学术领域关于混杂的概念，至今仍没有一个公认的、确切的定义，目前在核保领域能够被接受的定义为：“因一个或多个外来因素的存在，掩盖或夸大了研究因素与疾病的联系，从而部分或全部地歪曲了两者之间的真实联系，称为混杂偏倚，引起混杂偏倚的外来因素称为混杂因素[1]。”如体能锻炼缺乏作为不良生活行为的一部分是否会影响2型糖尿病发生率，是否作为混杂因素进行评价[2]。

混杂不完全被认为是一个统计分析领域的概念，对于混杂的认识和理解，同样反映了科学推理的逻辑性，而在核保医学研究领域可以把混杂理解为在分析的过程中所遇到的一种逻辑现象，假设在静止条件下的某一观察性研究结局事件是发生或者没有发生，那么在这两种情况下除了某一种或几种现象以外，其他现象都相同，那么这就是事件发生的影响因素，而控制其中的某一因素会使混杂偏倚减小。

对混杂因素的有效判断是核保医学研究中的重要环节，忽视混杂因素会不可避免的导致推断结论出现混杂偏倚。一般认为混杂的判定原则大致归为“混杂因素的可压缩原则”和“可比较原则”两种准则。可压缩原则可归纳为：某外部因素在各水平上的关联测度与边缘上的一致，如不一致则该外部因素为混杂因素。混杂因素可比较原则中混杂因素的成立须满足：该因素是一个独立的危险因素、该因素在暴露总体与在非暴露总体中的分布不同，并且该因素不是病因链中的一环[3]。

例如，非暴露总体=X1，暴露总体=X2，X1和X2在无暴露的情况下结局Y的分布相同，则可以认为不存在混杂因素。这时可以直接评价X对Y的因果作用。例如，假设乙肝患病人群当初没有感染乙肝，其肝硬化发病率等于未感染乙肝人群的发病率。那么，比较感染乙肝的肝硬化发病率与未感染乙肝人群的发病率，可以得到感染乙肝对于肝硬化结局的因果作用。例如，血脂异常和腹型肥胖是中老年男性高尿酸血症的危险因素，但如果不对年龄、性别、饮酒等背景因素进行控制，会影响结论的推导[4]。如果高血压患者系统性的治疗高血压，控制血压能够增加尿酸的清除率，这对高尿酸血症与心血管危险因素的相关性而言，则属于混杂因素[5]。如果结局分布不同，则需要对一些背景变量进行总体分层后，使暴露因子总体与非暴露因子总体具备可比性。

但是从严格意义上讲，无论是可比较原则还是可压缩原则都有其一定的局限性，可比较原则只能判断哪些变量不是混杂因子，而不能确定哪些变量一定是混杂因子。而可压缩性准则须依赖于使用相关测度和背景因素的水平尺度[6]。采用虚拟事实模型理论给出的混杂的形式定义，完善了关于混杂的理论，并证明可压缩性和可比较性两类准则是互补、而不矛盾的准则[7]。

2混杂因素的控制

从方法学角度控制混杂因素的方法包括：分层分析、队列研究、病例匹配、标准化和多因素分析等。其中分层分析是最常用、也最为有效的方法。

举例：假设我们对某保险公司对承保A地区和B地区患恶性肿瘤病人的5年生存率进行比较，总体来看，A地区600例恶性肿瘤病人中5年内死亡369例（61.5%），B地区的1200例病人中死亡636例（53%），粗病死率分析，B地区病死率低于A地区。但进行分层分析，按照肿瘤恶性程度、分期以及其它一些特征，把病人的风险程度分成不同等级（见表1），然后再比较不同危险等级层内的病死率，则B地区病死率高于于A地区。

表1显示两个地区高危险组和中等危险组病死率同样为82%和55%，低危险组A地区有36%，而B地区为42%，这样两个地区病人危险程度成做混杂因素，其存在的明显差异给粗病死率分析造成了误导，而通过分层分析，我们能够得到不同危险水平病人的病死率。

标准化因涉及变量过于复杂，实际操作难度较大；队列研究可以很好地控制混杂，但存在周期长和失访问题，其局限性会影响结论外推；在病例对照研究中应用匹配方法容易引入系统性偏倚，因此分层分析是相对容易控制的方法。同时需要考虑的是，如果认为某因素可能造成混杂，很多人认为直接做分层调整一定比粗测量准确，或者认为多因素分析可以更为容易的解决混杂问题，实际上会给分析造成更多的困难。首先进行粗测量是非常重要的，其次是分层分析，然后才是多因素分析[6]，而如果考虑采用多因素分析，需要慎重考虑其适用条件，如风险因素的独立性、分布以及共线性问题等等。

[参考文献]

[1] 任涛，詹思延，沈霞，等.流行病学研究中的偏倚与混杂[J].中华流行病学杂志，2004，25（9）：811-813.

[2] Maarit A. Laaksonen，Paul Knekt，Harri Rissanen，S The relative importance of modifiable potential risk factors of type 2 diabetes： a meta-analysis of two cohorts[J].European Journal of Epidemiology，2010，25 （2）：115-124.

[3] Miettinen OS， Cook EF. Confounding： essence and detection[J].Am Journal Epidemiology，1981，114（4）：593-603.

[4] 松婷，戴辉，林爱华.中老年人群高尿酸血症与心血管危险因素关系[J].中国公共卫生，2014，30（2）：144-148.

[5] McAdams DeMarco MA， Maynard JW， Baer AN， et al. Diuretic use， increased serum urate levels， and risk of incident gout in a population-based study of adults with hypertension： the Atherosclerosis Risk in Communities cohort study[J].Arthritis Rheum，2012，64（1）： 121-129.

[6] 胡永华，耿直.关于混杂概念的讨论[J].中华流行病学杂志，2001，22（6）：459-461.

[7] 廖莹，许奕华，聂绍发.流行病学研究中低危险度的评价方法[J].湖北预防医学杂志，2007，18（2）：107-109.

（收稿日期：2014-11-03）