华夏学术资源库

队列研究中暴露因素如何污染?

什么是队列研究中的“暴露因素污染”?

核心定义:

队列研究中暴露因素如何污染?-图1
(图片来源网络,侵删)

队列研究中的“暴露因素污染,是指研究开始后,原本被分入“非暴露组”的参与者,因为某种原因,接触或采纳了研究者所定义的“暴露因素”;或者反过来,原本的“暴露组**”成员失去了该暴露。

就是“暴露组”和“非暴露组”之间的界限变得模糊不清,这就好比一个实验,你本想给A组喂药,B组喂安慰剂,但后来发现B组里也有人偷偷吃了药,而A组有人把药扔了,这样一来,两组的真实差异就被“污染”了,你无法再准确评估药物的真实效果。

一个形象的比喻:

想象一项研究,旨在“长期喝咖啡是否增加患心脏病风险”。

队列研究中暴露因素如何污染?-图2
(图片来源网络,侵删)
  • 暴露组: 每天喝咖啡的人。
  • 非暴露组: 从不喝咖啡的人。

在研究进行了5年后,你发现:

  • 一些原本“从不喝咖啡”的人,因为朋友推荐或工作需要,开始每天喝咖啡(非暴露组被污染)。
  • 一些原本“每天喝咖啡”的人,因为医生建议或失眠,戒掉了咖啡(暴露组被污染)。

这时,两组的“咖啡暴露状态”已经不是研究开始时的状态了,这就是暴露污染。


为什么会产生暴露因素污染?

污染可以发生在研究的任何一个阶段,主要原因包括:

污染来源(非暴露组如何获得暴露)

  • “霍桑效应”或行为改变: 参与者知道自己正在被研究,为了“表现好”或获得健康益处,他们会主动模仿暴露组的行为,在一项关于“健康饮食(暴露)”与心血管病的研究中,非暴露组的参与者看到研究宣传后,也开始注意饮食。
  • 信息扩散与社会影响: 暴露组的干预措施(如发放特殊食品、提供健身课程)或信息很容易泄露给非暴露组的参与者,在社区试验中,给A小区居民发补贴让他们多锻炼,B小区居民看到后也跟着锻炼。
  • 医疗或公共卫生干预: 在研究期间,政府或医疗机构出台了针对所有人的健康政策,使得原本的非暴露组也获得了暴露,研究“补充维生素D与骨折风险”,但研究期间政府开始在牛奶中强制添加维生素D,导致非暴露组也“被暴露”了。
  • 参与者自行改变: 参与者基于个人生活、工作、家庭或健康观念的改变,自发地开始或停止了某种暴露,这是最常见也最难控制的原因。

污染来源(暴露组如何失去暴露)

  • 不良反应或副作用: 暴露组参与者因无法忍受暴露带来的副作用而主动停止,研究“某种降压药(暴露)”的效果,部分患者因药物导致干咳而停药。
  • 健康建议改变: 参与者的医生在研究期间给出了相反的建议,研究“吸烟(暴露)”与肺癌,但暴露组参与者的医生因其他健康问题建议他戒烟。
  • 生活事件: 如失业、搬家、结婚等生活事件导致其行为模式发生改变,从而停止了暴露。

暴露污染会带来什么后果?

暴露污染会直接破坏队列研究的内部有效性,导致以下严重后果:

  1. 效应估计值偏向无效值(Bias towards the Null): 这是最常见的后果,污染会使暴露组和非暴露组之间的真实差异减小

    • 逻辑: 非暴露组里混入了一部分“假暴露者”,他们的结局风险更接近真正的暴露组,从而拉高了非暴露组的结局风险,使得暴露组与非暴露组的风险差或风险比变小。
    • 例子: 假设喝咖啡(暴露)的真实风险比是2.0,但如果10%的非暴露组后来也开始喝咖啡,那么最终计算出的风险比可能会被稀释,比如变成1.5,甚至不显著,这可能导致你错误地得出“喝咖啡与心脏病无关”的结论,而实际上它是有害的。
  2. 错误地得出因果关联: 在极少数情况下,如果污染的模式很特殊(暴露组失去暴露的比例远高于非暴露组获得暴露的比例),理论上也可能夸大效应值,但这相对少见。

  3. 降低研究统计效能: 由于两组间的差异被人为缩小,需要更大的样本量才能检测到真实的效应,导致原本设计良好的研究可能无法得出阳性结果。


如何识别和控制暴露污染?

控制暴露污染是保证队列研究质量的关键环节。

预防措施(研究设计阶段)

  • 明确且可操作的暴露定义: 清晰地定义什么是“暴露”,什么是“非暴露”,以及如何测量,不能只说“吸烟者”,而应定义为“平均每天至少吸一支烟,且持续一年以上”。
  • 采用随机化分配(针对RCT): 如果是随机对照试验,随机化是防止选择性偏倚和污染的黄金标准,它能最大程度上保证两组在基线特征和未来可能受到的未知干扰因素上是均衡的。
  • 设置“洗脱期”(Run-in Period): 在正式研究开始前,设置一个短暂的观察期,给所有候选人都暴露因素一段时间,然后淘汰那些不依从或出现不良反应的人,再将其余的随机分组,这可以确保进入研究的暴露组成员是能够耐受暴露的。
  • 选择不易被污染的暴露因素: 如果可能,选择那些参与者难以自行模仿或外界难以干预的暴露,研究“某种基因突变”与疾病,就几乎不存在污染问题。

识别与评估(研究实施与分析阶段)

  • 定期、反复地测量暴露状态: 这是最重要的一点!不能只在研究开始时测量一次暴露,必须在研究过程中(如每6个月或每年)多次重复测量暴露状态。
    • 方法: 通过问卷、访谈、生物样本检测(如血液中的尼古丁、咖啡因代谢物浓度)、医疗记录查询等方式来确认参与者当前的暴露状态。
  • 进行“依从性分析”(Compliance Analysis): 定期报告暴露组和非暴露组的实际暴露情况。“在随访的第3年,暴露组中仍有85%的人保持暴露,而非暴露组中有5%的人出现了暴露污染。”
  • 使用“意向性治疗分析”(Intention-to-Treat, ITT): 这是RCT中分析数据的标准方法,即无论参与者后续是否真的暴露了,都按照他们最初被分配的组别进行分析,这种方法能最大限度地保留随机化的优势,即使存在污染,也能反映在现实世界中(即分配一个干预后,人们不一定完全遵守)的真实效果,但缺点是可能会稀释真实效应。
  • 进行“遵循方案分析”(Per-Protocol, PP): 只分析那些在整个研究期间都严格遵守了分组方案的参与者,这种方法能更准确地评估暴露本身的生物学效应,但可能会引入偏倚,因为那些能严格遵守方案的人可能与中途退出或污染的人在特征上不同。

控制措施(数据分析阶段)

  • 时间队列分析: 在分析时,考虑暴露状态随时间变化的特点,可以将参与者分为:
    • 始终暴露组
    • 始终非暴露组
    • 从非暴露转为暴露组(污染者)
    • 从暴露转为非暴露组 然后比较这些亚组的结局差异。
  • 使用多变量模型进行调整: 在分析模型中,可以将“是否发生污染”作为一个协变量进行调整,以部分控制污染带来的混杂影响,或者,使用更复杂的边际结构模型结构嵌套模型等高级统计方法来处理动态变化的暴露和选择偏倚。
方面 核心要点
定义 暴露组和非暴露组的界限在研究过程中变得模糊。
后果 主要导致效应值被稀释(偏向无效值),可能得出错误的阴性结论,降低研究效能。
识别 关键在于研究过程中反复、客观地测量暴露状态,定期评估污染率。
控制 预防为主(明确定义、随机化、洗脱期);分析为辅(ITT/PP分析、时间队列分析、统计模型调整)。

暴露因素污染是队列研究,特别是干预性队列研究和随机对照试验中一个不容忽视的挑战,研究者必须在研究设计之初就充分考虑其可能性,并在研究实施和分析过程中采取有效措施加以识别和控制,才能得出科学、可靠的研究结论。

分享:
扫描分享到社交APP
上一篇
下一篇