【循证医学笔记】------Meta分析


Meta分析

第一节 概述

(一)Meta分析的定义

  • Meta分析是运用定量方法去概括(总结)多个研究结果的系统评价。

(二)Meta分析的统计目的

    1. 增大样本含量,减少各种偏倚和随机误差,提高统计检验效能,加强主要结论的说服力,尤其是对样本量较小的临床实验研究。
    • 大规模RCT消耗人力, 财力和时间
    • 多数单位没有条件作大规模RCT
    • 多数单个RCT样本量小而不能得出准确可靠的结论
    • Meta-分析联合单个RCT,增大了样本含量 
    • 高质量的Meta分析与高质量的大样本多中心临床实验一样被认为质量最高的证据级别。
  • 2.评价文献中各研究结果的一致性,试图解决或调和不同研究间的矛盾结论。

    1. 发现某些单个研究未阐明的问题。
    1. 避免重复研究
    • 对以往的研究进行系统评价/meta-分析,可以发现某些问题已有结论,不必进行重复研究。
    • 传统文献综述的特点

      • 在医学研究中,传统的文献综述在处理同一问题的多个结果报道时,通常是平等(等权重方法)对待每个研究结果而得出结论。这种文献综述主要是以某类结果的文献数量的多少得出结论,一般不进行文献评价,也不考虑文献的质量
    • 传统文献综述的主要问题

      • 传统文献的评价忽略了两个问题:

        • 一是多个同类研究的质量不相同
        • 二是各个研究的样本含量的大小不相等
      • 因此,传统文献综述所采用的等权重方法很难保证研究结果的真实性、可靠性和科学性,尤其当多个研究的结果不一致时,其结论容易使人产生误解或困惑

    • Meta分析的统计目的

      • 对多个同类独立研究的结果进行汇总和合并分析,以达到增大样本含量,提高检验效能的目的,尤其是当多个研究结果不一致或都没有统计学意义时,采用Meta分析可得到更加接近真实情况的统计分析结果。

(三)应用Meta分析的条件

  • 并非所有资料都适合做Meta分析, Meta分析的条件是纳入研究必须有足够的相似性(同质性)。在Meta分析之前,研究人员必须要认真严格地分析纳入的资料,只有当这些资料符合合并条件时,才能进行Meta分析。

  • Meta分析并不能提高原始研究的证据强度

  • 如果各研究存在临床异质性,则Meta分析就没有意义,可能混淆疗效真正的差异

  • 通常,将所有研究做一个Meta分析是不可能的,有时需要根据不同的治疗措施作亚组分析

    • Meta分析与系统评价的联系和区别(一)

      • 系统评价:是一全新的文献综合评价临床研究方法,其基本过程是以某一具体临床问题为基础,系统、全面地收集全世界所有已发表或未发表的临床研究结果,采用临床流行病学严格评价文献的原则和方法,筛选出符合质量标准的文献,进行定性或定量合成,去粗取精,去伪存真,得出综合可靠的结论。同时,随着新的临床研究结果的出现进行及时的更新。
      • 在系统评价(systematic review)中:当数据资料适合并使用了Meta分析,系统评价可以克服传统文献综述的两大问题,其分析结论的可靠性更高
      • 当数据资料不适合做Meta分析时,系统评价只能解决文献评价的问题,不能解决样本含量的问题,也无法得到多个研究的合并效应量,无法得出较为确切的分析结论。
    • Meta分析与系统评价的联系和区别(二)

      • 没有按系统评价标准操作规范实施,或未经严格文献评价的研究,即使用了Meta分析也不一定是系统评价的研究,更难说是高质量的研究。

第二节 Meta分析的统计分析过程

Meta分析统计过程的主要内容

  • 1.异质性分析

    • 临床异质性

    • 方法学异质性

    • 统计学异质性

    • 一、临床异质性、方法学异质性和统计学异质性的识别和处理

      • 1、临床异质性的来源 主要指观察对象的差异和治疗方面的差异,包括

        • 生理、人类学方面的差异
        • 病理生理学方面的差异
        • 治疗方面的差异
      • 2、方法学异质性的来源 主要指研究设计和实施等质量因素及结果测量的计量和度量单位不同造成的差异。

        • 不同的设计方案
        • 不同的结果测量方法
      • 3、统计学异质性 指用统计学方法来探测和分析异质性的存在与否。

        • 三种异质性之间的关系:所有统计学异质性均来自临床异质性和方法学异质性
    • 二、异质性分析与异质性检验

      • 按统计原理,只有同质的资料才能进行合并或比较等统计分析,反之,则不能。
      • 因此,Meta分析过程需要对多个研究的结果进行异质性分析,尽可能地消除导致异质的原因,使之达到同质。
    • 异质性检验

      • 又称同质性检验

      • 用假设检验的方法检验多个独立研究是否具有异质性(同质性)

      • 一、异质性的定性分析

        • 采用x2 检验和p值来定性分析各研究结果间的统计学异质性。 x2 值在系统评价中又称Q值。 Q值相对于自由度越大,p值越小,则存在异质性的可能性越大;反之, Q值越小,p值越大,则存在异质性的可能性越小。
        • 异质性检验的方法公式
        • 检验统计量Q服从自由度为K-1的卡方(χ2)分布,因此,当计算得到Q后,需由卡方分析获取概率,故又将此检验叫做卡方检验
        • 若异质性检验检验结果为P>0.10时,多个研究具有同质性,可选择固定效应模型( fixed effect model)
        • 若多个研究结果为P≤0.10时,多个研究不具有同质性,首先应进行异质性分析和处理,若仍无法消除异质性的资料,可选择随机效应模型(random effect model )
      • 二、异质性的定量分析

        • 若P≤0.10时,多个研究间存在异质性,如果要想进一步了解异质性的大小程度,则可计算I2,I2 是对各个研究间的异质性进行定量分析的参数。

        • I2(I?)的意义

          • 在Revman中,I2 可用于衡量多个研究结果间异质程度大小。这个指标用于描述由各个研究所致的,而非抽样误差所引起的变异(异质性)占总变异的百分比。
          • 在Cochrane系统评价中,I2 取值在0%-100%之间,0%表示无异质性,越大表示异质性增加越多。当I2< 25%时,表示异质性低;当25%≤I2<50%时,表示有中等程度的异质性;当50%≤I2 ≤ 75%表示有实质性异质性;当I2>75%时表示异质性大,此时不主张进行合并分析。
          • 只要I2 不大于50%,其异质性可以接受
        • 异质性分析与处理的方法

          • 当异质性检验出现P≤0.10时,怎么办?

          • 首先应找出产生异质性的原因,如疗程长短、用药剂量、病情轻重、对照选择等是否相同。

          • 由上述原因引起的异质性,可使用亚组分析和Meta回归

            • 亚组分析(subgroup analysis)

              • 是将所有数据分成更小的单元,进而在各亚组内进行比较,如按不同设计方案、研究质量、发表年代等进行亚组分析。
              • 根据Cochrane系统评价要求,在系统评价的计划书中尽可能地对一些重要的亚组间差异进行叙述。也就是说对重要的亚组分析,应在计划书中加以说明。
              • 此外,在同一个系统评价中,不提倡使用太多的亚组分析。
            • Meta回归(Meta Regression)

              • 利用多元线性回归的原理,消除混杂因素的影响,达到消除异质性得到较为真实的合并统计量的目的。
              • 如:异质性是由于干预强度、干预时间的长短等原因所致,可用Meta回归进行分析。
  • 2.计算合并效应量

    • 将多个独立研究的结果合并成的一个汇总统计量(overall effect、effect size)或效应尺度(effectmagnitude)

    • 即用多个独立研究的某个指标的合并统计量反映其试验效应。

    • 合并效应统计量的两种统计模型

      • 固定效应模型( fixed effect model)

        • 若多个研究具有同质性(无异质性)时,可使用,可使用固定效应模型。
      • 随机效应模型(random effect model )

        • 若多个研究不具有同质性时,先对异质原因进行处理,若异质性分析与处理后仍无法解决异质性时,可使用随机效应模型。
    • (1)定性资料(二分类变量)(category , dichotomous)

      • 固定效应模型

        • RR (relative risk)相对危险度
        • OR (odds ratio)比值比
        • RD (rate difference, risk difference) 率差
      • 倒方差法、Mantel-Haenzel法、 Peto 法

        • 三种方法由于在分配权重方法上的差异,各研究的权重可出现很大的差异,但对合并效应量的影响可能不会太大。
      • 随机效应模型,RR 、OR、RD

        • 如: DerSimonian&Laird(D-L)法
    • (2)定量资料 (continuous)

      • 固定效应模型

        • WMD,加权均数差法
          (Weighted Mean Difference)
        • SMD,标准化均数差法
          (Standardized Mean Difference)
      • 随机效应模型

        • D-L法
      • 关于随机效应模型(1)

        • 随机效应模型是一种对异质性资料进行Meta分析的方法,但是,该法不能控制混杂、也不能校正偏倚或减少异质性,更不能消除产生异质性的原因。
      • 关于随机效应模型(2)

        • D-L法是通过增大小样本资料的权重,减少大样本资料的权重来处理资料间的异质性,而这种处理存在着较大风险。
        • 通常小样本资料往往质量较差,偏倚较大,而大样本资料往往质量较好,偏倚较小。
        • 因此,经随机效应模型处理的结果,可能削弱了质量好的大样本信息,增大了质量差的小样本信息,故应谨慎使用随机效应模型,对其结论也应当较为委婉。
  • 3.合并效应量的比较

    • 对两组效应量的比较可采用假设检验和可信区间

    • 1、用假设检验(hypothesis test )的方法检验多个独立研究的总效应量(效应尺度)是否具有统计学意义,其原理与常规的假设检验完全相同

      • 根据z值得到该统计量对应的概率(P)值。

        • 若P≤0.05,多个研究的合并效应量有统计学意义;
        • 若P>0.05,多个研究的合并效应量没有统计学意义。
    • 2、合并效应量的可信区间

      • 在Meta分析中,常用可信区间进行假设检验,95%的可信区间与α为0.05的假设检验等价,99%的可信区间与α为0.01的假设检验等价。
      • 森林图即是根据各个独立研究的95%可信区间及合并效应量的的95%可信区间绘制的。
  • (四)分类变量的实例分析

    • RR与OR的可信区间

      • 若选择OR或RR为合并统计量时,其95%的可信区间与假设检验的关系如下

        • 若其95%CI包含了1,等价于P>0.05,即合并统计量无统计学意义。
        • 若其95%CI的上下限均大于1或均小于1,等价于P<0.05,即合并效应量有统计学意义。
    • RR和OR的森林图

      • RR和OR的森林图(forest plots),无效线竖线的横轴尺度为1,每条横线为该研究的95%可信区间上下限的连线,其线条长短直观地表示了可信区间范围的大小;
      • 线条中央的小方块为RR或OR值的位置,其方块大小为该研究权重大小。
      • 若某个研究95%可信区间的线条横跨为无效竖线,即该研究无统计学意义,反之,若该横线落在无效竖线的左侧或右侧,该研究有统计学意义。
    • 漏斗图不对称的主要原因

      • 选择性偏倚(Selection bias)
      • 发表偏倚(Publication bias)
      • 语言偏倚(Language bias)
      • 引用偏倚(Citation bias)
      • 重复发表偏倚(Multiple publication bias)等等
  • (五)数值变量的实例分析

    • SMD可简单地理解为两均数的差值再除以合并标准差的商,它不仅消除了某研究的绝对值大小的影响,还消除了测量单位对结果的影响。因此,该指标尤其适用于单位不同或均数相差较大的数值资料分析。

    • 但是,标准化均数差(SMD)是一个没有单位的值,因而,对SMD分析的结果解释要慎重。

    • WMD和SMD的可信区间

      • 若选择WMD或SMD为合并统计量时,其95%CI与假设检验的关系如下:

        • 若其95%CI包含了0,等价于P>0.05,即合并统计量无统计学意义。
        • 若其95%CI的上下限均大于0或均小于0,等价于P≤0.05,即合并效应量有统计学意义。
    • WMD和SMD的森林图

      • WMD和SMD的森林图,无效线竖线的横轴尺度为0,每条横线为该研究的95%可信区间上下限的连线,其线条长短直观地表示了可信区间范围的大小,线条中央的小方块为WMD或SMD值的位置,其方块大小为该研究权重大小。若某个研究95%可信区间的线条横跨为无效竖线,即该研究无统计学意义,反之,若该横线落在无效竖线的左侧或右侧,该研究有统计学意义。
  • (六)敏感性分析

    • 由于纳入研究所采用的设计和研究方法可能存在差异,或纳入了方法学质量低下的研究,必须考虑方法学上的差异可能对结果的影响。

    • 敏感性分析(sensitivity analysis) 是用于评价某个Meta分析或系统评价结果是否稳定和可靠的分析方法。

    • 敏感性分析结果的解释?

      • 如果敏感性分析结果与原分析结果没有冲突,那么该结果加强了原分析结果的可信度。
      • 如果敏感性分析结果得出不同结论,这提示存在与干预措施有关的潜在重要因素,应进行进一步研究以明确干预效果存在争议的来源。
    • 其常见办法主要有

      • (1) 根据试验类型、试验对象、干预措施及结果的测量方式调整纳入标准;
      • (2)纳入或排除某些含糊不清的研究,不管他们是否符合难纳入标准;
      • (3) 把发表的文献与未发表的文献进行比较, 观察加入未发表文献后对原合并结果的影响大小;
      • (4)对同一组研究资料采用不同统计方法并按不同方式进行处理分析(如分别运用固定效应模型和随机效应模型进行分析) ,将Meta 分析结果与原结果进行比较;
      • (5) 对缺失资料,输入合理的可能数值后重新进行分析。
    • 失安全数

      • 推翻当前合并结论或使当前合并结论逆转所需要的结果相反的研究个数。
  • (七)有关Meta分析的讨论

    • Meta分析的局限性

      • 目前,Meta分析的统计方法尚不够完善,还不能满足不同资料类型和临不同的临床设计方案的需要,如多个均数比较、等级资料比较时,仍无成熟的Meta分析方法。
    • 关于Meta分析的思考

      • 正确应用Meta分析:既不能扩大Meta分析的作用,也不能否定Meta分析的用途。
      • 正确解释Meta分析的结果:对任何统计分析的结果,都需要结合医学专业知识和统计学知识,对研究结果做出尽可能客观和真实的解释,Meta分析也是如此
  • (八) Meta分析的软件

    • 1.Review Manager(Revman)

      • 该软件是国际Cochrane协作网系统评价的标准化专用软件,其中包含了Cochrane系统评价的各项功能,也包括该组织推荐的各种Meta分析功能,具有操作简单、结果直观的特点,目前最新版本为revman 5.0。
      • 该软件是一个免费软件,用户可在如下网址免费下载:
      • http://www.cc-ims.net/RevMan/download.html
    • 2.STATA

      • 该软件是美国Computer Resource Center研制的统计软件,从1985年起,连续推出了多个版本,目前最新版本为9.0
      • 该软件可完成二分类变量和连续性变量的Meta分析,也可以进行Meta回归分析,还可以绘制Meta分析的相关图型,如森林图(Forest)、漏斗图(Funnel)和L’Abbe图
      • 目前,它是Meta分析功能最强的软件
    • 3.SAS for windows

      • 国际权威的统计软件,可完成各种Meta分析(包括数值、分类资料及固定效应、随机效应模型)的统计工作
    • 4.SPSS for Windows

      • 该软件是一个统计专用软件,在其“Crosstable”菜单中,可完成四格表资料Meta分析的计算工作

本章重点

Meta分析的定义和目的?

同质性检验的含义、类别和来源?

描述异质性大小的指标?

森林图的含义?

应用RevMan软件进行meta分析。


  目录