> 半岛首页 > 客户支持 > 学术交流

学术交流 | Meta分析全攻略,不做实验也能发文章!

发布时间: 2020-06-23 浏览次数: 2971

Meta分析(Meta-analysis)常译为汇总分析或荟萃分析,是系统评价(Systematic reviewSR)中经常用到的统计方法。正是Meta分析被引入医学科学,才解决了综合几个研究结果得出一个总体定量数据的问题,使SR具有较强的科学性和可重复性。运用Meta分析方法,可避免各个研究组之间可能由于取样来自不同的总体而造成的差异,也可根据研究的样本量为其结论赋予不同的权重,而非简单的合并。因此,Meta分析最大的优点是通过增大样本量提高结论的可信度,降低研究结果的不一致性。Meta分析可用于临床试验、诊断试验和流行病学研究的SR。但Meta分析并不是万能的,对一些经过大样本、多中心的临床试验已得到明确结论的,不必做Meta分析;而对那些设计或执行质量很差的研究,如有偏倚的或没有意义的资料,也不能寄希望于通过Meta分析就能得到可信的结论。国际上对评估证据强度作了分级,也制订了Meta分析的最低标准,即随机对照研究(Randomized controlled trialRCT)质量特征:①良好设计;②良好质控;③控制偏差;④有效样本;⑤确切终点;Meta分析质量特征:①前瞻设计;②准确终点;③同质对象;④涵盖全部研究和病例,以保证其评估质量。

近年来,随着循证医学的兴起,Meta分析方法越来越为人们接受和广泛应用。Meta分析和传统的文献综述有很大不同,传统的文献综述以定性分析描述为主,而且不可避免带有主观性,综述者往往只选择支持自己观点的信息进行综述。Meta分析强调对研究课题进行系统全面的文献检索,确定文献纳入和剔除的标准,并对纳入文献进行严格评价,在此基础上对结果进行定量合并。因此,通过Meta分析,可以对有争议甚至互相矛盾的研究结果得出较为明确的结论。而且,将同类研究结果进行定量综合,能达到增大样本量,改进和提高统计学检验功效的目的。此外,通过Meta分析能发现以往研究的不足之处,揭示单个研究中存在的不确定性,提出新的研究课题和研究方向。最近,国内也出现了不少有关Meta分析研究的文章,但由于Meta分析在国内的应用时间不长,而且没有一定的具体操作准则对实施的步骤进行规范,所以研究者随意性大,长此以往,会导致对此方法的滥用,影响研究结果的可靠性。

Meta Analysis研究步骤 

Meta分析是一种观察性研究,因而也遵循科学研究的基本原则,包括提出问题、搜索相关文献、制定文献的纳入和剔除标准、提取资料信息、统计学处理、报告结果等基本研究过程。

一.提出问题,制定研究计划,实际上就是一个选题的过程

问题的提出需要系统复习大量的文献,Meta分析所研究的问题一般可来自生物医学等领域中不确定或有争议的问题。对一些大样本,多中心临床合作已经得到明确结论的的,没必要做meta分析。

二.检索相关文献

资料收集的原则是多途径、多渠道、最大限度地收集与研究问题相关的文献。对检索结果要进行查全、查准与否的分析评价,否则会影响Meta分析结论的可靠性和真实性。

需要考虑以下问题:

1.  选定搜索数据库(外文有:MEDLINEthe Cochrane library、医学文摘、TOXLINEOVIDEMBASEISI Web of ScienceEBSCO等;国内有:维普全文VIPCNKI、万方数据库);

2.  确定语言类型:包括所有英语和非英语的文献;

3. 明确需要包含的研究类型:仅包含RCT,还是病例对照试验,队列研究等;

4.  明确暴露因素/治疗方法;

5.  筛选关键词:这将直接影响文献检索的准确性和敏感性,也关系到指定检索策略;

1)关键词需要根据研究问题本身来确定;

2)对于每一个关键词尽量包含所有可能的表述形式;

3)可以尝试几种关键词组合以搜最合适的文献。

6.  检索获取摘要和全文:其中联系专家是一种很好的方式,不仅可以获取全文,甚至可以询问文献中的细节帮助后续使用文献。建议搜索文献引用名单,可以增加文献搜索的全面性。在文献筛选过程中,首先,需要由两位研究者独立通过对文献的题目和摘要进行初筛,初筛后的文献通过阅读全文进行二次筛选,然后交叉核对筛选结果,如果有分歧则通过共同讨论决定是否纳入,必要时可有第三位研究者协助解决。如果文中信息不全或信息不清楚,与原始研究作者联系获取信息。在筛选过程中,需要记录你每个步骤的选择和排除原因。至于被排除的文章,则需要在灵敏度分析中进行分析。

三.选择符合纳入标准的研究

明确的纳入和剔除标准从检索出的文献中筛选合乎要求的文献。在制定文献纳人和剔除标准时,要考虑研究对象、设计类型、处理因素、结局效应、样本大小、观察年限、文献发表时间和语种等方面的问题。

四.纳入文献的质量评价

主要考察各个研究是否存在偏倚(如选择偏倚、失访偏倚、发表偏倚等)及其影响程度。质量高低可用权重来表示,也可用量表或评分系统来评价。

五.提取纳入文献的数据信息

Meta分析采用的数据信息一般包括基本信息、研究特征、结果测量等内容,确定和选择需要分析和评价的效应变量。必要时还可从原文作者处获取未发表的原始数据。

六.资料的统计学处理

统计学处理是Meta分析最重要的步骤之一,其主要包括:①制定统计分析方案;②明确资料类型;③选择恰当的效应指标;④进行异质性检验;⑤选择适合的统计分析模型;⑥效应合并值的参数估计与假设检验;⑦效应合并值参数估计的图示。

七.敏感性分析

目的是了解Meta分析结论的稳定性。考察Meta分析结论稳定性的方法有:①选择不同统计模型时,效应合并值点估计和区间估计的差异;②剔除质量较差的文献前后,结论的差异;③对文献进行分层前后,结论的差异;④改变纳入和剔除标准前后,结论的差异。

八.结果报告和讨论

主要内容有:①课题研究的背景和对象;②资料检索的方法;③统计分析的方法;④结果报告;⑤讨论(包括异质性及其对效应合并值的影响,各种偏倚的识别与控制,Meta分析结果的实际意义等)

Meta分析的统计模型选择Meta分析常用的统计模型分为固定效应模型(fixed effects model)和随机效应模型(random effects model)两类。通常采用Q值统计量检验法对各个独立研究的结果进行异质性检验,以确定选用何种模型。经异质性检验,如果各个独立研究的结果是同质的,可以采用固定效应模型计算合并后的综合效应;如果各研究的结果不同质,但有必要计算合并后的统计量,则可采用随机效应摸型;如果异质性检验的统计量在界值附近,最好同时采用上述两种模型分别进行计算后做出分析判断。

现在已有相关工具可评价Meta分析,例如可通过AMSTAR工具判断Meta分析的方法学质量,PRISMA量表判断Meta分析的报告质量,GRADE证据质量评价判断Meta分析所呈现的证据体的质量。对于Meta分析制作者,在完成基线数据提取、文献质量评价及Meta分析数据处理后,还需要分析与讨论Meta分析的结果从而得到最终的结论。

纳入文献质量评估要点

从纳入文献的全面性、文献结果的真实性、研究间的异质性、Meta分析结果的精确性和倾向性5个方面进行分析。

一.评价纳入文献的全面性

Meta分析结果是多个原始研究结果的合并。为避免出现Meta分析制作者的主观偏倚,如仅纳入报告阳性结果的原始文献,需要审视Meta分析的文献筛选流程,包括检索策略的制定、数据库的选择及文献的筛选过程,从而确保手中的Meta分析结果是基于目前所有可获得的、与研究问题相符合的原始研究。

1.检索策略制定是否合理

检索策略的制定依赖于研究问题,需考虑在患者身上施加何种干预措施并观察何种终点结局,同时也需要考察纳入文献的研究类型。一方面,对于研究问题本身而言,需要考察检索范围是否太窄,以致筛漏文献;另一方面,也需要考察超出研究问题以外的限定是否合理。假设检索策略包含超出研究问题以外的限定,需要阅读原文是否给予合理的解释。倘若存在检索策略以外的限定,例如患者性别、干预的治疗周期、结局的定义、研究周期等,但没有给予很好的解释,那么排除文献是不合理。

2.数据库选择是否全面

医学研究的检索需要考虑3个主要的外文数据库,MedlineCentralEmbase。有时也得考虑某些区域的数据库,例如研究中药的Meta分析需要考虑中国的数据库(中国生物医学文献数据库、万方数据库、维普数据库和中国知网数据库等),也需要考虑那些虽没有被发表、但已有数据发表的研究,如Clinicaltrial.gov上有研究结果的研究。还得考虑是否纳入有相关数据的会议论文甚至硕士、博士论文。会议论文与杂志发表论文相比,可能存在试验不成熟,更易出现数据变动,最后在杂志上发表的数据与会议论文数据不一致,或是在不同会议间发表的内容不一致。同理也适用于硕士、博士研究生沦文。因此,Meta分析中是否纳入这些论文需要谨慎考虑。

3.文献筛选是否出现纰漏

Meta分析需要保证双人或多人达成一致的纳入标准和排除标准后,独立完成筛选过程,所以应回顾筛选过程是否符合要求,是否可能漏筛文献。此外研究问题的限定出现模糊区域时,制作者也不应随便排除文献。此时应该纳入这些文献,并在完成Meta分析后,排除这些文献进行敏感性分析。确定了检索策略的制定、数据库的选择及文献的筛选无误后,还需要再作最后一次验证,考察已发表的指南、综述或纳入文献的引文中,是否存在可纳入、但是依据的检索策略及选择的数据库没有包含的研究,或者在筛选过程中漏掉的研究。

二.评价原始研究结果的真实性

不同类型的临床研究有一套流程以确保研究结果反映研究问题的真实情况,需要考虑原始研究在哪一环节出现了偏倚,以及该偏倚对研究结果的影响如何。

1.是否存在偏倚

我们需要评估原始研究在其主要流程中是否存在偏倚风险。以随机对照研究为例,偏倚风险的评价需要考虑以下主要流程:随机序列的产生、分配结果的隐藏、操作者与参与者的盲法、结果评估者的盲法、试验对照组的随访情况、研究结果的发表和利益冲突者在这项研究中充当的角色等。然而,我们是评价有无偏倚风险存在,而不是评价具体是否进行某项操作。

2.偏倚对结局的影响

当已知存在何种偏倚风险时,需要考虑该偏倚风险会如何影响结果。在大多数情况下,需要估计影响的方向和程度。对于主观的结局,如疼痛、感冒好转时间等结局,偏倚的影响高;而对于客观的结局,如死亡率、骨折等结局,偏倚的影响低。在特殊情况下,也可以利用经验性的分析考察不同的偏倚风险对结果的影响。

三.评价研究的异质性

Meta分析中合并的多个原始研究必须满足一定程度的同质性,这样的合并才是有意义的。所以Meta分析需要考虑研究与研究之间是否有差别以及差别有多大。

1.非统计学异质性

异质性为纳入研究间的所有差别,这些差别可以体现在患者(P)、干预措施(I)、结局(O)及研究设计(S)等方面。这些异质性可分为临床异质性(PIO)和方法学异质性两类,统称为非统计学异质性,可以从基线特征及基线风险考察。

1)研究基线特征是否异质

可以利用系统评价中整理的研究基线特征及文献质量评价结果,直接定性地判断研究非统计学异质性情况。当存在研究证实该干预的不同剂型对不同的人群,或用不同的研究设计等,对研究的结果会产生显著的影响,该异质性在定性的过程中为不可接受的异质性。然而,文献报道该异质性无显著影响时,Meta分析可允许部分异质性的存在,因为这可以提高研究结果的适用性。

2)研究基线风险是否异质

通常研究基线风险受到已知与未知因素混杂的影响,可通过比较各个研究的对照组基线风险是否一致,从而粗略判断是否存在异质性。对照组基线风险可总体反映已知与未知混杂因素的影响。

2.统计学异质性

除了定性的非统计学异质性判断方法,还需要使用定量的方法判断统计学异质性,考察Meta分析结果是否被研究之间的差别所影响。在Meta分析中,可以得到异质性检验的结果包括Q值、P值、I2T值。利用这些数据可以判断统计学异质性是否存在,大小如何。

1)是否存在统计学异质性

P<0.05即可判断统计学异质性存在。统计学异质性中P值来源于Q值。Q值为通过各研究数据得出的方差进行标准化后的结果,其真值服从自由度为(k-1)的卡方分布(k为纳入研究总数)。假如不存在研究间的差别,Q值即为随机误差。而P值为在(k-1)的卡方分布中,大于观察到的Q值的概率。P<0.05,则认为合并的研究观察到的方差并非来自于随机误差,即研究间存在显著异质性。

假如发现研究存在显著统计学异质性,需要进一步判断该分析结果是否有误。第一步,确保纳入排除标准及数据的提取没有问题;第二步,尝试解释异质性。可以根据纳入的文献的基本特征,猜想可能存在某种特征的差别使得各研究间疗效的评估有差别。另外,通过亚组分析,从统计学上考察不同亚组之间对疗效的估计是否有显著性的差别;通过Meta回归,考察不同的因素是否可解释异质性的来源;通过敏感性分析,考察是否存在某些不确定的因素影响结果的评估。

2)统计学异质性是否影响结局

尽管具有统计学异质性,研究间的差别只要不够大,就不会影响对结果的判断。可以利用I2判断异质性的大小是否可忽略。I2为纳入的各个研究真值(每个研究样本量无穷大时的值)间的差别占总体研究差别(包括了随机误差及真值间差别)的百分比。需要结合实际情况考虑真值间的差别与随机误差比例为多大,方为可接受的异质性。Cochrane推荐I20%~40%时可考虑无统计学异质性,30%~60%为低异质性,50%一90%为中度异质性,75%~100%为高异质性。此外,研究间异质性大小对结局的影响还与模型的选择有关。固定效应模型默认研究间的设定是一致的,因此,固定效应模型的Meta分析中,允许的异质性大小(I2)会更低。

然而,随机效应模型默认研究间存在差别,且该差别服从正态分布。随机效应模型得出的Meta分析结果为平均的结局估计值,因此允许更大的异质性存在。

与固定效应模型相比,随机效应模型还有另一个统计学工具T值,可更加定量地估计异质性。T值为纳人的各个研究真值间的差别。以其为标准误得出的估计值95%置信区间为纳入的各研究真值的覆盖范围,即当研究样本量无限增大时,Meta分析的95%置信区间。

最后,由于Meta分析得出的统计学异质性还受精确度影响,统计学上发现没有异质性并不代表Meta分析结果不存在异质性。假如所有研究都不精确,95%置信区间都很大,相互覆盖,尽管它们真值有差别,但是统计学检测不出这些差别。此时,还得根据纳入的文献的基本特征分析可能存在的异质性。

四.Meta分析结果的精确性

完成Meta分析后,可获得研究结局的估计值及可信区间。通过可信区间及样本量大小判断研究结果是否精确,即估计值及可信区间是否足以对研究问题下定结论。

1.可信区间是否跨过决策值

Meta分析里二分类变量结局的无效值为1(连续型变量无效值为0)Meta分析结果的95%置信区间跨过无效值,则该结果不够精确,不能对研究问题下定性结论。因为在系统评价Meta分析里只需要得到定性的结果判断有无,所以用的是无效值。然而面对临床问题,结果的判断更应是有无临床意义。临床选择何种干预措施,除考虑临床结局外,还得考虑副作用、经济成本、可及性及患者意愿等,所以临床决策阈值与上述无效值可能不一致。

2.样本量大小是否合适

小样本量研究可能存在抽样误差和不稳定性。小样本量的Meta分析只能分析所针对人群里的部分人群,而这部分人群可能与总人群在基线上或者结局上会有偏差,即预后不平衡。因此,当样本量不足以满足预后平衡时,尽管可信区间显示研究效果的评估为精确,该可信区间仍不可信,即研究结果仍不精确。另外,有些小样本研究是用以考察大样本研究是否有意义以及要进行大样本研究时的注意事项,如某些研究问题早期的初步研究。这些小样本研究可能不成熟,会导致研究结果不稳定。尽管利用这些研究得出的Meta分析结果显示为精确,但其结果的真实性需要谨慎考虑。针对样本量的问题,可以考察系统评价总病例数是否达到具有充分检验效能的常规样本量试验所需要病例数,即考察是否满足最优信息样本量。最优信息样本量是第一类误差的概率a、第二类误差的概率β、非暴露组发病率以及暴露因素引起的相对危险度估计值4个参数决定的。

五.Meta分析结果的倾向性

Meta分析结果是否具有倾向性,可通过评价发表偏倚考察。发表偏倚指具有统计学意义结果或阳性结果的文献更可能被发表,体现在这类研究更易被快速、多次发表,在英文杂志、高影响因子杂志上发表,并更易被他人引用。对于系统评价而言,无统计学意义的、阴性的研究结果与具有统计学意义的、阳性的结果同样重要。因此,尽管已经确保Meta分析纳入的临床研究是目前可获得的所有相关l临床研究,但是还需要考察是否存在某些研究因为无统计学意义或为阴性结果,没有被发表,导致未纳入进行分析,使得Meta分析有某种倾向性。发表偏倚的常见检测方法为漏斗图。漏斗图假设随着研究的样本量增加,研究的精确性增加,得到的估计值应该一致。在漏斗图中以研究的效应估计值为X轴,以标准误(或研究的样本量)Y轴,标准误小的研究的估计值应该是在标准误最大的研究的估计值的两侧均匀分布,并且不超过某个范围。通过对漏斗图分布的不对称性进行简易判断,可初步分析偏倚的原因,判断是小样本量研究、低质量研究还是异质性大的研究引起的。

1.是否为小样本研究引起的偏倚

小样本研究因其治疗效果估计值准确性低,所以它们的效应值分散宽广地分布在图形底部。假如某些小样本研究因其结局不理想而未被发表,则小样本研究结果偏向一侧,因而导致估计总效应值受影响。在固定效应模型中,假设各个研究间的差异来源于样本误差,各研究在Meta分析中所占权重为组内方差的倒数。然而,在随机效应模型中,假设各个研究的差异来源于样本误差和各个研究间自身存在的异质性,各个研究所占权重为组内方差与组间方差之和的倒数。所以相较于固定效应模型,随机效应模型中的小样本研究权重更大,因而受小样本研究引起的发表偏倚的影响更大。所以,对于存在小样本研究发表偏倚的Meta分析,有必要做敏感性分析,考察随机效应模型与固定效应模型的结果是否有显著性差异,如有显著性差异,此Meta分析中应用随机效应模型可能是不合适的。

2.是否为低质量研究引起的偏倚

低质量研究的效应量常不对称地分布在总效应量的周围。当把分布不均的低质量研究与高质量研究合并获得总效应量时,总效应量将受到低质量研究发表偏倚的影响。

3.是否为异质性引起的偏倚

异质性对漏斗图对称性的影响来自多个方面,患者基线风险不一致为常见的异质性来源。排除小样本量研究、低质量研究或是异质性较大研究引起的偏倚后,则考虑漏斗图不对称可能是由于发表偏倚引起的。

附件:Meta分析全攻略,不做实验也能发文章!

半岛

  • 公司总部地址:北京市北京经济开发区经海三路天骥智谷60号楼207室

  • 实验研发基地:天津市武清区武清开发区创业总部基地B座

  • 联系电话:  01067860414

  • 邮箱地址:genecomeservice@163.com

  • Copyright@2020 北京半岛科技有限公司 京ICP备20021745号-1