加載中........
×

Circulation:高影響因子期刊上發表的那些非劣效性試驗

2019-6-24 作者:佚名   來源:醫咖會 我要評論4

近年來發表的非劣效性試驗越來越多,然而,這些研究的方法學質量如何,我們還知之甚少。近日,《Circulation》雜志發表了一項研究,以心血管領域為例,對高影響因子期刊上發表的非劣效性試驗的特征、方法學質量等進行了探討。

研究確定了1990-2016年發表在JAMA、Lancet和NEJM上的非劣效性試驗。兩位獨立評審員提取了數據。關注的數據要素包括非劣效性界值,哪些研究的結果達到了非劣效性,哪些試驗存在可能會影響非劣效性推斷結果的主要或次要因素。

主要的方法學局限性因素包括:沒有同時展示ITT分析(意向性分析)和PP分析(符合研究方案分析)的結果,α>0.05,新治療手段未與最佳治療方案進行比較,沒有證明非劣效性界值的合理性,隊列排除人數或失訪率≥10%。次要因素包括次優盲法,是否分組隱匿等。

研究結果

研究人員在PubMed上進行檢索,共檢索到2,544篇文章,其中110篇(包括111項試驗)符合入選標準(表1)。



表1  入選的非劣效試驗的基本研究特征

研究發表的時間跨度從1992年到2016年。這些試驗中,樣本量中位數為3,006(IQR:1,021-6,068)??蓹z驗到非劣效性的效能(power)中位數為86%(IQR:80%-90%)??蛇M入主要終點分析的患者中位數為2,707(IQR:1,021-5,966)。9項研究(8.1%)提前終止(4項研究由于安全性問題,3項由于入組較慢,1項研究發現無益處,1項研究由于完整性受損)。

非劣效性界值

60項(54.0%)試驗的非劣效性界值是基于ARD(絕對風險差異,absolute risk difference)決定的,50項(45.0%)試驗基于相對差異(29項基于HR,14項基于RR,7項試驗基于OR)。1項試驗的界值基于相對差異但沒有作進一步細分,1項試驗沒有報告非劣效性界值。

各項試驗的非劣效性界值差異很大(ARD在0.4%~25%,HR在1.05~2.85,RR在1.1~1.8,OR在1.1~2.0)。

在發表過研究設計/研究方案相關方法學文章的試驗中,研究人員發現有7篇試驗的研究設計/方案與最終發表的論文之間存在差異或有信息缺失。有的在最終發表的文章中更改了非劣效性界值,有的則缺少如何選擇非劣效性界值相關的部分或全部細節。

主要終點的結果

111項試驗中,有2項試驗,無法評估置信區間。在109項符合標準的試驗中,86項(78.9%)的試驗顯示具有非劣效性(其中20項試驗的結果也顯示出優效性);23項(21.1%)試驗未達到非劣效性(16項研究的結果不確定,7項研究顯示干預措施的結局更差)(圖1)。

 

圖1 納入研究的主要終點的結果

在95項(85.6%)試驗中,主要終點分析是基于ITT分析或校正ITT分析,11項(9.9%)試驗使用PP分析,5項(4.5%)使用其他或未定義的分析類型。

絕大多數(90%)試驗在摘要中適當地報告了研究結果,即是非劣效,優效或劣效性,研究如果沒有達到,則指出未達到非劣效性。但是,還有一些試驗,要么是摘要給出的信息和研究結果之間存在差異,要么是摘要提供的信息不足。

方法學和報告的局限性

表2和圖2顯示了存在主要和次要局限性因素的試驗的比例。70項試驗(63.1%)通過對另一個隊列人群的二次分析(例如,如果首次分析是ITT分析,則再做一次PP分析)來展示主要研究終點,其中66項試驗的結果一致,而4項試驗的兩次分析結果不一致。

 

表2. 納入的研究中是否存在可能導致偏倚的因素



圖2 存在主要和次要局限性因素的試驗分布情況

68項試驗(61.3%)提供了如何確定非劣效性界值,而43項試驗(38.7%)沒有。110項(99.0%)試驗的單側α≤0.05,其中44項試驗的單側α≤0.025。事后分析(post-hoc analysis)發現,與醫療器械試驗相比,藥物試驗的α水平更低(Wilcoxon秩和檢驗P = 0.02)。

在27項研究中(24.3%),有> 10%的參與者提前退出,包括隨訪失訪,提前停止干預或其他原因(表2)。 

總體而言,基于所有主要的偏倚因素,27項試驗(24.3%)被認為具有低偏倚風險。

97項(87.3%)試驗的標題或摘要中報告了非劣效性設計。67項(60.4%)試驗,除了最終的研究論文,還同步發表了研究設計或研究方案的方法學文章。在這67項試驗中,8項(11.9%)試驗的非劣效性界值在最終投稿論文與方案之間存在差異或在其中一篇文章中未披露。

大多數試驗(n = 60,54%)是開放標簽試驗,12項試驗(10.8%)為單盲,39項(35.1%)為雙盲。100項試驗進行了分組隱匿(90%)。91項試驗(82%)對主要終點進行了盲法判定。

總之,基于所有的次要偏倚因素,25項試驗(22.5%)具有低偏倚風險(圖2)。根據所有主要和次要因素,有7項試驗(6.3%)具有低偏倚風險。

事后分析未顯示出三種期刊的文章在主要因素(Kruskal-Wallis檢驗P = 0.28)或次要因素(Kruskal-Wallis檢驗P = 0.11)上的差異。

然而,對非劣效性試驗的研究設計或研究方案的可獲得性進行評估,在三種期刊中,NEJM發表的試驗中,有74.2%發表過相關的方法學文章或有在線的研究方案,JAMA為53.3%,Lancet為33.3%(Fisher精確檢驗P = 0.001)。

時間趨勢

近年來,這些期刊上發表的心血管非劣效性試驗有所增加(P<0.001 for trend,圖3)。一項事后分析顯示,在111項納入的試驗中,發表時間在2010年后的有52項(46.8%)。2010年之后發布的試驗,存在方法學或研究報告局限性的風險有所降低(2010年之前 vs 2010年之后,主要偏倚因素和次要因素的P = 0.03和0.002)。

討論

心血管領域中的非劣效性試驗越來越多地發表在高影響力的期刊上,這些試驗中非劣效性試驗主要用于對新干預措施的檢驗。并且大多數是大型多中心研究。鑒于許多非劣效性試驗已成為批準新療法的基礎,很有必要對他們進行研究。

盡管大多數試驗聲稱新治療手段相比對照組的非劣效性,但很多研究存在具有偏倚風險的方法學或研究報告局限性,可能會削弱其結論的可信度。有必要提高對這些局限性因素的認識,更好遵從FDA和CONSORT指南關于非劣效性試驗設計、實施和報告的建議。

原始出處:
Behnood Bikdeli, et al. Non-Inferiority Designed Cardiovascular Trials in Highest-Impact Journals: Main Findings, Methodological Quality and Time Trends. Circulation. Jun 2019.



小提示:78%用戶已下載梅斯醫學APP,更方便閱讀和交流,請掃描二維碼直接下載APP

所屬期刊:CIRCULATION 期刊論壇:進入期刊論壇

只有APP中用戶,且經認證才能發表評論!馬上下載

yangtongtong

學習了,不錯!

(來自:梅斯醫學APP)

2019-7-4 9:17:08 回復

thm112988

(來自:梅斯醫學APP)

2019-6-26 5:48:34 回復

139********(暫無匿稱)

(來自:梅斯醫學APP)

2019-6-25 5:45:05 回復

飛歌

學習了!很不錯,有收獲

(來自:梅斯醫學APP)

2019-6-25 1:00:18 回復

web對話
广东快乐十分