加載中........
×

非隨機干預性研究(NRSI)偏倚評估工具ROBINS-I

2019-9-25 作者:孫鳳, 高樂, 楊智榮, 詹思延   來源:中華流行病學雜志 我要評論2
Tags: 偏倚  評估工具  

隨機對照試驗(randomized controlled trials,RCT)是評價干預效果的金標準。但由于倫理、可行性等原因,RCT有時難以開展,此時非隨機干預性研究(Non-randomised studies of the effects of interventions,NRSI),可以作為RCT的有效補充,而且NRSI在某些方面有其獨特優勢,人群特征更接近于真實世界,尤其適合研究長期的結局指標、不良反應等,近些年在醫藥衛生領域的應用日益廣泛[1]。NRSI包括觀察性研究以及類實驗,前者主要有隊列研究和病例對照研究等。在這些研究設計中,由于干預措施不是隨機分配的,研究結果更容易受到各種潛在偏倚的影響。因此,利用評估工具對NRSI的偏倚風險進行評價顯得尤為重要,它可幫助使用者科學謹慎地篩選出高質量NRSI研究,再進一步推廣應用或者進行證據整合,從而有效促進循證決策。

一、制定背景

目前,觀察性研究的質量評價工具應用最廣泛的是2008年Newcastle-Ottawa Scale(NOS)量表[2]和1998年Downs-Black清單[3],其中前者多是針對經典的隊列研究和病例對照研究設計,但是對這兩類研究的多數衍生設計并不適用;后者可同時評價RCT與NRSI,但其涵蓋方法學質量和報告質量共計五個方面27個問題,使用過于繁瑣。兩個工具的評價內容既包含了內部真實性也涉及了外部真實性。在ROBINS-I(Risk of Bias In Non-randomised Studies-of Interventions)之前,也有不少研究人員采用Cochrane協作網研發的偏倚風險工具RoB1.0[4]從隨機序列產生、分配隱藏、盲法、結果數據不完整、選擇性報告等方面評價NRSI研究的偏倚風險,但由于RoB1.0是針對RCT開發的,并不能完全適用于NRSI。因此,學者們一直在致力于制定一個更加令人滿意的工具,以更好地完成NRSI的質量評價。

2016年10月Sterne等[5]在BMJ上發表了關于NRSI的更普適的偏倚風險評估工具ROBINS-I,適用干預效果評價的多種非隨機研究類型,主要包括:隊列研究、病例對照研究、類實驗等,是一個領域評估式的工具。該工具的發布對于NRSI領域的質量評價具有里程碑式的意義。ROBINS-I工具由“Cochrane Bias Methods Group”和“Cochrane Non-Randomised Studies Methods Group”兩個學組成員在Cochrane協作網研發的偏倚風險工具RoB1.0[4]基礎上共同開發,從2011年的立題會議到最終發布歷時5年,經歷了數次專家論證,期間曾在2014年9月推出了1.0.0網絡版本[6](即ACROBAT-NRSI,A Cochrane Risk of Bias Assessment Tool:for Non-Randomized Studies of Interventions),隨后根據專家和用戶的反饋建議完成了進一步的修訂。2016年ROBINS-I制作組將所有相關資料發布在其官方網站http://www.riskofbias.info,包括PDF格式的模板、Docx格式的模板、Access表單形式的評價模板及ROBINS-I詳細使用指南。

二、工具解讀

ROBINS-I工具的解讀歸納為4個方面:

1.評價領域的設置:ROBINS-I工具共包括7個評價領域,在領域設置上與平行設計RCT的RoB2.0工具基本相似,但ROBINS-I進一步把評價領域分別歸入到了干預前、干預中和干預后3部分,即:(1)干預前(①混雜偏倚、②研究對象選擇的偏倚);(2)干預中(③干預分類的偏倚);(3)干預后(④偏離既定干預的偏倚、⑤缺失數據的偏倚、⑥結局測量的偏倚、⑦結果選擇性報告的偏倚)。

每個評價領域都由多個信號問題(Signaling question)組成,共計34個信號問題。具體與RoB2.0工具內容對比:①使用者先對各領域的信號問題作出回答,繼而匯總形成各領域偏倚風險的判斷,最后根據7個領域的評價結果對單個NRSI的特定結局作出整體的偏倚風險評價;②從內容上來看,ROBINS-I工具關于干預后的4個評價領域與平行設計RCT的RoB2.0工具的評價領域多有重合,因此理解這后4個評價領域時,也可以參考該工具;③此外,在ROBINS-I中無“其他偏倚”這一領域,即不再考慮增刪偏倚來源的相關領域,但可以適當調整每個領域里的信號問題。見表 1

表 1 ROBINS-I和RoB2.0在領域設置上的對比


2.評價流程:ROBINS-I工具操作流程主要包括3個階段:①第Ⅰ階段:定義研究問題;②第Ⅱ階段:首先構造出一個假想的實用性隨機化“目標”試驗(“target” pragmatic randomized trial),將所研究的NRSI看作這個“目標”試驗的模擬和近似;在評定每個評價領域時,通過信號問題幫助判定者進行判斷;③第Ⅲ階段:每個領域的偏倚風險等級分為“低(low)、中(moderate)、高(serious)、極高(critical)和未獲得評估信息(NI,即不清楚)”5個等級。見 圖 1
PIC/zhlxbxzz-39-3-374-1.jpg
圖 1 ROBINS-I工具操作流程

基于NRSI研究制定系統綜述時,若推薦用ROBINS-I工具對原始研究進行偏倚評價,則每個NRSI研究均需要完成第Ⅱ階段的6個步驟(圖 1),其中步驟3~6是針對具體結局的,即對不同的結局需要分別完成步驟3~6的評價。步驟1:通過構建隨機化“目標”試驗,定義效應指標。步驟2:定義待評價的結局和結果。步驟3:對每個研究結局,分別描述混雜因素和伴隨干預。步驟4:回答7個偏倚領域的信號問題。步驟5:對各信號問題的偏倚風險給出評判,繼而形成各個領域的偏倚風險的判斷。步驟6:對單個NRSI的特定結局作出整體的偏倚風險評價。

3.各領域的評估標準及其信號問題的設置:ROBINS-I明確地為每個領域設置了數個信號問題,要求評估者先對信號問題作出“NA/Y/PY/PN/N/NI”的判斷,分別表示“Not applicable(不適用)”、“Yes(是)”、“Probably yes(可能是)”、“Probably no(可能不是)”、“No(不是)”或“No information(未獲得評估信息,即不清楚)”的回答。通過對信號問題的回答,作者可了解偏倚來源的信息,即相關“信號”,然后依據這些“信號”進一步對各領域的偏倚風險進行評估。需要強調的是,ROBINS-I整體偏倚這一領域是對單個研究單個結局水平的評價,即對同一個NRSI研究,不同的結局可能會有不同的整體評估結果。

(1)混雜偏倚:相關術語:臨床試驗研究中的選擇偏倚(Selection bias as it is sometimes used in relation to clinical trials);分配偏倚(Allocation bias);病例混合偏倚(Case-mix bias);引導偏倚(Channelling bias)。

在NRSI中,不同干預組間研究對象的特征很可能有較大的差別。當一個或多個重要的預后因素可能影響個體是否接受某干預措施時,干預效應的估計就會產生偏倚。因此對尚未控制的混雜引起的偏倚進行風險評價是ROBINS-I的重要部分。

基線混雜可能是大多數NRSI普遍存在的問題,當某個或多個預后變量影響到患者試驗開始時接受何種干預措施的選擇時就會發生。例如一個比較羅格列酮和吡格列酮藥物療效的非隨機試驗,應當考慮藥物治療前的基線血糖,因為該指標是與心血管病結局發生的很強的預后因素,且可能會影響藥物選擇。控制可測量的混雜的適用方法[6]包括:分層、回歸、匹配、標化、G譜估計(g-estimation)和逆概率加權(inverse probability weighting)。這些方法可以對個體變量或傾向評分值加以控制。

ROBINS-I也適用于評價時依混雜造成的偏倚。當NRSI研究者根據個體隨訪時間對不同干預進行劃分時,即評價干預的依從效應時,時依混雜的控制尤為重要。若所接受的干預措施會改變某種預后因素,而變化后的這種預后因素又會反過來影響干預措施的選擇,這種隨時間改變的預后因素則會產生時依混雜。例如,降糖藥物治療開始后測量的血糖水平(一個基線調查后的預后因素)的升降可能會引起藥物種類的選擇。當基線調查后的預后因素本身就受到干預措施的影響時(如降糖治療會影響基線后血糖水平),在統計分析中用常規的調整方法來控制時依混雜顯然是不恰當的。但應注意的是,當研究對象的干預措施發生改變時,應當進行比較的是試驗中所依從干預的效應而非初始分配干預的效應。

(2)研究對象選擇的偏倚:相關術語:觀察性研究中的選擇偏倚(Selection bias as usually used in relation to observational studies and sometimes used in relation to clinical trials);初始偏倚(Inception bias);領先時間偏倚(Lead-time bias);恒定時間偏倚(Immortal time bias)。

當排除的部分合格研究對象、初始隨訪時間或部分結局事件與干預措施和結局有關時,即使各干預措施的效應實際并無差別,此時所得到的結果仍會提示干預措施與結局之間存在聯系。這就稱為選擇偏倚,不同于混雜。例如,關于補充葉酸防止神經管畸形的研究就存在偏倚,因為研究只局限于活產兒,由于死產和治療性流產(從樣本中排除)同時與干預和結局有關。另一個例子是NRSI證實的新型口服避孕孕激素會顯著增加靜脈血栓的風險,與服用舊劑型的受試者相比,服用新劑型的受試者開始治療的時間更近,而在治療過程中,早期發生靜脈血栓的風險最大。需要強調的是,在非隨機研究中應納入某醫療措施的新近應用者,隨訪應從決定使用治療措施時開始,而不應該從治療措施實施時開始,這是為了避免恒定時間偏倚。

我們所指的選擇偏倚僅針對研究內部真實性,不涉及外部真實性的問題(外推性、適用性或可傳遞性等)。例如,在一項僅納入無合并癥患者的研究中,其結果不一定能外推到有合并癥的人群中。但是這樣并不會影響對在無合并癥人群中的干預效應的估計。

(3)干預分類的偏倚:相關術語:錯分偏倚(Misclassification bias);信息偏倚(Information bias);回憶偏倚(Recall bias);測量偏倚(Measurement bias);觀察者偏倚(Observer bias)。

在RCT中干預措施的錯分問題較小,但在NRSI中很容易出現。例如降糖藥處方記錄缺失不能代表未服用降糖藥。無差異錯分與結局無關,通常會使效應估計值偏向無效假設。當干預狀態的錯分與結局或結局風險有關時,就會發生差異性錯分。因此,干預的分組應該在不知曉結局的情況下進行,這一點尤其重要。典型的例子是病例對照研究中的回憶偏倚,已知病例或對照的狀態可產生對暴露情況的回憶偏倚。如果結局對干預狀態的信息有影響時,錯分偏倚同樣也會出現在隊列研究中。例如,一個老年人的隊列,研究結局為癡呆,一些觀察對象在最初可能有中等程度的認知損害,因此在研究開始時對先前暴露情況的回憶可能會受到影響。

(4)偏離既定干預的偏倚:相關術語:實施偏倚(Performance bias);時依混雜(Time-varying confounding)。

偏離既定干預的偏倚(有時稱為實施偏倚),除了試驗組和對照組所研究的干預措施以外,若其他伴隨干預在組間存在系統性差異,此時會產生偏離既定干預的偏倚。例如,當研究對象知道他們所接受的干預措施,或研究者對試驗組和對照組間的差異有所假設時,偏離既定干預的偏倚就有可能會發生。此外,出現以下情況時,也可能會產生偏離既定干預的偏倚:各干預措施并不一定能成功實施(例如若實驗室檢查出現錯誤,那么就無法按既定方式給藥),或研究對象不依從干預措施,或是重要的共同干預措施在各組間不均衡等。

依從性差或共同干預是否會導致偏倚取決于所研究的效應。對于干預分配效應來說,這兩者不會引入偏倚。相反,若研究關注的是干預措施的依從效應(如調查藥物不良反應),就會產生偏倚。例如,一個比較食管癌低侵襲性和開放性術后呼吸道感染率的研究,兩組間在共同干預措施上存在巨大差異。首先,單肺機械性通氣應用于開放性手術組,而低侵襲性治療組采用的是雙肺通氣。其次,硬膜外麻醉在開放性手術組運用的更多:通常用硬膜外麻醉的患者的移動性較差,因此也更容易有呼吸道感染

需要注意的是一些常規的臨床護理也會造成干預措施的差異(例如由于藥物急性毒性而停止用藥),可以被認為是既定干預的一部分。

(5)缺失數據偏倚:相關術語:失訪偏倚(Attrition bias);觀察性研究中的選擇偏倚(Selection bias as it is sometimes used in relation to observational studies)。

數據缺失的原因包括數據損失(失訪)、錯過預約、數據收集的不完整、進行分析時排除部分研究對象。在NRSI中,所接受的干預措施、混雜或結局的測量過程都可能發生數據缺失。各組間數據缺失的程度和原因很重要。若缺失數據的比例較低,且各組缺失的原因相近,則偏倚的風險較小。反之,偏倚風險會隨之增大。

(6)結局測量的偏倚:相關術語:檢出偏倚(Detection bias);回憶偏倚(Recall bias);信息偏倚(Information bias);錯分偏倚(Misclassification bias);觀察者偏倚(Observer bias);測量偏倚(Measurement bias)。

結局測量的偏倚是由于結局錯分或測量誤差導致的。若錯分和測量誤差與所接受的干預無關時,則為無差異錯分。與干預或結局無關的隨機誤差(無差異測量誤差)不太可能產生偏倚。有差異的測量誤差(與干預狀態有關)會使得效應估計值存在偏倚。當結局評估者知曉干預措施時,若對各組采用不同的結局測量方法,或測量誤差與干預狀態和效應有關,就會產生檢出偏倚。該問題在主觀性結局的測量中更為明顯。對結局測量采用盲法可降低各組間的系統性差異。但在實際操作中,相比起RCT,盲法在非隨機研究中通常很難實施。

(7)結果選擇性報告的偏倚:相關術語:結果報告偏倚(Outcome reporting bias);分析報告偏倚(Analysis reporting bias)。

若基于結局效應的方向、大小和統計學顯著性進行報告,則容易產生選擇性報告偏倚。該偏倚有3種常見類型:①從多個測量結果中選擇某種測量進行報告,例如從多個時間點測量數據選擇某個時間點的測量值,或從多個疼痛量表中選擇其中一個量表的得分;②從多種方法估計的效應值中選擇一個進行報告,例如,某研究同時計算了變化值以及調整基線后的終點值,或用多種分析方法調整各類混雜,研究者只選擇了其中一個結果進行報告;③選擇某個亞組人群的結果進行報告,這種情況在大型隊列數據中較為常見。

4.整體偏倚評估:在完成信號問題的回答與評估后,評估者需要根據回答的情況對相應領域的偏倚風險按照事先制定的標準給出“低、中、高、極高或不清楚”(low,moderate,serious,critical,or no information)的風險評估。最后,根據所有單個領域的評估結果對“整體偏倚”這一綜合領域作出評價。本文的實例部分將詳細說明每個信號問題和領域如何評價。關于評估標準細則,感興趣的研究者可進一步參閱ROBINS-I官方指南文件了解[7]。

整體偏倚評估原則為:所有7個評價領域為低偏倚風險則整體偏倚風險為“低”(Low risk of bias),所有7個評價領域為風險低或中則總體偏倚風險為“中”(Moderate risk of bias),至少一個評價領域風險高但無任何評價領域為極高風險則整體偏倚風險為“高”(High risk of bias),若至少一個評價領域風險極高則整體偏倚風險為“極高”(Critical risk of bias),若缺乏關鍵評價領域的相關信息,則整體偏倚風險為“未獲得評估信息(不清楚)”(No information,NI)。

三、實例分析

以下介紹1篇已經發表的研究舉例說明ROBINS-I工具早期1.0.0版本使用(即ACROBAT-NRSI[7],該工具的評估領域與ROBINS-I的相同)評價NRSI并與既往偏倚評價方法進行了對比的方法學文獻[8],該文作者根據臨床重要話題,選擇了兩個既往發表的權威的系統綜述作為案例[9-10],對其中納入的NRSI原始研究進行了偏倚評價。本講座選擇該文[7]中的一個有關降糖藥的案例[10]作為示例說明ROBINS-I在系統綜述的實際使用。原綜述作者納入了16項NRSI研究,目的是評估與口服比格列酮相比,口服羅格列酮的2型糖尿病患者是否可以降低心血管病結局的風險[10]。篇幅所限,本文并未按照圖 1的評估流程展示ROBINS-I中所提供的全套相關表格,此處僅對其中一項隊列研究[11]的偏倚評價結果進行示例(表 2)。對于ROBINS-I的詳細評估流程及該案例的相關表格,讀者可登錄網站(http://cpse.bjmu.edu.cn/)獲取,包括:該案例的評估前準備與研究基本信息表、完整的ROBINS-I偏倚評估解讀表及該案例最終納入的16項NRSI研究的整體偏倚風險評價結果匯總表。

表 2 ROBINS-I評估實例

四、討論

整體上來說,ROBINS-I內容豐富、翔實,完善了NRSI研究各個偏倚評估重要組成部分的細節,強調了偏倚評估在證據整合與評價過程中的重要地位。相比于NOS等之前常用的觀察性研究偏倚風險評估工具,ROBINS-I有一些明顯的優勢:①針對性較強,ROBINS-I所針對的觀察性研究主要是以評價干預效果為目的的;②評估內容更全面,ROBINS-I所設置的評估領域和信號問題涵蓋了這類觀察性研究常見的偏倚來源;③評估過程程序化,ROBINS-I細化了具體領域的評估過程,將評估中易于產生困擾和分歧的項目,均使用信號問題進行明確指示,有助于提高評估結果的可重復性和一致性;④ROBINS-I不僅提供了偏倚風險評估,還提供了可能的偏倚方向評估,后者將有助于綜述讀者判斷干預的真實效果方向。

然而,ROBINS-I尚處于初步使用[12-18]和不斷完善階段,目前仍存在一些問題有待開發團隊后續改進。首先,ROBINS-I的可操作性相比NOS等量表明顯下降。根據我們的測試,完成ROBINS-I的時間相比NOS、RoB1.0等都有顯著增加,判斷各領域的偏倚風險時流程復雜。好在這個問題在開發團隊公布程序化工具后已有所改善,目前已有規范的指導手冊展示評估步驟和結果解讀[7]。其次,與RoB2.0新工具一樣,ROBINS-I許多條目涉及到大量方法學專業知識和專業詞匯,非方法學專業的綜述作者可以參考開發團隊已制定的使用說明手冊[7],詳細了解一些方法學詞匯定義及使用方法。再次,工具中一些細節可能需要進一步統一,某些條目中,回答“是”或“可能是”對應的是“低風險”,而另一些條目中同樣的回答卻是“高風險”,這很容易給評估者造成困擾并增加出錯的機會。這些不一致完全可以通過轉變信號問題的提問方式進行統一。此外,現在還沒有能夠方便進行ROBINS-I評估的軟件工具,但ROBINS-I團隊正在努力,目前已經開發了ACCESS表單填寫模板,掛在其官方網站(http://www.riskofbias.info)可供下載使用。期待未來能像RoB1.0那樣,將ROBINS-I整合至下個版本的Review Manager軟件中,或者開發一個界面友好的專用ROBINS-I評估軟件。相信在開發這些專門的軟件以后,評估過程將更加快捷,并會有更好的結果展示方法。最后,ROBINS-I中一些條目的設置從方法學角度來說可能仍有待商榷。特別是對于兩種不同綜述目的(干預的分配效應和依從效應)下分別有不同的信號問題,如何提高這兩類問題的區分度,可能需要開發團隊進一步說明并討論。

此外,對ROBINS-I的使用者來說,還應明確該工具與另一個簡稱為TREND的清單之間的區別。后者是2003年由美國CDC組織制定的關于非隨機對照設計的報告規范[19]。該報告規范強調,非隨機對照試驗的研究報告要詳細報告研究的假設(理論基礎)、干預措施和組間比較的條件,研究設計以及為調整可能的偏倚所采用的方法等。TREND針對的是報告質量,而ROBINS-I針對的是偏倚風險。

綜上所述,我們建議綜述作者持續關注ROBINS-I的更新,以及Cochrane手冊和Review Manager的相應更改的內容。在有條件的情況下,可積極地與開發團隊溝通,及時反饋在理解、使用、方法學等方面遇到的問題與建議,使得ROBINS-I能夠更好的在證據整合、乃至循證醫學工作中體現其意義和價值。

參考文獻:略

原始出處:孫鳳, 高樂, 楊智榮, 詹思延. 偏倚風險評估系列:(五)非隨機干預性研究[J]. 中華流行病學雜志, 2018, 39(3): 374-381



小提示:78%用戶已下載梅斯醫學APP,更方便閱讀和交流,請掃描二維碼直接下載APP

只有APP中用戶,且經認證才能發表評論!馬上下載

thm112988

(來自:梅斯醫學APP)

2019-9-26 6:16:02 回復

139********(暫無匿稱)

(來自:梅斯醫學APP)

2019-9-25 4:52:44 回復

web對話
3d的基本走势