附件:真實世界數(shù)據(jù)用于醫(yī)療器械臨床評價技術(shù)指導(dǎo)原則(征求意見稿)
為有效解決影響和制約醫(yī)療器械創(chuàng)新、質(zhì)量、效率的突出性問題,加快實現(xiàn)醫(yī)療器械治理體系和治理能力現(xiàn)代化,立足我國監(jiān)管工作實際,圍繞審評審批制度改革創(chuàng)新,國家藥品監(jiān)督管理局啟動中國藥品監(jiān)管科學(xué)行動計劃。基于行動計劃首批項目“真實世界數(shù)據(jù)用于醫(yī)療器械臨床評價的方法學(xué)研究”的研究成果,制定本指導(dǎo)原則。
本指導(dǎo)原則旨在初步規(guī)范和合理引導(dǎo)真實世界數(shù)據(jù)在醫(yī)療器械臨床評價中的應(yīng)用,為申請人使用醫(yī)療器械真實世界數(shù)據(jù)申報注冊以及監(jiān)管部門對該類臨床數(shù)據(jù)的審評提供技術(shù)指導(dǎo)。
本指導(dǎo)原則是供申請人和審查人員使用的技術(shù)指導(dǎo)文件,不涉及注冊審批等行政事項,亦不作為法規(guī)強制執(zhí)行,如有能夠滿足法規(guī)要求的其他方法,也可采用,應(yīng)在遵循相關(guān)法規(guī)的前提下使用本指導(dǎo)原則。本指導(dǎo)原則基于現(xiàn)有科學(xué)發(fā)展和認知水平制定,隨著真實世界數(shù)據(jù)研究的發(fā)展、提高和相關(guān)法規(guī)政策、標準制定等情況的變化,本指導(dǎo)原則還會不斷地完善和修訂。
一、概述
(一)真實世界數(shù)據(jù)與證據(jù)
本指導(dǎo)原則所述真實世界數(shù)據(jù)是指來自現(xiàn)實醫(yī)療環(huán)境的、傳統(tǒng)臨床試驗以外的數(shù)據(jù),反映實際診療中患者健康狀況和醫(yī)療服務(wù)過程。
圍繞相關(guān)科學(xué)問題,綜合運用流行病學(xué)、生物統(tǒng)計學(xué)、循證醫(yī)學(xué)等多學(xué)科方法技術(shù),利用真實世界數(shù)據(jù)開展的研究統(tǒng)稱為真實世界研究。它通過對臨床常規(guī)產(chǎn)生的真實世界數(shù)據(jù)進行系統(tǒng)性收集,并在預(yù)先設(shè)定的研究假設(shè)下,運用合理的流行病學(xué)設(shè)計和統(tǒng)計分析方法,可為前瞻或回顧性研究,與傳統(tǒng)臨床試驗互為補充。信息技術(shù)支持的臨床實踐所產(chǎn)生的大量臨床數(shù)據(jù)為進行真實世界研究奠定了基礎(chǔ)。
真實世界證據(jù)指的是,通過分析真實世界數(shù)據(jù),形成產(chǎn)品使用、潛在風(fēng)險/收益相關(guān)的臨床證據(jù)。但是,由于真實世界數(shù)據(jù)來源和類型不同,數(shù)據(jù)質(zhì)量和涵蓋的信息差異較大,并非所有的真實世界數(shù)據(jù)都適用于支持醫(yī)療器械臨床評價。在符合要求的前提下,基于真實世界數(shù)據(jù)形成的真實世界證據(jù)可顯示醫(yī)療器械在全生命周期的風(fēng)險獲益特征,可能構(gòu)成有效科學(xué)證據(jù)并用于監(jiān)管決策。
(二)真實世界研究的優(yōu)勢與局限性
相比于傳統(tǒng)臨床試驗,真實世界研究是在現(xiàn)實的健康醫(yī)療環(huán)境下開展,對納入患者病情限定更少,覆蓋人群更廣,樣本量可能較大,研究結(jié)果的外推性可能較好。真實世界研究強調(diào)綜合利用多種數(shù)據(jù),如醫(yī)院電子病歷、登記數(shù)據(jù)、區(qū)域健康醫(yī)療數(shù)據(jù)、醫(yī)療保險數(shù)據(jù)等,使獲得長期臨床結(jié)局數(shù)據(jù)成為可能。真實世界研究還可用于觀察罕見嚴重不良事件,回答罕見疾病的相關(guān)問題,評價臨床結(jié)局在不同人群之間的差異。
真實世界研究的局限性來自兩方面。第一,真實世界數(shù)據(jù)來源眾多,在數(shù)據(jù)收集、存儲過程中,常會出現(xiàn)測量/分類錯誤或數(shù)據(jù)缺失等情況;數(shù)據(jù)未實現(xiàn)結(jié)構(gòu)化,數(shù)據(jù)質(zhì)量有待評價;不同數(shù)據(jù)源之間的鏈接存在挑戰(zhàn)。第二,基于真實世界數(shù)據(jù)開展的研究通常存在多種偏倚和混雜,研究結(jié)果在實現(xiàn)因果推斷方面存在較大挑戰(zhàn)。
常見的真實世界數(shù)據(jù)來源包括登記數(shù)據(jù)庫、醫(yī)院電子病歷、區(qū)域健康醫(yī)療數(shù)據(jù)、醫(yī)保數(shù)據(jù)、健康檔案、常規(guī)公共監(jiān)測數(shù)據(jù)、患者自報數(shù)據(jù)(包括居家環(huán)境)、其它健康檢測(如移動設(shè)備)產(chǎn)生的數(shù)據(jù)等。適用于醫(yī)療器械的真實世界數(shù)據(jù)除上述情形外,還可包括在醫(yī)療器械生命周期中生產(chǎn)、銷售、運輸、存儲、安裝、使用、維護、退役、處置等過程中產(chǎn)生的數(shù)據(jù)(如驗收報告、維修報告、使用者反饋、使用環(huán)境、校準記錄、運行日志、影像原始數(shù)據(jù)等)。
從特定器械臨床評價的角度出發(fā),上述數(shù)據(jù)來源按數(shù)據(jù)形成時間與研究開展時間的關(guān)系,可分為兩大類。第一大類是既有的數(shù)據(jù)資源,即在開展當前研究時,數(shù)據(jù)資源已經(jīng)存在。根據(jù)數(shù)據(jù)產(chǎn)生過程的差異,該類數(shù)據(jù)資源又分為兩種情況:
(一)產(chǎn)生于醫(yī)療服務(wù)的提供和付費過程,基于管理目的生成,如醫(yī)院電子病歷數(shù)據(jù)、醫(yī)保數(shù)據(jù)、健康檔案等。
(二)基于數(shù)據(jù)庫建立時的研究目的,設(shè)立統(tǒng)一的數(shù)據(jù)標準和數(shù)據(jù)收集模式,在常規(guī)健康醫(yī)療環(huán)境下形成并建立的數(shù)據(jù)資源,如登記數(shù)據(jù)、基于實效性臨床試驗形成的數(shù)據(jù)庫。
第二大類是以特定器械的臨床評價為目的,設(shè)立明確的數(shù)據(jù)標準和數(shù)據(jù)收集模式,在常規(guī)健康醫(yī)療環(huán)境下形成的數(shù)據(jù)資源。典型數(shù)據(jù)包括以器械為對象產(chǎn)生的登記數(shù)據(jù)、實效性臨床試驗數(shù)據(jù)等。
真實世界數(shù)據(jù)質(zhì)量直接影響真實世界研究結(jié)果的證據(jù)強度。真實世界數(shù)據(jù)的質(zhì)量評價是開展真實世界研究的基礎(chǔ),需建立和實施相應(yīng)的質(zhì)量保障和評估措施。真實世界數(shù)據(jù)質(zhì)量評價,需綜合考慮源數(shù)據(jù)質(zhì)量以及研究過程的質(zhì)量控制。
使用既有數(shù)據(jù)資源的數(shù)據(jù)進行臨床評價時,需針對具體研究問題,評估既有數(shù)據(jù)是否涵蓋研究所需人群、關(guān)鍵變量及隨訪時長,是否能獲得醫(yī)療器械識別信息、使用信息等,以及這些變量的準確性及完整性。其次,需基于具體的研究設(shè)計對既有數(shù)據(jù)進行規(guī)范化的清理及提取,形成真實世界研究數(shù)據(jù)集。
對于主動收集數(shù)據(jù)的情形,首先需考慮研究設(shè)計的科學(xué)性和可行性。真實世界研究的納入和排除標準通常較為寬泛,需保證核心隨訪時間點的隨訪質(zhì)量。其次,需確保數(shù)據(jù)的真實性、準確性、可追溯性,建立系統(tǒng)的隨訪規(guī)范,對研究人員進行培訓(xùn)與監(jiān)管。需在研究開始前充分識別可能的研究偏倚和混雜因素,并在制定研究計劃和編制病例報告表時包含相關(guān)混雜因素的測量和記錄,并在數(shù)據(jù)分析階段采用分層分析、多因素分析以及傾向性評分等統(tǒng)計方法來控制、校正這些混雜因素造成的影響。
評價數(shù)據(jù)管理的規(guī)范性,可從管理流程、人員、信息系統(tǒng)、數(shù)據(jù)標準化等方面進行全面考慮。關(guān)于數(shù)據(jù)標準化,需有標準化的文檔格式及數(shù)據(jù)結(jié)構(gòu),使用標準化的變量字典等。
評價數(shù)據(jù)質(zhì)量,需考慮數(shù)據(jù)的相關(guān)性和可靠性。數(shù)據(jù)的相關(guān)性主要考慮其是否可充分回答與研究目的相關(guān)的臨床問題,個體水平特定結(jié)局變量的充分性,并從回答臨床問題的角度對各相關(guān)變量進行評估。在數(shù)據(jù)的可靠性方面,需重點考慮數(shù)據(jù)采集的準確性,包括在采集前確定采集范圍、采集變量,制定數(shù)據(jù)詞典、規(guī)定采集方式(如數(shù)據(jù)提取表)等,以確保誤差最小化,并充分保障數(shù)據(jù)的真實性和完整性等。
從醫(yī)療器械臨床評價角度,當真實世界數(shù)據(jù)用于醫(yī)療器械臨床評價的具體研究時,應(yīng)基于具體研究目的,進行研究的總體策劃和設(shè)計。研究總體策劃包括明確研究問題、確定數(shù)據(jù)來源、確定數(shù)據(jù)的生成方式或者數(shù)據(jù)的清洗及提取規(guī)范以及組建研究團隊等。研究總體設(shè)計包括確定設(shè)計類型、明確研究對象和研究變量、識別混雜及偏倚的來源并進行合理控制以及制定統(tǒng)計分析計劃等步驟。在策劃、設(shè)計及實施真實世界研究的過程中,倫理與數(shù)據(jù)安全問題亦需得到充分的重視。
無論選擇何種真實世界數(shù)據(jù),需注意的是真實世界研究存在的偏倚。這些偏倚可能限制了研究結(jié)果在因果關(guān)系上的推斷和解讀。為盡量減少潛在的偏倚,研究者需要在研究的策劃、設(shè)計、實施以及分析階段進行識別,并預(yù)先制定相應(yīng)措施,在獲取及分析數(shù)據(jù)前謹慎而周密的形成研究方案及分析計劃。申請人可以根據(jù)數(shù)據(jù)與研究問題的匹配程度,選擇不同的研究設(shè)計,必要時也可以同時選擇多種研究設(shè)計。
真實世界研究設(shè)計類型主要分為實效性試驗研究設(shè)計和觀察性研究設(shè)計及其他設(shè)計。
1.實效性試驗
在實效性試驗中,以實效性隨機對照試驗(pRCT)為代表的干預(yù)性研究是重要組成部分。實效性隨機對照試驗,又稱為實用性隨機對照試驗,是指在真實或接近真實的臨床醫(yī)療環(huán)境下,采用隨機、對照的設(shè)計比較臨床實踐中不同干預(yù)措施的治療效果。與傳統(tǒng)隨機對照試驗不同,pRCT通常是在實際臨床醫(yī)療環(huán)境中開展,研究對象可能存在多種合并癥,干預(yù)過程與臨床醫(yī)療實踐保持較好一致,但同時受干預(yù)者技巧和經(jīng)驗的影響等。因此,在研究策劃和設(shè)計上需要多方考慮。
依據(jù)隨機分組單元選擇的不同,實效性隨機對照試驗可包括:
(1)個體隨機實效性對照試驗,即以個體作為隨機分組單位進行干預(yù)和觀測。對于器械臨床評價而言,通常隨機單元是患者個體。
(2)整群隨機實效性對照試驗,指以群組(如醫(yī)院、診所、小區(qū)或?qū)W校等)作為干預(yù)單元,在分析此類研究設(shè)計的數(shù)據(jù)時,除考慮群組效應(yīng)外,也應(yīng)以個體為單位進行效應(yīng)評價。
(3) 階梯楔形隨機對照試驗,是一種特殊的群組隨機對照試驗,群組在不同的開始時間(階梯式的)被隨機分配接受干預(yù)措施。
pRCT中的結(jié)局指標需根據(jù)研究的具體目的選擇,可包括安全性、有效性、治療依從性、衛(wèi)生經(jīng)濟等方面。結(jié)局指標通常選擇對患者(或研究結(jié)果的運用者)有重要臨床意義的指標,一般不采用生物學(xué)或影像學(xué)等中間指標。在干預(yù)措施無法做到盲法時,建議選擇不易因干預(yù)分配開放而受影響的結(jié)局指標如腦卒中、腫瘤大小等。通常情況下,應(yīng)根據(jù)具體的研究設(shè)計進行樣本量的計算。
pRCT通常選用常規(guī)治療、標準治療或公認有效的治療措施作為對照,一般不采用安慰效應(yīng)為對照。因注重評價遠期結(jié)局,pRCT一般需進行結(jié)局的多時點測量,隨訪時間較長,隨訪頻率常低于常規(guī)隨機對照試驗。
pRCT主要關(guān)注干預(yù)措施在實際臨床環(huán)境下的效果,但研究場所和環(huán)境仍需結(jié)合疾病特征和臨床實際來判斷,其研究對象應(yīng)盡可能反應(yīng)真實診療中應(yīng)用研究干預(yù)措施的患者群體。
2.觀察性研究
基于真實世界數(shù)據(jù)開展觀察性研究時,不同來源的數(shù)據(jù)質(zhì)量不同,暴露與結(jié)局的測量可能與研究本身的定義存在不一致,治療分配通常根據(jù)醫(yī)生的判斷,而非隨機分配,如何識別和控制可能的混雜和偏倚,是觀察性研究在設(shè)計和分析階段的重要考量。如設(shè)計時不進行全面考慮,將引入較高的偏倚,限制因果推斷。當擬用真實世界觀察性研究確認暴露與結(jié)局的因果關(guān)系時,建議對研究的關(guān)鍵要素與環(huán)節(jié)進行審慎思考,根據(jù)研究目的事先制定研究計劃以及統(tǒng)計分析計劃。
在設(shè)計真實世界觀察性研究時,首先應(yīng)確定研究目的,提出在醫(yī)療器械臨床評價中擬解決的問題,并闡明研究假設(shè)。建立研究假設(shè)時,建議重點考慮構(gòu)建研究問題的關(guān)鍵要素,即P(Population, 人群)、I(Intervention, 干預(yù))、C(Control, 對照)、O(Outcome, 結(jié)局)、T(Timing, 時間)是否可基于真實世界數(shù)據(jù)產(chǎn)生,包括真實世界數(shù)據(jù)中是否可提取出滿足要求的研究人群數(shù)據(jù),是否能形成相對統(tǒng)一或標化的干預(yù)方案,是否可設(shè)置可比的對照,是否包含研究所需的結(jié)局評價指標及測量結(jié)果。
觀察性研究包括隊列研究(前瞻性、回顧性與雙向隊列)、病例-對照研究及衍生設(shè)計(如巢式病例-對照研究)、自身對照的病例系列等設(shè)計類型。申請人可根據(jù)研究目的以及可獲得的真實世界數(shù)據(jù)特征,選擇恰當?shù)难芯吭O(shè)計,也可以同時選擇多種研究設(shè)計。申請者需要對整個過程當中存在的可能的偏倚進行全面識別(如選擇偏倚、測量偏倚等),并建立有效的措施盡可能控制措施。
3. 其他設(shè)計類型
采用真實世界數(shù)據(jù)作為外部對照的單組試驗設(shè)計,是形成臨床證據(jù)的一種設(shè)計類型。其中,歷史對照因臨床實踐的差異性、隨訪時間的變化性,以及診斷和結(jié)局測量標準缺乏一致性等原因,通??杀刃暂^差。選擇同期對照而非歷史對照,收集研究相關(guān)變量的詳細、準確信息,是改善這些局限的有效方法。
在真實世界研究中,研究者需要根據(jù)研究目的、數(shù)據(jù)類型以及研究設(shè)計類型酌情應(yīng)用合理的統(tǒng)計學(xué)方法,常見的統(tǒng)計分析方法見附錄2。
真實世界研究中常見的研究設(shè)計主要包括試驗性研究及觀察性研究兩大類型。其中,試驗性研究中具有代表性的為實效性隨機對照試驗(pRCT),融合了隨機化和真實世界數(shù)據(jù)的優(yōu)勢,可相對較好地控制混雜和偏倚的影響。這類研究中的統(tǒng)計分析方法與傳統(tǒng)臨床試驗沒有本質(zhì)差別,其統(tǒng)計分析計劃包括數(shù)據(jù)集定義、分析原則與策略、缺失數(shù)據(jù)處理、分析指標與分析方法、亞組或分層分析、敏感性分析、補充分析和結(jié)果報告等方面。統(tǒng)計分析的基本原則亦為意向性治療分析原則。常用的分析方法包括參數(shù)檢驗、非參數(shù)檢驗、分層分析、回歸分析等多種方法。
基于真實世界數(shù)據(jù)的觀察性研究由于更容易產(chǎn)生混雜和偏倚,數(shù)據(jù)分析的關(guān)鍵是采用統(tǒng)計分析技術(shù)對最大限度的控制混雜因素造成的偏倚。在真實世界數(shù)據(jù)的觀察性研究中,同樣推薦在統(tǒng)計分析之前預(yù)先制定統(tǒng)計分析計劃,以降低研究結(jié)果為假陽性的概率。常用的分析方法除傳統(tǒng)的分層分析、多變量分析方法外,還包括傾向性評分等方法。
基于真實世界數(shù)據(jù)形成的真實世界證據(jù)可支持醫(yī)療器械全生命周期臨床評價,涵蓋上市前臨床評價及上市后臨床評價。真實世界證據(jù)用于醫(yī)療器械臨床評價的常見情形如下:
(一)在同品種臨床評價路徑中提供臨床證據(jù)
同品種臨床評價路徑是基于同品種醫(yī)療器械的臨床數(shù)據(jù)開展臨床評價,需要的臨床數(shù)據(jù)包括同品種產(chǎn)品的臨床數(shù)據(jù)和/或申報產(chǎn)品的臨床數(shù)據(jù)。
對于同品種產(chǎn)品的臨床數(shù)據(jù),真實世界數(shù)據(jù)是其重要來源,其有助于確認產(chǎn)品在現(xiàn)實醫(yī)療環(huán)境中的安全有效性,識別產(chǎn)品的潛在風(fēng)險(如罕見的嚴重不良事件),甚至通過獲知同類產(chǎn)品在不同人群中的實際療效,明確最佳使用人群;通過知曉同類產(chǎn)品的行業(yè)水平,為申報產(chǎn)品的上市前風(fēng)險/收益評價提供信息。合法獲得的申報產(chǎn)品真實世界數(shù)據(jù),可用于確認申報產(chǎn)品與同品種器械間的差異,不對申報產(chǎn)品的安全性有效性產(chǎn)生不利影響。
(二)用于支持產(chǎn)品注冊,作為已有證據(jù)的補充
由于全球法規(guī)尚待進一步協(xié)調(diào)以及受產(chǎn)品上市策略等因素影響,多數(shù)醫(yī)療器械尚未實現(xiàn)全球同步上市。注冊申請人可綜合考慮產(chǎn)品設(shè)計特點及適用范圍,已有的臨床數(shù)據(jù),各監(jiān)管區(qū)域?qū)τ谂R床證據(jù)要求的差異等情況,在已上市監(jiān)管區(qū)域收集真實世界數(shù)據(jù)并形成真實世界證據(jù),支持在中國的注冊申報,以避免在中國境內(nèi)額外開展臨床試驗。
(三)臨床急需進口器械在國內(nèi)特許使用中產(chǎn)生的真實世界數(shù)據(jù),可用于支持產(chǎn)品注冊,作為已有證據(jù)的補充
根據(jù)國家統(tǒng)一部署,在部分區(qū)域指定醫(yī)療機構(gòu)內(nèi),特許使用臨床急需且在我國尚無同品種產(chǎn)品獲準注冊的醫(yī)療器械,按照相關(guān)管理制度和臨床技術(shù)規(guī)范使用產(chǎn)生的真實世界數(shù)據(jù),經(jīng)過嚴格的數(shù)據(jù)采集和系統(tǒng)處理、科學(xué)的統(tǒng)計分析以及多維度的結(jié)果評價,可用于支持產(chǎn)品注冊,作為已有證據(jù)的補充。特別是通過境外臨床試驗進行臨床評價,有證據(jù)表明/提示將境外臨床試驗數(shù)據(jù)外推至中國人群可能受到境內(nèi)外差異的影響時,可考慮使用該類數(shù)據(jù)進行橋接研究。
(四)作為單組試驗的外部對照
在單組臨床試驗設(shè)計中,可從質(zhì)量可控的真實世界數(shù)據(jù)庫中提取與試驗組具有可比性的病例及其臨床數(shù)據(jù),作為外部對照。外部對照通常來源于具有良好質(zhì)量管理體系的登記數(shù)據(jù)庫,其可接受申辦者和監(jiān)管方等的評估,以確認其數(shù)據(jù)的相關(guān)性和可靠性。建議采用同期外部對照,如使用歷史數(shù)據(jù)進行對照,將因為時間差異引入多種偏倚,降低臨床試驗的證據(jù)強度。
(五)為單組目標值的構(gòu)建提供臨床數(shù)據(jù)
目標值是專業(yè)領(lǐng)域內(nèi)公認的某類醫(yī)療器械有效性/安全性評價指標所應(yīng)達到的最低標準,包括客觀性能標準和性能目標,是在既往臨床數(shù)據(jù)的基礎(chǔ)上分析得出,用于試驗器械主要評價指標的比較和評價。真實世界數(shù)據(jù)可作為構(gòu)建或更新目標值的數(shù)據(jù)來源。
(六)支持適用范圍和適應(yīng)癥的修改
醫(yī)療器械上市后,基于所在監(jiān)管區(qū)域的相關(guān)法規(guī),在合法使用的前提下,獲得的真實世界數(shù)據(jù)可用于支持適用范圍和適應(yīng)癥的修改??赡艿那樾伟ㄔ诤戏ㄊ褂眠^程中發(fā)現(xiàn)額外的療效,或者某些境外監(jiān)管區(qū)域法規(guī)許可的批準范圍外使用等。
(七)支持在說明書中修改臨床聲稱
醫(yī)療器械上市后的真實世界證據(jù),可用于支持修改說明書中的臨床聲稱。例如,對于測量、計算患者生理參數(shù)和功能指標的醫(yī)療器械,部分生理參數(shù)和功能指標在上市前評價時主要關(guān)注窮測量和計算的準確性,未充分發(fā)掘其臨床價值。真實世界數(shù)據(jù)可用于構(gòu)建生理參數(shù)和功能指標、或者基于其做出的臨床治療決定,與臨床結(jié)局之間的因果推斷,從而修改說明書中產(chǎn)品的臨床聲稱。
(八)支持附帶條件批準產(chǎn)品的上市后研究
對用于治療罕見病、嚴重危及生命且尚無有效治療手段的疾病和應(yīng)對公共衛(wèi)生事件等急需的醫(yī)療器械,附帶條件批準上市后,可利用真實世界數(shù)據(jù)開展上市后研究,以支持注冊證載明事項的完成。
(九)用于高風(fēng)險植入物等醫(yī)療器械的遠期安全有效性評價
高風(fēng)險植入物等醫(yī)療器械,特別是市場上首次出現(xiàn)的高風(fēng)險植入物,在上市前臨床評價中,難以確認產(chǎn)品的遠期療效和風(fēng)險,識別罕見嚴重不良事件??衫谜鎸嵤澜鐢?shù)據(jù)進行該類產(chǎn)品的上市后研究,確認產(chǎn)品的遠期安全有效性,完成產(chǎn)品的全生命周期臨床評價。
(十)用于治療罕見病的醫(yī)療器械全生命周期臨床評價,加快其上市進程,滿足患者需求
真實世界數(shù)據(jù)可在多維度支持治療罕見病的醫(yī)療器械快速上市。如擬開展上市前臨床試驗,真實世界數(shù)據(jù)可作為單組試驗的外部對照,或者用于構(gòu)建目標值;附帶條件批準后,真實世界數(shù)據(jù)可用于確認產(chǎn)品的有效性,識別產(chǎn)品風(fēng)險,進行產(chǎn)品風(fēng)險/收益的再評價。
(十一)上市后監(jiān)測
產(chǎn)品的上市后監(jiān)測,涉及不良事件監(jiān)測、產(chǎn)品安全有效性再評價等方面,是醫(yī)療器械全生命周期臨床評價的重要組成部分。真實世界數(shù)據(jù)在上市后監(jiān)測中應(yīng)當發(fā)揮重要作用,如通過收集、提取風(fēng)險信號,開展不良事件歸因分析,及時發(fā)現(xiàn)和控制已上市醫(yī)療器械的使用風(fēng)險,分析同時促進生產(chǎn)企業(yè)對已上市產(chǎn)品的設(shè)計改進,推動新產(chǎn)品研發(fā)。
附錄1:常見的統(tǒng)計分析方法
一、實效性隨機對照試驗的統(tǒng)計方法
實效性隨機對照試驗(pRCT)統(tǒng)計分析思想與傳統(tǒng)隨機對照試驗的統(tǒng)計分析思想類似,包括需按照統(tǒng)計分析計劃執(zhí)行,比如考慮調(diào)整協(xié)變量、控制中心效應(yīng)和群組效應(yīng)構(gòu)建統(tǒng)計模型、亞組分析、敏感性分析等。不同的是,pRCT由于在實際臨床醫(yī)療環(huán)境中開展,患者接受干預(yù)的標準化程度降低,依從性也可能低于傳統(tǒng)試驗環(huán)境,同時失訪可能增加。意向性分析是常用的分析方法,但應(yīng)重視對患者失訪的結(jié)局處理,需要預(yù)先明確失訪患者的處理辦法并說明原因。相比傳統(tǒng)隨機對照試驗,pRCT的研究結(jié)果更容易趨向于無效假設(shè)。因此,在設(shè)計非劣效試驗時應(yīng)謹慎使用pRCT的設(shè)計。
此外,由于pRCT在隨機后可能根據(jù)個體差異或臨床專業(yè)人員的選擇,患者接受的干預(yù)會發(fā)生變化,從而產(chǎn)生新的混雜(常稱為隨機后混雜),這些情況需進行協(xié)變量的調(diào)整。常采用相應(yīng)的統(tǒng)計學(xué)模型進行調(diào)整,如多重線性回歸、Logistic 回歸、Cox 回歸、Poisson 回歸等。由于pRCT可能會來自于多個中心,需要對中心效應(yīng)進行控制,當主要結(jié)局變量是連續(xù)性指標時,可采用協(xié)方差分析方法;當主要結(jié)局變量是分類指標時,可采用考慮中心效應(yīng)的Cochran-Mantel-Haenszel方法;當有其他協(xié)變量需要考慮時,可采用隨機效應(yīng)模型。
對于個體pRCT無需考慮群組效應(yīng),而群組隨機對照試驗(cRCT)和階梯楔形隨機對照試驗(swRCT),由于干預(yù)、隨機分配單位為群組和干預(yù)的階段性引入,分析內(nèi)容和方法有別于個體pRCT。cRCT分析可采用混合效應(yīng)模型、多水平/層次建模技術(shù),同時考慮群組、個體水平和組間特征的影響,還可采用貝葉斯層次建模方法獲得干預(yù)效應(yīng)合理的區(qū)間估計。swRCT分析多采用調(diào)整時間效應(yīng)影響的群組隨機效應(yīng)模型進行干預(yù)效果分析。在pRCT統(tǒng)計分析中,建議重視敏感性分析,以評估統(tǒng)計推斷的穩(wěn)健性。
二、觀察性研究常用的統(tǒng)計分析方法
在真實世界數(shù)據(jù)的觀察性研究中,數(shù)據(jù)分析的關(guān)鍵是采用統(tǒng)計分析技術(shù)最大限度的控制混雜因素造成的偏倚。常見的分析方法如下:
(一)分層分析
分層分析是指將數(shù)據(jù)按可能的混雜因素分為多層,每層內(nèi)部的數(shù)據(jù)之間有較好的同質(zhì)性,是最常用的識別和控制混雜偏倚的方法之一。Mantel- Haenszel法是常用的分層分析方法,來評估混雜因素對結(jié)果的影響。該分析可判斷外來因素是混雜還是效應(yīng)修飾作用,或以哪種作用為主,以及確定混雜的大小和方向或效應(yīng)修飾的大小。但是分層分析只能控制少數(shù)混雜因素,若混雜因素數(shù)過多可能導(dǎo)致過度分層,使層內(nèi)樣本量少;對連續(xù)性變量只能用等級分層法,常引起不合理的分組。
(二)多元回歸模型
多元回歸模型是最常見的控制混雜因素的統(tǒng)計分析方法,常用于觀察性研究,根據(jù)結(jié)局變量的特點選擇logistic回歸、線性回歸、Poisson回歸和Cox比例風(fēng)險回歸,根據(jù)數(shù)據(jù)是否存在層次結(jié)構(gòu)考慮是否選擇多水平模型,針對存在重復(fù)測量的數(shù)據(jù)可以考慮廣義線性混合效應(yīng)模型和廣義估計方程。但在應(yīng)用這些模型的時候,仍需要考慮其模型的模型假設(shè)以及模型適用性。
(三)傾向性評分分析方法
傾向性評分分析是目前觀察性研究中用于因果推斷最為常見的分析方法,是一種針對較多混雜因素的調(diào)整方法,尤其適用于暴露因素常見而結(jié)局事件罕見的研究,或者有多個結(jié)局變量的研究。常見的傾向性評分應(yīng)用方法包括傾向性評分匹配法,傾向性評分分層法,逆概率加權(quán)法,以及將傾向性評分作為唯一協(xié)變量納入統(tǒng)計模型進行調(diào)整分析的方法。特別值得注意的是,研究者若在治療結(jié)局評價中考慮使用傾向評分方法。應(yīng)首先在研究方案或分析計劃中,預(yù)先指明用于建立傾向評分模型的變量,以及對模型擬合優(yōu)度和預(yù)測效果進行判斷的標準;更為重要的是,在對基線指標建立傾向評分模型時,應(yīng)保持對結(jié)局指標的“盲態(tài)”,直到傾向評分模型建立完畢并確定后,才將結(jié)局指標引入,直接評價結(jié)果。避免根據(jù)療效結(jié)局的對比結(jié)果重新調(diào)整傾向評分模型,從而獲得“理想”或“預(yù)期”結(jié)果的情況。
在應(yīng)用傾向評分進行分析時,需同時報告使用傾向評分之前和之后的結(jié)果,并需要考慮傾向評分處理后分析方法可能對最終結(jié)果造成的影響,例如,用傾向評分匹配后可能導(dǎo)致的估計精度降低(因樣本量下降);或使用傾向評分加權(quán)時,個別的極大權(quán)重的樣本可能對分析結(jié)果造成較大影響等。特別需要強調(diào)的是,傾向評分方法僅能處理可觀測到的混雜因素,不能控制研究中未采集的混雜因素可能帶來的潛在影響,建議研究中針對評價結(jié)果進行合理的解讀和討論,并開展可能的定量分析。
(四)工具變量分析方法
采用上述分層分析、多變量回歸模型和傾向評分法控制混雜的局限性在于:只能控制已測量的混雜因素的影響,但對于未測量的混雜因素?zé)o法調(diào)整。而采用工具變量的因果效應(yīng)分析方法不涉及具體地對混雜因素/協(xié)變量的調(diào)整,能夠控制未知的混雜因素的影響,進而估計出干預(yù)/暴露因素與結(jié)局的因果效應(yīng)。如果某變量與干預(yù)因素(暴露)水平相關(guān),并且對結(jié)局變量的影響只能通過影響干預(yù)/暴露因素實現(xiàn),同時與暴露和結(jié)局的混雜因素不相關(guān),那么該變量可以稱為其暴露因素的一個工具變量。確定工具變量后,即使存在未知未測的混雜因素,通過分別估計工具變量對暴露和工具變量對結(jié)局的影響效果,即可以估計出暴露對結(jié)局的因果效應(yīng)。利用工具變量估計因果效應(yīng)的方法,最大的難點在于找到符合上述假設(shè)條件的合適的工具變量。在可能的情況下,建議遴選和使用多個工具變量,并說明選擇這些工具變量的原因。通過敏感性分析,檢驗結(jié)果的穩(wěn)健性。