2021年9月15日,為促進臨床試驗信息和數據互通,指導醫(yī)療器械注冊申請人規(guī)范遞交臨床試驗數據集相關資料,器審中心形成了《醫(yī)療器械臨床試驗數據遞交要求注冊審查指導原則(征求意見稿)》,現面向公眾公開征求意見。
引言:2021年9月15日,為促進臨床試驗信息和數據互通,指導醫(yī)療器械注冊申請人規(guī)范遞交臨床試驗數據集相關資料,器審中心形成了《醫(yī)療器械臨床試驗數據遞交要求注冊審查指導原則(征求意見稿)》,現面向公眾公開征求意見。
醫(yī)療器械臨床試驗數據遞交要求注冊審查指導原則
(征求意見稿)
一、前言
醫(yī)療器械臨床試驗數據是評價醫(yī)療器械安全有效性的重要支持性資料之一。規(guī)范地收集、整理、分析和遞交醫(yī)療器械臨床試驗數據有助于提高臨床試驗實施和管理質量,同時有利于監(jiān)管機構快速、高效的掌握臨床試驗的開展情況,提高審評效率。
為促進臨床試驗信息和數據互通,指導注冊申請人規(guī)范遞交臨床試驗數據及相關資料,幫助更好地開展臨床評價資料審評相關工作,制定本指導原則。
本指導原則是在現行法規(guī)和標準體系以及當前認知水平下制定的,隨著法規(guī)和標準的不斷完善,以及科學技術的不斷發(fā)展,本指導原則的相關內容也將進行相應的調整。
二、適用范圍
本指導原則適用于以產品注冊為目的開展的醫(yī)療器械臨床試驗,不適用于按醫(yī)療器械管理的體外診斷試劑臨床試驗,亦不適用于真實世界研究。本指導原則僅涉及臨床試驗數據遞交相關內容,不涉及臨床試驗過程中數據管理相關要求。
三、基本原則
臨床試驗數據遞交時應遵循“真實”“可追溯”和“易讀”三項基本原則。
“真實”是指遞交的臨床試驗數據應與實際病例報告表(Case Report Form,CRF)中記錄的數據一致。數據錄入過程中,不應擅自更改數據。如確實發(fā)現CRF表或原始記錄存在異常值或筆誤,應通過有記錄的形式(如Query質疑程序)通知研究者,在原始記錄經過研究者簽字確認修改后,方可更新數據。
“可追溯”是指按照注冊申請人提交的數據和代碼,可從原始數據庫重現形成分析數據庫、臨床試驗報告中的統(tǒng)計結果,重現形成的數據和統(tǒng)計結果與注冊申請人提交的內容一致。
“易讀”是指審閱者熟悉和掌握所遞交數據變量及其結構關系、實現統(tǒng)計分析復驗的容易程度。按照本指導原則相關規(guī)范要求遞交臨床試驗數據有助于提高易讀性。
四、臨床試驗數據相關資料及其說明
醫(yī)療器械臨床試驗數據相關資料通常包括原始數據庫、分析數據庫、說明性文件和程序代碼,以下對各申報資料具體格式和內容提出要求。注冊申請人亦可參照臨床數據交換標準協(xié)會(Clinical Data Interchange Standards Consortium, CDISC)標準遞交數據。
外文資料提供中文翻譯件時,需注意對于原始和分析數據集,至少應翻譯變量標簽、觀測值中的描述性文本(如不良事件描述等)。
(一)原始數據庫
原始數據庫中的數據通常來源于CRF表。原始數據庫中的數據應與CRF表中的數據保持一致,缺失的數據不應進行填補。
原始數據庫通常由多個不同的原始數據集組成,單個原始數據集是相同主題下多個變量的集合,這些變量的觀測值共同形成該原始數據集,例如,人口學資料數據集可包括年齡、性別、身體質量指數(Body Mass Index, BMI)等。不同臨床試驗涉及的原始數據庫不完全相同。單個原始數據集應收集相同主題下的變量,不建議將不同主題的變量集合形成一個原始數據集,例如,膝關節(jié)Lysholm評分和IKDC2000評分相關變量建議分別形成兩個原始數據集。
各數據集需包括受試者唯一標識變量,以實現同一受試者不同數據集觀測值的關聯。如涉及不同訪視時間點觀測的數據,應使用訪視時間變量進行標識。例如,術后3個月和6個月心臟超聲相關觀測值,訪視時間標識變量可命名為Visit_3、Visit_6等進行區(qū)分。若涉及兩個及兩個以上臨床試驗,數據集中需包括臨床研究標識變量。
數據集和變量命名應遵循“易讀”的原則,建議在對其命名時參考數據集或變量的英文或拼音,通過名稱即可聯想到該命名的實際含義。例如,可參考Medical History將病史數據集命名為MH,參考Concomitant Medication將合并用藥數據集命名為CM,將變量“性別”命名為Gender,變量“受試者姓名縮寫”命名為sub_abbr等。名稱最大長度為8字節(jié)。若臨床試驗采用了隨機分組,原始數據庫中應包含隨機號等變量。
(二)分析數據庫
分析數據庫是為便于統(tǒng)計分析形成的數據庫,用于產生臨床試驗報告中的統(tǒng)計結果(包括基線、療效和安全性指標統(tǒng)計分析等)。分析數據庫主要包括原始數據庫中的變量數據和按照一定規(guī)則(如缺失值填補、量表子項評分加和等)使用原始數據庫變量數據衍生的數據。
分析數據庫通常由多個不同的數據集組成,其中的數據集一般與臨床試驗報告中的統(tǒng)計結果項相對應。例如,臨床試驗報告中NIHSS評分統(tǒng)計結果可對應專門的分析數據集,該分析數據集是為了生成NIHSS評分統(tǒng)計結果而專門創(chuàng)建的,包含生成該統(tǒng)計結果的全部變量數據,其他不相關變量數據不納入到該數據集中。為了便于統(tǒng)計分析復驗,分析數據集中的變量應具有可追溯性,變量結構應清晰,不需繁瑣的數據前處理即可開展統(tǒng)計分析。
分析數據集可基于其產生的相應統(tǒng)計結果進行命名,例如,生成不良事件比較結果的數據集可稱為ad_ae(不良事件分析數據集)。建議在分析數據集名稱中加入ad(analysis data)前綴,以標識該數據集為分析數據集。
變量命名和變量長度同原始數據庫要求。注意明確不同分析集(如全分析集、符合方案集和安全集等)標識變量,以及形成數據庫過程中產生的系統(tǒng)變量(如有),如序號、時間等。
(三)說明性文件
1.數據說明文件
數據說明文件用于描述原始數據庫和分析數據庫的內容和結構,是幫助監(jiān)管機構快速掌握各數據庫中各數據集、變量及其相互間的結構關系,實現準確理解遞交數據內容和統(tǒng)計分析復驗的重要工具。
建議采用Excel文件,以表格的形式列明原始數據庫和分析數據庫中所含的數據集、變量、標簽、賦值及其對應關系,具體可參考附錄1《變量說明性文件示例》。為了便于審閱,數據集和變量應具有相應的中文標簽,標簽長度不宜過長。若使用了外部詞典(如MedDRA),應明確使用的外部字典名稱和版本號。
分析數據庫說明文件需列明衍生變量的生成規(guī)則,明確涉及到的變量和計算方法。例如,對缺失值的填補,應明確填補方法,填補的程序代碼也應提供。
注冊申請人應說明原始和分析數據集所用編碼(如UTF-8、EUC-CN等),以避免所遞交的數據集出現亂碼的情形。
2.程序代碼使用說明文件
程序代碼使用說明文件用來解釋說明程序代碼文件使用方法,包括使用代碼文件時是否需修改以及如何修改程序代碼,同時,以表格形式列明各統(tǒng)計結果所使用到的代碼文件和數據集文件名稱。
3.注釋病例報告表
相對于空白CRF,注釋CRF增加了注釋內容,反映了數據庫中變量與CRF表信息收集的對應關系。例如,在性別空白處注釋變量名稱Gender。利用注釋CRF,審閱者可直觀地查閱各變量在CRF表中的位置,可核對是否存在遺漏而未被納入原始數據庫中的重要變量數據。
4.其他說明性文件
除以上說明性文件外,鼓勵注冊申請人提交其他有利于審評人員快速了解臨床試驗數據庫內容和結構的說明性文件(如概覽性文件、其他特殊情況說明文件等)。
(四)程序代碼
需遞交的代碼主要包括:生成隨機化編碼的代碼、用于原始數據庫生成分析數據庫的代碼、分析數據庫生成統(tǒng)計結果的代碼等,用于調整格式或生成表格的相關代碼不需遞交。遞交的代碼應符合通常的編程格式和編程規(guī)范,結構清晰明了,易于閱讀。代碼中以中文注釋的形式描述不同過程步的目的以及其他需解釋的內容。代碼若涉及宏程序,宏程序代碼也需提供。應避免提交復雜嵌套的宏程序,如果提交了復雜嵌套的宏程序,應充分驗證以確保在不同的計算機系統(tǒng)環(huán)境中均可運行該程序。
五、遞交方式
所有的文件(原始數據庫、分析數據庫、說明性文件和代碼)按照指定的文件夾結構存放在一個總文件夾中(見附錄2)。
原始數據庫和分析數據庫建議采用XPT數據傳輸格式進行遞交,如果一個XPT文件包含一個數據集,XPT文件名需與數據集名稱保持一致。如果一個XPT文件包含多個數據集,需注意避免將來自原始數據庫和分析數據庫的數據集放在同一個XPT文件中。建議采用XPT第5版本(簡稱XPT V5)或以上版本作為數據遞交格式。
數據說明文件可采用PDF、Word、Excel等文件格式,其中變量詞典建議采用Excel文件,注釋病例報告表建議采用PDF文件。
程序代碼建議采用TXT文件格式。