目前人工智能類醫療軟件臨床試驗在中國許多地方開展,適應癥廣泛,獲批的產品也在不斷的增加,以眼底病變產品為例獲批的產品就有:糖尿病視網膜病變輔助診斷類產品、慢性青光眼視神經眼底病變輔助診斷產品以及多病種(視網膜黃斑變性等產品)類。
目前視網膜病變方向人工智能醫療軟件類主要開展的臨床試驗情況如下:
適應癥 | 病例數 | 數據庫類型 | 試驗設計 | 試驗分組 | 主要評價指標 |
黃斑變性 | 50000 | OCT圖像 | 診斷試驗 | 金標準組:臨床結局或視網膜成像檢查包括OCT、眼底照相和眼底熒光素血管造影 試驗組:OCT深度學習技術 | 靈敏度(SEN)、特異度(SPE)、準確度(ACC) |
糖尿病視網膜病變 | 總例數:1000例 | 眼底圖像 | 診斷試驗 | 金標準組:中心閱片閱讀彩色眼底圖片 試驗組:AI | 靈敏度 特異度 陽性符合率 |
糖尿病視網膜病變 | 總例數:1400例 | 眼底圖像 | 診斷試驗 | 金標準組:3位15-20年眼底醫師無時間限制,一致性評分≥2 試驗組:初級眼科醫師+AI | SEN、FPE、ACC、AUC for ROC |
糖尿病視網膜病變 | 1000例 | 眼底圖像 | 診斷試驗 | 金標準組:3位具有10年以上診斷經驗的眼底病醫師根據標準7視野眼底照相結果得出的一致性診斷結論,一致性≧2. 試驗組:AI | 敏感性、特異性、ROC曲線下的面積 |
早產兒視網膜病變 | 1000例
| 眼底圖像 | 診斷試驗 | 金標準:專家應用雙目間接眼底鏡,或借助RetCam拍攝的實時診斷結果做為金標準。 試驗組:AI | 淋巴結個數的一致率 |
注:以上信息來自于中國臨床試驗注冊中心
除上述在研的臨床試驗外,已經批準的創新醫療器械還包括慢性青光眼樣視神經病變眼底圖像輔助診斷軟件的臨床試驗,該設計針對產品的特性,考慮到該產品前期預實驗的靈敏度較高,特異度較低,試驗采用優效對照試驗設計對產品青光眼樣眼底改變檢出眼底照片水平及受試者水平敏感性進行臨床驗證,采用非劣效對照試驗設計對產品青光眼樣眼底改變檢出眼底照片水平及受試者水平特異性進行臨床驗證來綜合驗證輔助診斷產品的有效性及特異性。
主要評價指標設為青光眼樣眼底改變檢出的敏感性、特異性,次要評價指標為青光眼樣眼底改變檢出診斷符合率、假陽性率、 假陰性率、陽性預測值、陰性預測值、陽性似然比、陰性似然 比和平衡 F1 分數,安全性評價指標為不良事件發生率。
人工智能醫療軟件臨床試驗設計要素:根據《深度學習輔助決策醫療器械軟件審評要點》人工智能醫療軟件類設計方法總結為以下幾類,可以根據產品的不同特點以及訓練集和測試集的情況進行靈活選擇,具體見下圖。
人工智能類醫療軟件臨床試驗由于其產品特殊性,在臨床試驗設計過程需要考慮多方面因素,不同的方法樣本量差異較大,因此需綜合考慮產品特性及臨床試驗特點,如通過MRMC設計可減少樣本量,但是需要多位高年資醫生參與閱片。