AI予測モデルの臨床導入、性能維持の難しさ:再学習や他モデルとの併用で精度低下の可能性
【背景】
医療現場でのAI予測モデル導入が進む中、モデルの利用が患者アウトカムに影響を与え、そのデータが電子カルテに記録されることで、将来のモデル性能に影響を及ぼす可能性が指摘されていました。本研究は、この影響をシミュレーションで評価することを目的としました。
【結果】
3つのシナリオでAI予測モデルの性能変化をシミュレーションした結果、感度90%固定で、シナリオ1では再学習後に特異度が9%から39%低下し、シナリオ2では急性腎障害(AKI)予測モデル導入後に作成された死亡予測モデルの特異度が8%から15%低下しました。シナリオ3では、AKIと死亡予測モデルを同時導入すると、互いの有効精度が1%から28%低下しました。
【臨床へのインパクト】
本研究は、AI予測モデルを臨床現場に導入する際、再学習や複数のモデルを併用することで、その予測性能が低下する可能性を示唆しています。モデルの性能を維持するためには、モデルの使用状況を詳細に記録し、継続的な監視と評価が不可欠です。安易なモデル導入は、期待される効果が得られないだけでなく、誤った意思決定に繋がりかねないため、慎重な検討が求められます。
本記事は AI(Gemini)が PubMed 上の英語 Abstract を要約したものです。臨床判断には必ず原著をご確認ください。

