機械学習と統計モデル、心血管疾患リスク予測の個人差とモデル選択の重要性
【背景】
心血管疾患の個別リスク予測には様々な機械学習や統計モデルが用いられるが、モデル間の予測の一貫性や、データ欠損(イベント発生前の追跡終了)が予測に与える影響は不明でした。本研究はこれらの点を検証しました。
【結果】
異なるモデルは集団レベルでは類似した予測性能(C統計量約0.87)を示しましたが、個々の患者のリスク予測は大きく異なりました。例えば、QRISK3で9.5-10.5%のリスクと予測された患者は、ランダムフォレストでは2.9-9.2%、ニューラルネットワークでは2.4-7.2%と予測されました。
【臨床へのインパクト】
様々なモデルが類似した集団レベル性能でも、個別の患者リスク予測には大きなばらつきがあるため、臨床意思決定の際にはモデル間の予測一貫性を評価すべきです。特に、データ欠損を考慮しないロジスティックモデルや一般的な機械学習モデルは、長期リスク予測には不適切であり、QRISK3のような説明可能で欠損を考慮した生存モデルが推奨されます。
本記事は AI(Gemini)が PubMed 上の英語 Abstract を要約したものです。臨床判断には必ず原著をご確認ください。

