医療画像AIの深層学習研究、デザインと報告基準に課題、臨床医との比較は限定的
【背景】
医療画像診断における深層学習AIの性能が臨床医と同等か優れているかに関心が高まっている。しかし、その研究デザイン、報告基準、バイアスリスク、結論の妥当性については体系的な検証が不足していたため、本研究で包括的に評価した。
【結果】
ランダム化比較試験はわずか2報のみ発表済みで、非ランダム化試験81報中、前向き研究は9報、実臨床での検証は6報に過ぎなかった。比較対象の専門医は中央値4人(IQR 2-9)と少なく、58報でバイアスリスクが高かった。AIの性能が臨床医と同等以上と主張する研究が61報あった。
【臨床へのインパクト】
医療画像診断AIに関する既存の多くの研究は、研究デザインや報告の透明性に課題を抱え、バイアスリスクが高い。AIの優位性を謳う結論は、限定的なデータや不十分な比較対象に基づいている可能性があり、現時点では実臨床への適用を慎重に検討すべきである。今後のAI研究では、より厳密な研究デザインと透明性の確保が不可欠となる。
本記事は AI(Gemini)が PubMed 上の英語 Abstract を要約したものです。臨床判断には必ず原著をご確認ください。

