医療画像AIの深層学習研究、デザインと報告基準に課題、臨床医との比較は限定的

📚 掲載誌:BMJ | 掲載日:2020-03-25 | DOI:10.1136/bmj.m689

📄 原題:Artificial intelligence versus clinicians: systematic review of design, reporting standards, and claims of deep learning studies.

🔗 PubMed:PMID: 32213531

【背景】

医療画像診断における深層学習AIの性能が臨床医と同等か優れているかに関心が高まっている。しかし、その研究デザイン、報告基準、バイアスリスク、結論の妥当性については体系的な検証が不足していたため、本研究で包括的に評価した。

【結果】

ランダム化比較試験はわずか2報のみ発表済みで、非ランダム化試験81報中、前向き研究は9報、実臨床での検証は6報に過ぎなかった。比較対象の専門医は中央値4人(IQR 2-9)と少なく、58報でバイアスリスクが高かった。AIの性能が臨床医と同等以上と主張する研究が61報あった。

【臨床へのインパクト】

医療画像診断AIに関する既存の多くの研究は、研究デザインや報告の透明性に課題を抱え、バイアスリスクが高い。AIの優位性を謳う結論は、限定的なデータや不十分な比較対象に基づいている可能性があり、現時点では実臨床への適用を慎重に検討すべきである。今後のAI研究では、より厳密な研究デザインと透明性の確保が不可欠となる。

本記事は AI(Gemini)が PubMed 上の英語 Abstract を要約したものです。臨床判断には必ず原著をご確認ください。

PROFESSOR'S ROUND

現場のプロが選ぶ、
特別な1着を。

洗練されたデザインと最高の機能性を両立した白衣専門店。

公式サイトを見る >
プロフェッサーズラウンドの白衣
上部へスクロール