AI自動議事録作成ツールの診療記録の質、人間作成に劣る

📚 掲載誌:Ann Intern Med | 掲載日:2026-04-17 | DOI:10.7326/ANNALS-25-02772

📄 原題:Rapid Evaluation of Artificial Intelligence Technology Used for Ambient Dictation in Primary Care: Comparing the Quality of Documentation of Artificial Intelligence-Generated and Human-Produced Clinical Notes.

🔗 PubMed:PMID: 41996184

【背景】

環境AI書記は診療記録作成の負担軽減に期待されるが、その質を客観的に評価した研究は少ない。ベンダー固有の評価ではなく、文書の質に焦点を当てた独立した比較研究が求められていた。

【結果】

5つの標準化された症例において、人間が作成した診療記録はAIが作成した記録よりも、修正PDQI-9スコアで高い評価を得た。特に急性腰痛症例では、人間が43.8点(95%CI 37.4-50.3)に対しAIは20.3点(95%CI 15.4-25.2)と、-23.5点の大きな差が見られた。

【臨床へのインパクト】

この結果は、現時点でのAI自動議事録作成ツールが、診療記録の質において人間には及ばないことを示唆する。AI導入による医師の負担軽減は期待されるものの、記録の正確性や網羅性、有用性といった質が担保されない場合、診療フローの混乱や医療安全上の問題を引き起こす可能性があるため、大規模な臨床導入には慎重な検討と更なる独立した評価が不可欠である。

本記事は AI(Gemini)が PubMed 上の英語 Abstract を要約したものです。臨床判断には必ず原著をご確認ください。

上部へスクロール