機械学習でがん研究の不正論文をスクリーニング、約1割が疑わしいと判明
【背景】
論文の不正製造工場(ペーパーミル)による偽装論文が学術界で問題となっています。がん研究分野におけるペーパーミル論文の現状と、その蔓延状況を評価するため、機械学習モデルを用いたスクリーニング研究が行われました。
【結果】
機械学習モデルは91%の精度を達成し、がん研究論文約265万報のうち26万報以上(9.87%、95%CI 9.83-9.90)がペーパーミル論文に類似すると判定されました。特に中国の研究機関による論文で多く、基礎研究や胃がん、骨がん、肝臓がんの分野で過剰に検出されました。
【臨床へのインパクト】
がん研究におけるペーパーミル論文の蔓延は、臨床医がエビデンスに基づいた診療を行う上で深刻な問題です。不正論文が混入することで、治療ガイドラインや診療プロトコルの根拠が揺らぎ、患者さんの治療選択に悪影響を及ぼす可能性があります。論文選定時には、その信頼性に一層の注意が必要となるでしょう。
本記事は AI(Gemini)が PubMed 上の英語 Abstract を要約したものです。臨床判断には必ず原著をご確認ください。
