導入
入院患者に対する検査は、医療の質を維持するうえで欠かせませんが、実際には医学的に不要な検査も少なくありません。
アメリカの医療では、年間最大2,000億ドルが「無駄な検査や処置」に費やされているとされており、特に臨床検査は件数が最も多い医療行為でありながら、その25〜50%が不要と指摘されています。
本研究では、AI(機械学習)を用いて「結果が正常と予測される=情報価値が低い検査」を事前に特定し、検査の適正化を目指す革新的なアプローチが示されました。
検査結果が出る前に「この検査は不要かもしれない」と判断できれば、患者の負担や医療費、医療従事者の業務量のいずれにも良い影響をもたらす可能性があります。
研究の要点まとめ
- AI手法
- XGBoost、ランダムフォレストなど複数の機械学習モデル
- 新バイオマーカー
- N/A
- 精度指標
- AUC 0.90以上(Na 0.92、LDH 0.93、TnI 0.92)
- 感度最大99%
- 特異度最大89%
- 解釈性
- 特徴量重要度に基づくルール抽出および予測スコアの提示
- 結論
- 「正常」と予測される検査を事前に提示することで、低価値な繰り返し検査の抑制が可能
研究概要
本研究では、入院患者に対して医学的価値が低いと考えられる臨床検査(=低収益検査)を、機械学習によって事前に予測し、不要な検査の回避を目指しました。
対象は、米国のスタンフォード大学、ミシガン大学、カリフォルニア大学サンフランシスコ校の3つの大学病院の電子カルテ(EMR)データであり、繰り返し検査や過剰検査の傾向を可視化したうえで、AIモデルを用いて「検査結果が正常と予測されるかどうか」を評価しました。
対象データ
症例数 | 191,506例 |
検体種 | 血液検査、培養など |
施設・国 | 米国・スタンフォード大学病院、ミシガン大学病院、UCSF |
研究デザイン | 後ろ向き診断精度研究 |
モデル構築
モデル | ロジスティック回帰、XGBoost、ランダムフォレスト、ニューラルネットなど |
データ分割 | 学習:検証 = 75:25 |
パラメータ最適化 | 交差検証+特徴量選択(上位5%) |
AIの解析内容
- 特徴量重要度
-
直近の検査結果(正常・異常)、入院経過日数、バイタルサイン、合併症の有無などが主要な要因として挙げられました。
- Explainability
-
「正常と予測される」確率スコアを閾値(例:陰性的中率95%)に応じて提示し、検査を抑制する際の意思決定に活用しています。
例えば、スタンフォード大学病院のデータによると、24時間以内に再実施された検査は79万件以上に上り、その中にはアルブミンやHbA1cなど、生理的に短期間で大きく変化しにくい項目も多く含まれていました。XGBoostモデルを用いた解析では、Na(AUC 0.92)、LDH(AUC 0.93)、TnI(AUC 0.92)など、多くの検査項目において高い予測精度が得られ、「この検査は実施しても正常となる可能性が非常に高い」と判断できるケースが明らかになりました。
さらに、これらのモデルは施設間でも適用可能であり、スタンフォード大学で構築したモデルは、他施設(UCSFおよびミシガン大学)においても、多くの検査項目でAUC 0.85以上の性能を維持していました(Hb、Cr、Naなど)。
検査技師の視点での注目ポイント
- 検査の「実施すべきか否か」をAIが直接判断するものではなく、「この検査結果が正常である可能性が高い(=得られる情報価値が低い)」ことを予測する設計となっています。
- 検査結果が出る前にAIの予測値を提示し、それをもとに人間が意思決定を行うという枠組みであり、検査技師が医師と議論する際の説明材料としても活用しやすい構造です。
- 各構成成分(Na、Hb、Crなど)ごとに個別に予測が行われており、例えば「CBCの中でHbのみが必要で、その他の項目はすべて正常と予測される」といった状況を可視化することが可能です。
- これは、患者集団の特性や検査の運用方法の違いが予測精度に影響を及ぼすことを示しており、施設ごとにローカルデータを用いたモデル構築の必要性を示唆しています。
- 検査技師にも、自施設の検査運用傾向を把握するためのデータ分析スキルが求められる可能性があります。
- 検査技師は単に「検査を実施する立場」ではなく、不要な検査が患者に与える影響を理解し、最小限の検査で最大の効果を引き出す設計に貢献する役割を担うべき存在といえるでしょう。
今後の課題とまとめ
本研究は、AIを活用することで「検査を実施しなくてもよい可能性が高い場面」を定量的に示した点で、非常に先進的です。
特に、95%以上の精度で「正常」と予測される場合には、その検査の情報価値は低下し、むしろ過剰検査によって貧血や誤診リスク、医療コストの増加といった不利益を招く可能性もあります。
今後は、AIの予測を臨床現場でどのように活用するか(例:Best Practice Alertとの連携)、どの程度のリスクを許容するか、誤検出が生じた際の対応などを含めた実装研究が求められます。
また、検査技師もAIの判断根拠や使用される特徴量に習熟し、医師と連携して「検査の価値を最大化する」役割を担うことが期待されます。
参考文献
Xu S, Hom J, Balasubramanian S, et al. (2019) Prevalence and Predictability of Low-Yield Inpatient Laboratory Diagnostic Tests. JAMA Network Open 2(9):e1910967.
DOI: 10.1001/jamanetworkopen.2019.10967