血液培養、本当に必要?AIが判断を助ける時代へ

当ページのリンクには広告が含まれています。
目次

ひとことで言うと

電子カルテのデータをAIが解析し、「この患者に血液培養は必要か」を培養オーダーの時点で判断します。感度95%を保ちながら、培養オーダーの26%以上を安全に減らせた、という研究です。

検査室との関係

2024年、BACTECの培養ボトルが世界的に不足しました。覚えている方も多いと思います。現場では「1セットに減らす」「症例を絞る」といった対応が取られました。でも、結果はどうだったでしょうか。

ある報告によると、ボトル数は27%減りましたが、同時に菌血症の検出率も15%落ちました。やみくもに減らすと、本来見つけるべき菌血症を見逃してしまいます。あの混乱が露呈したのは、「そもそも培養を出しすぎている」という構造的な問題でした。

血液培養の真の陽性率は10%未満とされています。裏を返せば、10本に9本以上は陰性です。不要な培養が増えるほど、コンタミ対応や報告業務の負担も増えます。検査室にとっても他人事ではない話です。

研究がやったこと

スタンフォード大学が、2015〜2025年の救急外来受診10万件超のデータを使い、AIを訓練しました。目的は「培養オーダーを出す時点で、菌血症リスクを自動で予測する」ことです。

使ったのは電子カルテの情報だけです。体温・脈拍・血圧などのバイタル、白血球・乳酸・CRPなどの検査値、年齢・BMIといった患者背景。これら36項目を組み合わせて予測モデルを作りました。

さらに比較として、医師やGPT-5(最新の生成AI)が既存の診断ガイドラインを使って同じ判断をしたらどうなるか、も検証しています。

結果

GPT-5は使い物にならなかった

まず驚いたのがここです。GPT-5に診断ガイドラインを与えて同じ判断をさせたところ、陽性と陰性を正しく見分ける力は約7割にとどまりました。医師が同じことをすると約9.6割でした。

最新の生成AIでも、菌血症の見逃しリスクが高すぎて実用になりません。「ChatGPTに聞けばいい」という発想が、いかに危ういかを示しています。

従来の判断基準にも限界がある

現場でよく使われるSIRS基準は、感度は高いですが「ほぼ全員が陽性判定」になってしまいます。逆にShapiro Ruleは、菌血症の約3割を見逃します。どちらも一長一短で、培養の適否を正確に絞り込む道具としては不十分です。

専用AIは26%削減+見逃し4%以下

今回開発したAI(Cultryx)は、感度95%を目標に設定した上で培養オーダーの26%を「不要」と判定できました。テストデータ上では約15,800本のボトルが節約できる計算です。

見逃した菌血症は全体の4%以下。10件中9.6件は正しく検出できています。「減らしつつ、見逃さない」を両立した点が評価できます。

私の視点

E資格を持つ立場から率直に言うと、この研究で一番重要なのは「GPT-5が使えなかった」という事実だと思います。汎用AIは医療現場の安全基準を満たせません。専用に設計・訓練されたAIでなければ意味がないのです。

検査室の視点で見ると、培養件数が26%減ることの意味は大きいです。コンタミ疑いの対応、感受性試験の追加依頼、報告のやり取り——これらが単純計算で4分の1近く減ります。業務負荷の軽減として、現実的な数字だと感じます。

もう一つ注目したいのは「不要な培養を減らす=不要な抗菌薬を減らす」という連鎖です。陰性培養でも広域抗菌薬が経験的に投与されることは多いです。培養オーダーを絞ることは、抗菌薬スチュワードシップにも直接つながります。

ただし、この研究はまだpreprint(査読前)の段階です。単施設のデータで、外部での検証はこれからになります。すぐに「現場で使える」と考えるのは早計で、今後の実装研究を注目しておきたいと思います。

詳細(AI手法・特徴量・スコア表)

使われたAI手法

Cultryxは「多数決で答えを出すAI」(XGBoost、勾配ブースティング決定木)を使っています。多数の判定員が少しずつ異なる基準で答えを出し、その集計で最終判断する仕組みです。医療データとの相性がよく、予測精度と解釈のしやすさを両立できます。

予測に使われた主な特徴量(上位5項目)

  • 最高体温 38℃超(最も重要な予測因子)
  • リンパ球の最低値 20%未満
  • 好中球の最高値 70%超
  • 血小板の最低値 15万/µL未満
  • ヘモグロビンの最低値 12 g/dL未満

簡易スコア(Cultryxscore)での感度・削減率

電子カルテ連携が難しい施設向けに、上記の項目を点数化した簡易ツールも作られました。感度97.6%を維持しながら培養オーダーの約21%を削減できます。フルモデルより3,200本ほど節約数は減りますが、紙ベースでも使えるのが利点です。

参考文献

Marshall NP, Chen W, et al. Cultryx: Precision Diagnostic Stewardship for Blood Cultures Using Machine Learning. medRxiv preprint. 2026. https://doi.org/10.64898/2026.02.27.26347214

よかったらシェアしてね!
目次