導入
臨床検査では、多くの検査項目を総合的に評価することが求められますが、実際の報告は各項目が個別の数値として提示されます。
そのため、結果の統合的な解釈は医師の経験や判断に依存しており、重要な所見の見落としや誤解釈のリスクが生じやすくなっています。
本研究は、フェリチンをモデルに、他の検査項目の結果からフェリチン値を機械学習で予測できるかを検討したものです。これにより、検査間の情報の冗長性や相関関係を明らかにし、臨床意思決定支援(CDS)の新たな可能性を示しています。
AIが医療データの解析にどのように貢献できるのか、臨床検査の未来を見据える上で非常に示唆に富む研究といえるでしょう。
研究の要点まとめ
- AI手法
- missForestによる補完
- Lasso回帰
- ロジスティック回帰
- 新バイオマーカー
- なし(既存のフェリチン値を予測)
- 精度指標
- AUC 0.97
- 解釈性
- TIBC、MCH、MCVが重要特徴量
- 結論
- 他の検査項目によりフェリチンの予測が高精度で可能であり、場合によっては実測値よりも鉄状態を正確に反映する可能性がある
研究概要
本研究では、マサチューセッツ総合病院の外来患者を対象に、フェリチン検査のデータと他の検査項目、患者背景情報を用いて、フェリチン値を予測できるかどうかを検証しました。
その目的は、検査項目間に存在する情報の冗長性を評価するとともに、AIによって予測されたフェリチン値が、場合によっては実測値よりも患者の鉄状態を的確に反映する可能性があるかを明らかにすることです。
対象データ
症例数 | 5,128件(訓練データ 3,590件、テストデータ 1,538件) |
検体種 | 血液検体(外来採取) |
施設・国 | マサチューセッツ総合病院(米国) |
研究デザイン | レトロスペクティブ、予測モデル構築と検証 |
モデル構築
モデル | 回帰(Lasso)、分類(ロジスティック回帰) |
データ分割 | 7:3(訓練:テスト) |
パラメータ最適化 | Lassoの正則化、missForest補完を100回実行して中央値を採用 |
AIの解析内容
- 特徴量重要度
-
TIBC(AUC=0.85)、MCH(AUC=0.84)、MCV(AUC=0.83)が、フェリチンとの関連性が最も高い項目として示されました。
- Explainability
-
MCVやMCHなど、鉄欠乏を反映する赤血球系の指標が、フェリチン低値の予測に強く寄与していることが分かりました。
本研究は2段階の解析で構成されており、まずは他の検査項目における欠損値を補完(imputation)したうえで、そのデータを用いてフェリチン値の回帰予測および分類(正常/低値)予測を行いました。使用した特徴量は、40項目の検査データに加え、年齢と性別も含まれています。
分類モデルの精度は非常に高く、missForestによる補完とロジスティック回帰を組み合わせたモデルでは、低フェリチンの予測においてAUC 0.97を達成しました。
また、回帰モデルでは、missForest補完 + Lasso回帰の組み合わせで、実測値との相関係数 r = 0.729 という結果が得られました。
さらに、実測値と予測値が10倍以上乖離していた26症例を抽出して検討したところ、そのうち4例では予測されたフェリチン値の方が、実際の鉄状態をより的確に反映していた可能性があると判断されました。
検査技師の視点での注目ポイント
- フェリチンがオーダーされていない場合でも、「潜在的な鉄欠乏リスクあり」といったCDSアラートとして活用することが可能です。
予測結果が外れ値を示した場合には、二次確認のフローを設計することもできます。 - 補完や予測の処理はバックエンドで実行されるため、検査技師の通常業務に大きな負担を与えることなく導入可能です。
ただし、予測結果に対する説明責任やアラート対応の運用体制は、新たな課題となるでしょう。 - AIによる予測フェリチン値は、実測値と併せて「裏付け」や「警告情報」として利用できます。特に急性炎症などでフェリチンが偽高値となる状況では、予測値が補助的な指標として有用です。
将来的には、検査報告書に「実測値と予測値の乖離」がコメントとして表示される可能性もあります。 - 本研究ではLasso回帰を採用しており、各特徴量の重みづけが明示されます。これにより、AIがどの検査項目を重視して予測したのかが明確となり、「なぜこの予測結果になったのか」を検査技師が説明できる根拠になります。
いわゆる“ブラックボックス”でない点は、現場でも非常に重要です。 - 予測精度が高ければ、フェリチンを追加で測定しなくても、他の検査項目から鉄欠乏の可能性を推定できる場合があります。
これは、不要な検査オーダーの削減(=医療費の抑制)や採血量の削減にもつながり、検査の合理化に貢献します。 - 本研究は、既存の検査データを活用して予測モデルを構築した好例です。
今後、検査技師が自施設のLISデータを活用し、独自にアルゴリズムを構築・応用する流れは、新たなキャリア形成の一助にもなり得るでしょう。
今後の課題とまとめ
本研究は、フェリチン値が他の検査項目から高い精度で予測可能であること、さらに一部の症例においては、実測値よりも予測値の方が臨床的に有用である可能性があることを示しました。
この成果は、将来的にAIが臨床検査データの統合的な解釈に貢献し、新たな臨床意思決定支援(CDS)モデルの基盤となる可能性を示唆しています。
今後は、他施設での外的妥当性の検証や、他のバイオマーカーへの応用、さらに時系列データを組み込んだ予測モデルの開発など、研究のさらなる発展が期待されます。
一方で、AIが提示する予測結果の扱いや、それに基づく診断の責任所在といった運用上の課題も多く、検査技師と医師との密接な連携がこれまで以上に求められるでしょう。
参考文献
Luo Y, Szolovits P, Dighe AS, Baron JM (2016) Using Machine Learning to Predict Laboratory Test Results. American Journal of Clinical Pathology 145(6):778–788. DOI:10.1093/ajcp/aqw064