素人が撮ったエコーをAIが補助、DVT診断は成り立つか

当ページのリンクには広告が含まれています。
目次

ひとことで言うと

超音波未経験の看護師がAIガイド付きアプリで撮影したエコー画像を、医師が遠隔でレビューする。そんな仕組みでDVT(深部静脈血栓症)診断は成り立つのか。381人の患者データで検証した結果、専門家による超音波検査を最大50%減らせる可能性が示されました。

ただし、性能を決めるのはAIだけではなく「誰がレビューするか」だった。これが本研究の一番の発見です。

検査室との関係

下肢静脈エコーの依頼が朝から立て込んで、検査枠を空けるのに苦労した経験はありませんか。DVT疑いは緊急性が高く、当日対応を求められることが多い検査です。

もし、AIガイドで看護師でも一定品質の画像が撮れて、医師が遠隔で振り分けてくれるなら──「専門家が出る必要のある症例」だけが検査室に回ってくることになります。スクリーニングの一次対応が変わるかもしれない、という話です。

これは超音波検査士の資格を持たない一般の技師にとっても他人事ではありません。「AIガイド+遠隔レビュー」という構図は、エコーに限らず塗抹判定や心電図、呼吸機能などの領域にも同じ形で応用できる発想だからです。

研究がやったこと

イギリスの11施設で集めた、DVT疑いの患者381人分のエコーデータが対象です。撮影したのは超音波の研修を受けていない看護師で、1時間の操作トレーニングだけ済ませています。

使ったのはThinkSono Guidanceというアプリと、スマホに繋がるハンドヘルド型エコー装置です。アプリがプローブの位置をリアルタイムで認識し、「もう少し下」「ここで圧迫」と画面で指示を出してくれます。撮影は10分程度で終わります。

撮れた動画は2グループの医師が遠隔レビューしました。放射線科医5人と、POCUS(ポイントオブケア超音波)の認定を持つ救急医5人です。両グループは互いの判定を知らされないまま、それぞれが画質と圧迫所見を評価。最終的に専門家が行った標準スキャン結果と比較して、AIガイドの実力を測りました。

結果:レビューする医師で性能が大きく変わった

看護師が撮影したスキャンの80%(304件)が、診断に十分な画質と評価されました。研修を受けたばかりの操作者でも、8割の画像はAIガイドで使い物になるという結果です。

診断性能は、レビューを担当する医師のグループで明確に分かれました。

  • 放射線科医がレビュー:DVTを見つける力(感度)は90〜95%。10人の患者がいたら9〜9.5人を拾える水準。一方、DVTでない人を「ない」と判定する力(特異度)は74〜84%とやや低め
  • 救急医(POCUS認定者)がレビュー:感度95〜98%、特異度97〜100%。ほぼ確実に振り分けられるレベル

同じ画像を見ているのに、結果がここまで違いました。普段からPOCUSで現場の判断を下している救急医のほうが、限られた画質の画像から所見を取る力に長けていたという解釈です。

専門家による超音波スキャンを回避できた割合も計算されています。救急医レビューでは29〜38%、放射線科医レビューでは39〜50%。10件中3〜5件は、専門家を呼ばずに済ませられる計算です。

私の視点:AIより「誰が見るか」が肝

この論文を読んで一番引っかかったのは、AIの性能評価のはずなのに、結論が「レビュー医の専門性で結果が変わる」という話に着地していた点です。

AIガイドはあくまで「素人でも撮れるように補助する道具」であって、診断するのは人間です。看護師が撮った画像が8割は使えるレベルだとしても、その画像から正しく判定できる目がなければ意味がない。現場の感覚としても腑に落ちます。

この構図は、超音波だけの話ではないと感じています。グラム染色の自動撮影、心電図のAI解析、末梢血塗抹のデジタルスキャナ。いずれも「機械が画像を整える→人間が判断する」という同じ流れです。判断する側の経験値が、最終的なアウトプットを決めます。

一般技師の立場でも、AIガイドが普及すれば「未経験の領域でも一次撮影は担えるかもしれない」という業務拡大の話になります。一方で、AIで撮れた画像を最終判定する役割は、やはり経験を積んだ目に頼ることになる。AIが技師を代替する話ではなく、技師の経験値の価値がむしろ際立つ流れだと、私は読みました。

詳細:方法論と統計分析

研究デザイン:多施設前向き単群二重盲検パイロット研究。イギリス11施設で2021年12月〜2023年2月に実施。Wells scoreなど標準的な事前確率スコアでDVT疑いとされた18歳以上の患者が対象。妊娠12週以降や同側既往DVT患者は除外。

画質スコア:ACEP(米国救急医学会)の画像品質スコアを使用。1〜5の5段階で、3以上が診断に十分な画質。

統計手法:3通りで分析。①多数決方式(5人中3人以上の合意で判定)、②ブートストラップ法(500回のリサンプリングで1人のレビュアーをランダム抽出)、③ブートストラップ法+第2読影者(2人がランダム抽出され、合意した場合のみ確定)。第2読影者を加えると、感度・特異度・PPVがさらに向上した。

レビュアー間の一致度:Cohen’s kappaで評価。画質評価について放射線科医は0.15(一致度低い)、救急医は0.59(中等度)。圧迫所見では放射線科医0.61、救急医0.67で、いずれも中等度〜良好。

経済性:先行研究のNMB(純金銭的便益)分析を本研究データに適用したところ、5つのDVTワークフロー戦略すべてで陽性のNMBを示した。AIガイド検査1件あたり90〜120ポンドのコストまで採算が取れる計算。救急医レビューを組み込むと最大NMBは113〜208ポンドまで上昇。

限界:後ろ向き解析であること、看護師とレビュー医の間でコミュニケーションが取れないシナリオでの評価であること。先行のAvgerinosらの前向き研究では、コミュニケーションありで感度100%・特異度95%(n=50)を達成している。

参考文献

Speranza G, Mischkewitz S, Al-Noor F, Kainz B. Value of clinical review for AI-guided deep vein thrombosis diagnosis with ultrasound imaging by non-expert operators. npj Digital Medicine. 2025;8:135.
https://doi.org/10.1038/s41746-025-01518-0

よかったらシェアしてね!
目次