導入
末梢血液細胞の分類は、白血病や感染症、貧血など多くの疾患の診断や治療方針の決定に直結する重要なプロセスです。
これまでその多くは熟練した臨床検査技師による顕微鏡観察に依存しており、結果のばらつき(技師間差)や分類にかかる時間的コスト、判断が経験や主観に左右されやすいことなどの課題が指摘されています。
また、労働集約的であるため、検査現場の業務負担が重く、特に人手不足の施設では深刻なボトルネックとなっています。
近年、ディープラーニング(深層学習)を用いた自動分類手法が注目されており、こうした課題の克服が期待されています。
本論文では、VGGやResNetなどの既存モデルおよび独自に設計されたCNNモデルを用いて、正常末梢血細胞の高精度な自動分類を目指した研究が報告されています。
研究の要点まとめ
- AI手法
- VGG16/19
- ResNet-50/101/152
- InceptionV3
- MobileNetV2
- DenseNet201
- 独自CNN
- 新バイオマーカー
- N/A
- 精度指標
- AUC N/A
- 感度 最大100%
- 特異度 N/A
- 解釈性
- 各モデルの特徴抽出層と混同行列で評価
- 結論
- 独自開発のCNNモデルが99.91%の高精度を達成し、従来モデルを上回る性能を示した
研究概要
本研究では、17,092枚の正常末梢血液細胞画像(PBC dataset normal DIB)を用いて、ディープラーニングによる血球分類モデルの構築と比較を行いました。
画像はスペイン・バルセロナの病院で取得されており、白血球5種類、幼若顆粒球、赤芽球、血小板の計10クラスに分類されています。
転移学習(Transfer Learning)を活用し、VGGやResNetなどの既存CNNモデル8種の性能を比較したうえで、最終的に22層からなる独自のCNNモデルを設計し、最高精度を達成しました。
対象データ
症例数 | 17,092画像 |
検体種 | 末梢血液(正常) |
施設・国 | Hospital Clinic of Barcelona, スペイン |
研究デザイン | モデル比較・CNN開発研究 |
モデル構築
モデル | Transfer Learning(8種)+独自CNN |
データ分割 | 学習・検証・テストに分割(詳細比率記載なし) |
パラメータ最適化 | Adam最適化・エポック150回・Early Stopping利用 |
AIの解析内容
- 特徴量重要度
-
N/A(モデル内での特徴量の寄与度や重要度は定量的に示されていない)
- Explainability
-
N/A(AIによる可視化や因果的説明は行われていないが、一部の誤分類について形態的類似性が原因と考察されている)
モデル別性能比較(Accuracy)
モデル名 | 分類精度(Accuracy) |
---|---|
VGG16 | 92.34% |
VGG19 | 92.89% |
ResNet-50 | 93.12% |
ResNet-101 | 93.57% |
ResNet-152 | 93.42% |
InceptionV3 | 93.05% |
MobileNetV2 | 92.47% |
DenseNet201 | 94.26% |
独自CNNモデル | 99.91% |
独自に開発された22層のCNNモデルは、既存モデルの中で圧倒的に高い精度(99.91%)を達成しました。
特に、他のモデルで誤分類が頻発していた好塩基球や好酸球についても、わずか1〜2件の誤分類に抑えられ、全10クラス中8クラスで100%の分類精度を記録しています。
このCNNモデルでは、過学習を防ぐためにDropoutやEarlyStoppingを導入し、最適化にはAdam、損失関数にはクロスエントロピーが用いられました。
学習中の損失は0.026まで低下しており、モデルが極めて高い安定性を持つことが示されています。
検査技師の視点での注目ポイント
- 技師が実際に分類で苦労するのは、「正常」と「異常」の境界であり、今後の研究が異常細胞を対象に拡張されることが、現場応用のカギとなります。
- 分類精度が高ければ、技師による再確認やスクリーニング作業を大幅に削減でき、業務効率の向上が期待されます。
- 自動化の導入には、臨床判断支援としての位置づけや、責任分担・法的整備などの制度面での対応が求められます。
- 使用されたデータセットは、クラス間で画像数に偏りがあり(例:Neutrophilsが多く、Basophilsが少ない)、分類性能にも影響する可能性があります。
- 混同行列を確認することで、AIがどの細胞をどの細胞と誤認しやすいかを把握でき、導入時の注意点として活用できます。
- Google Colabを利用してAIモデルが開発されており、高性能なPCや専用ソフトがなくてもクラウド環境でモデル構築・検証が可能です。
今後の課題とまとめ
本研究は、正常血球の分類において99.91%という極めて高い精度を実現し、既存のディープラーニングモデルを凌駕する性能を示しました。
特に、好塩基球や好酸球を除くすべての細胞で100%の分類精度を達成するという、驚異的な結果が得られています。
ただし、異常血球や疾患ごとの分類は対象外であり、実臨床での導入には、より多様なデータを用いた追加検証が必要です。
また、臨床的意義の明確化や、AIによる判別根拠の可視化(Explainable AI)の導入も、今後の重要な課題といえるでしょう。
血液像分類におけるAI活用の可能性を強く示す、非常に有用な研究です。
参考文献
原著論文
Rabia Asghar et al. (2023) Classification of Blood Cells Using Deep Learning Models. Journal of Intelligent & Fuzzy Systems, 45(2):1799–1817.
DOI: 10.3233/JIFS-221253
データセット出典
Acevedo A. et al. (2020) A dataset for microscopic peripheral blood cell images for development of automatic recognition systems. Mendeley Data, V1.
DOI: 10.17632/snkd93bnjr.1