ハーバード大学の最新の人工知能 (AI) 研究は、一般的な画像アーティファクトを含む多重化された組織画像で機械学習アルゴリズムによって画像セグメンテーションの精度を最大化する方法を見つける

組織や腫瘍を構成する細胞の種類、基底膜、および結合構造は、微視的な器官から器官全体 (0.1 ~ >104 m) に及ぶ長さの範囲で見つけることができます。 組織構造の調査では、ヘマトキシリン、エオシン (H&E)、および免疫組織化学顕微鏡法が長い間選択されてきました。 さらに、臨床組織病理学は、がんなどの病気を診断および治療するための主要な方法であり続けています。 ただし、古典的な組織学では、疾患遺伝子を正しく分類したり、発生経路を分析したり、細胞のサブタイプを特定したりするために、より多くの分子データを提供する必要があります。

細胞の種類を特定し、細胞の状態 (静止、増殖、死にかけているなど) を評価し、健康な組織と病気の組織の高プレックス イメージング (空間プロテオミクスとも呼ばれます) を使用して細胞シグナル伝達経路を調査するのに十分です。 保存された 3D 環境では、高プレックス イメージングは​​、組織の完全性に必要な無細胞構造の形態と位置も明らかにします。 高プレックス イメージング技術の解像度、視野、および多様性 (プレックス) はさまざまですが、それらはすべて、通常 5 ~ 10 m の厚さの組織スライスの 2D 画像を提供します。

多重化された写真をセグメント化して定量化することによって生成された単一細胞データは、単一細胞 RNA シーケンス (scRNASeq) データを完全に補完し、健康な細胞と病理学的な細胞および組織の理解を大幅に進めました。 ただし、多重組織イメージングは​​、解離性 RNASeq とは異なり、形態学的および空間的情報を維持します。 しかし、これまで生物学に焦点を当てたマシンビジョンシステムの主な焦点であった培養細胞の写真は、複雑な画像データよりも計算で評価することがはるかに困難です。

後生動物の細胞分割技術は、広範な開発を受けています。 ただし、細胞の密集とさまざまな細胞形状のために、組織の写真を分割することはより困難な問題を提示します。 画像識別、オブジェクト検出、合成画像生成における畳み込みニューラル ネットワーク (CNN) のユビキタスなアプリケーションと同様に、機械学習を使用するセグメンテーション アルゴリズムが最近主流になっています。 ResNet、VGG16、そして最近では、UNet や Mask R-CNN などのアーキテクチャは、何百万ものパラメーターを学習し、データセット全体で一般化する能力が広く受け入れられています。

ほとんどの細胞タイプには核が 1 つしかないため、核の局在化は、培養細胞や組織を分割するための理想的な出発点です。 信号対バックグラウンド比が高い核染色も広く利用できます。 過去の研究者は、クラスごとのピクセル分類に複数のチャネルを使用して、ピクセルごとのクラスの確率を画像に割り当てる決定木のグループを使用する 2 つのランダム フォレスト ベースのアプローチを提案しました。 ただし、ランダム フォレスト モデルの重大な欠点は、CNN よりもはるかに学習能力が低いことです。 したがって、核のセグメンテーションを改善するためにマルチチャネルデータで CNN を利用する可能性については、まだ多くの研究が行われていません。

画像アーチファクトを考慮してトレーニング データを拡張するための最も一般的な方法は、画像を前処理する前にランダムに回転、せん断、反転などを行う計算による拡張です。 これは、画像の向きなど、画像に関する無関係な情報をアルゴリズムが取得するのを防ぐために行われます。 これまでのところ、計算されたガウスぼかしを利用してトレーニング データを補完することで、フォーカス アーティファクトが排除されています。 ただし、ガウスぼかしは、実際の顕微鏡など、バンドパスが制限された光学イメージング デバイスに存在するぼやけの大まかな近似にすぎず、屈折率の不一致と光散乱の結果にすぎません。

この研究では、機械学習技術を使用して、典型的な画像アーティファクトと画像セグメンテーションを使用して、多重化された組織画像の精度を向上させる方法を探っています。 さまざまな正常組織と腫瘍を手動で選択することにより、グラウンド トゥルース アノテーションを使用してトレーニング セットとテスト セットを作成します。 次に、このデータを使用して、UNet、Mask R-CNN、および Pyramid Scene Parsing Network (PSPNet) の 3 つの深層学習ネットワークのセグメンテーション精度を測定しました。これらのネットワークはそれぞれ個別にトレーニングおよびテストされました。 結果として得られるモデルは、細胞を識別して組織をセグメント化するための一連のユニバーサル モデル (UnMICST) であり、それぞれが異なるタイプの ML ネットワークに基づいていますが、同じトレーニング データを使用しています。 彼らは、研究に基づいて、3 つのネットワークすべてのセグメンテーションの精度を高める 2 つの戦略を見つけました。 1 つ目は、DNA インターカレート色素で染色された核クロマチンの写真と、核膜染色 (NES) の写真を組み合わせたものです。 2 つ目は、実際の組織画像に見られるアーティファクトに対してモデルを強化するために、トレーニング データに意図的にぼかして過飽和にした写真として定義されています。 彼らは、実際のデータ拡張が従来のガウスぼかし拡張よりもはるかに優れていることを発見し、モデルの堅牢性を統計的に劇的に改善しました。 NES データと本物の増強を含めることの利点は、さまざまな組織タイプにわたって累積されます。


チェックアウト コード. この研究のすべての功績は、このプロジェクトの研究者に帰属します。 また、忘れずに参加してください 私たちのRedditページ不協和音チャンネルでは、最新の AI 研究ニュース、クールな AI プロジェクトなどを共有しています。


Aneesh Tickoo は MarktechPost のコンサルティングインターンです。 彼は現在、ビライにあるインド工科大学 (IIT) でデータ サイエンスと人工知能の学士号を取得しようとしています。 彼はほとんどの時間を機械学習の力を利用することを目的としたプロジェクトに費やしています。 彼の研究対象は画像処理であり、それに関するソリューションの構築に情熱を注いでいます。 彼は人々とつながり、興味深いプロジェクトで協力するのが大好きです。



Leave a Comment

Your email address will not be published. Required fields are marked *