脳のダイナミクスを解くと、柔軟な機械学習モデルが生まれます。 MITニュース

昨年、MIT の研究者は、小さな種の脳に触発された「液体」ニューラル ネットワークを構築したと発表しました。これは、実際の安全のために、仕事で学習し、変化する条件に適応できる柔軟で堅牢な機械学習モデルのクラスです。運転や飛行などの重要なタスク。 これらの「流動的な」ニューラル ネットワークの柔軟性は、接続された世界への血統を強化し、脳や心臓のモニタリング、天気予報、株価など、時系列データを含む多くのタスクの意思決定を改善することを意味しました。 しかし、これらのモデルは、ニューロンとシナプスの数が増えるにつれて計算コストが高くなり、基礎となる複雑な数学を解くには厄介なコンピューター プログラムが必要になります。 そして、この数学はすべて、多くの物理現象と同様に、サイズが大きくなると解決が難しくなります。つまり、解決策に到達するために多くの小さなステップを計算する必要があります。 今回、同じ科学者チームが、シナプスを介した 2 つのニューロンの相互作用の背後にある微分方程式を解き、新しいタイプの高速で効率的な人工知能アルゴリズムを解き放つことで、このボトルネックを軽減する方法を発見しました。 これらのモードは、液体ニューラル ネットワークと同じ特性 (柔軟、因果的、堅牢、説明可能) を備えていますが、桁違いに高速で、スケーラブルです。 したがって、このタイプのニューラル ネットワークは、トレーニング後もコンパクトで適応性があるため、時間の経過とともにデータの洞察を得ることを含むあらゆるタスクに使用できます。一方、多くの従来のモデルは固定されています。 「閉形式連続時間」(CfC)ニューラル ネットワークと呼ばれるこのモデルは、モーション センサーや物理モデリングから人間の活動を認識する際の速度とパフォーマンスが大幅に向上し、多数のタスクで最先端の対応するモデルよりも優れたパフォーマンスを発揮しました。シミュレートされた歩行ロボットのダイナミクス、およびイベントベースの順次画像処理。 たとえば、医療予測タスクでは、新しいモデルは 8,000 人の患者のサンプリングで 220 倍高速でした。 この研究に関する新しい論文が本日、 ネイチャー マシン インテリジェンス。 「『CfC』と呼ばれる新しい機械学習モデルは、ニューロンの計算を定義する微分方程式を閉じた形式の近似に置き換え、数値積分を必要とせずに液体ネットワークの美しい特性を維持します」と MIT のダニエラ ルス教授 (ディレクター) は述べています。 Computer Science and Artificial Intelligence Laboratory (CSAIL) の研究者であり、新しい論文の上級著者でもあります。 「CfC モデルは、因果関係があり、コンパクトで、説明可能で、トレーニングと予測が効率的です。 これらは、安全性が重要なアプリケーションのための信頼できる機械学習への道を開きます。」 物事を流動的に保つ 微分方程式を使用すると、進化する世界や現象の状態を計算できますが、時間の経過全体ではなく、段階的に計算できます。 たとえば、人間の活動の認識やロボットの進路など、自然現象を時系列でモデル化し、過去と未来の行動を理解するために、チームはチケットだけを見つけるための数学的トリックの袋に手を伸ばしました。単一の計算ステップで、システム全体の完全な記述。 彼らのモデルを使えば、将来のいつでも、過去のいつでも、この方程式を計算することができます。 それだけでなく、微分方程式を段階的に解く必要がないため、計算速度がはるかに速くなります。 車に取り付けられたカメラからの運転入力を受け取るエンド ツー エンドのニューラル ネットワークを想像してみてください。 …

脳のダイナミクスを解くと、柔軟な機械学習モデルが生まれます。 MITニュース Read More »