ナレッジグラフ – 人工知能の基盤そのものを変革する

まず、特にこの有名な用語であるナレッジ グラフの意味を知らない人のために、基本に取り掛かりましょう。

簡単に言えば、構造化データと非構造化データをグラフィカルな方法で格納できるナレッジ ベースに他なりません。 ノードとリレーションシップ (正式には頂点とエッジとして知られる) を使用してデータを表し、ノードはビジネス エンティティまたは属性を表し、リレーションシップの名前が示すように、ノード間の接続のタイプ、方向、強度を示します。

全体として、ビジネス データとビジネス知識を組み合わせて、コンテキスト化された完全に統合されたビューをデータ コンシューマーに提供します。

ディープ ラーニングとナレッジ グラフの間には類似点があります。ディープ ラーニングとナレッジ グラフは、計算能力が向上した近年最前線で歓迎されたように、ナレッジ グラフでさえ、セマンティック コンピューティング空間における長年の研究の結果です。今日のグラフ技術は、現代のビジネス上の問題に対応するために使用できます。

この分野の有機的な拡大とは別に、機械学習モデルの結果を理解するという差し迫った正当な必要性もまた、ナレッジグラフへの最近の関心の爆発に拍車をかけています。

それに加えて、人間と同じように機能します。 私たちが関係を構築して理解する方法は、関係が構造的にどのように機能するかに非常に似ています。 したがって、他のネットワーク化された対応物 (ニューラル ネット) とは異なり、直観的に解釈することもできます。どの組み合わせが機能し、どれが機能しないかを判断し、合理的に機能するもので解決します。 比較すると、これらのグラフは既知の関係とモデル ドメインの知識を活用します。これは、主要な機能を重要度順に特定することがグラフ表現に既に組み込まれているため、モデルのパフォーマンスが高速化されて改善されます。

業界での使用と採用

ナレッジ グラフは、複数のデータ ソースにまたがる 1 つのビュー構造を提供する論理レイヤーとして使用することも、データ レイク上に構築して、その中のデータを包括的に把握することもできます。 また、複数のアーキテクチャ アプローチをサポートすることもできます。異なる方法で格納されたデータのインデックスになる (仮想化) か、データをグラフ形式で複製する (マテリアライズド) かのいずれかです。 最後に、企業データ全体に適した分散システムを設計します。

さまざまな業界でナレッジ グラフを使用できるいくつかのビジネス ケースを次に示します。不正行為の開始とケースの検出で類似の行動をするコミュニティの検出、ビジネスの主要な収益創出クライアントの特定、ジャーニー分析を使用したカスタマー エクスペリエンスの改善、リアルタイムの推奨事項の提案、最適化された情報検索を提供し、根本原因分析を実行して結果をその原因にマッピングし、アルゴリズムの予測を改善します。

具体的なビジネス ケースに移りましょう。機械翻訳のセグメントでこの可能性を想像してみてください。 トークンベースの近さではなく、言語間の意味の類似性に基づいて文が提示される、意味空間と呼ばれるものを作成できないのはなぜですか? 1 つの言語の膨大なデータに基づいて構築された類義語辞典で行われる確率論的アプローチではなく、同義語化されたクロス言語ステートメントのベクトルを提供するようなスペースが必要です。

たとえば、誰かが「月に吠える」を他の言語に翻訳する場合、トークンで区切る必要はありません。 むしろ、同じ意味の空間で、他の言語であっても、「非生産的な活動に従事している」または同様の意味のステートメントを持っている必要があります。 この方法に基づいて構築されたナレッジ グラフは、さまざまなビジネス ケースで言語を超えて容易に使用できます。

企業全体で受け入れられるようになると、Google はその結果を補強するために舞台裏でナレッジ グラフを持っています。 LinkedIn にはソーシャル ナレッジ グラフがあります。 Amazon と Netflix も、約 10 年間これを使用して、顧客や製品の好みについて詳しく調べています。 Airbnb や Comcast でさえ、他の多くの企業と同様に、グラフ テクノロジの恩恵を受けています。 グラフ データベースや関連するデータ サイエンス ツールが広く普及したことで、その採用はますます専門的になっています。

これをどこから始めますか?

業界がナレッジ グラフの可能性を利用できるようにしたグラフ データベースには、Neo4j、ArangoDB、Titan、OrientDB、Dgraph、Amazon Neptune などがあります。

ナレッジ グラフがもたらす最大の利点の 1 つは、非常に大きなコーパスを待って複雑なオントロジーを構築するのではなく、ユース ケースに十分なデータで今日から開始できることです。 あらゆる課題に取り組み、今日のあらゆるニーズに対応する最も簡単な方法から始めることができます。

適切なデータベースを選択し、ビジネス目標に沿って利用可能な内部データに基づいてグラフを試してください。 静的ではないため、ビジネス要件に基づいてオントロジーをタイムリーに繰り返し追加し続けることができます。 この直観的で動的な、信頼できる唯一の情報源は、きっとあなたの役に立ちます。

.

Leave a Comment

Your email address will not be published. Required fields are marked *