ロボットの非言語的社会的行動を生成する深層学習モデル

ロボットの社会的行動の生成には、現在のロボットの行動との連続性を維持しながら、現在のユーザーの行動に対応するために、次のロボットの行動を割り当てることが含まれます。

韓国の電子通信研究院 (ETRI) の研究者は最近、深層学習ベースのモデルを開発しました。このモデルは、ロボットでハグや握手などの魅力的な非言語的社会的行動を生み出すのに役立ちます。 彼らのモデルは、arXiv で公開済みの論文で提示されており、人間同士の相互作用を観察することで、状況に応じた新しい社会的行動を積極的に学習することができます。

この研究を行った研究者の 1 人である Woo-Ri Ko 氏は、TechXplore に次のように語っています。 「私たちは、ソーシャル ロボット工学にディープ ラーニングを適用することに着手しました。具体的には、ロボットが人間と人間の相互作用から社会的行動を独自に学習できるようにすることです。私たちの方法では、人間の行動モデルに関する事前の知識は必要ありません。これは通常、実装に費用と時間がかかります。 .” .”

Ko と彼の同僚によって開発された人工ニューラル ネットワーク (ANN) ベースのアーキテクチャは、Google の研究者によって 2014 年に導入された Seq2Seq (sequence-to-sequence) モデルと敵対的生成ネットワーク (GAN) を組み合わせたものです。 新しいアーキテクチャは、AIR-Act2Act データセットでトレーニングされました。これは、10 の異なるシナリオで発生する 5,000 の人間間の相互作用のコレクションです。

「提案されたニューラル ネットワーク アーキテクチャは、エンコーダ、デコーダ、ディスクリミネータで構成されています」と Ko 氏は説明します。 「エンコーダーは現在のユーザーの行動をエンコードし、デコーダーは現在のユーザーとロボットの行動に従って次のロボットの行動を生成し、ディスクリミネーターは長期的な行動を生成するときにデコーダーが無効なポーズ シーケンスを出力するのを防ぎます。」

AIR-Act2Act データセットに含まれる 5,000 の対話を使用して、110,000 を超えるトレーニング サンプル (短いビデオ) を抽出しました。このサンプルでは、​​人間が他の人と対話しながら特定の非言語的社会的行動を実行しました。 研究者は、ロボットに 5 つの非言語的行動、すなわちお辞儀、見つめる、握手、ハグ、自分の顔を塞ぐ、を生成するようにモデルを特別にトレーニングしました。

Ko と彼の同僚は、一連のシミュレーションで非言語的社会的行動生成のモデルを評価しました。具体的には、研究環境で広く使用されているヒューマノイド ロボットである Pepper のシミュレーション バージョンに適用しました。 彼らのモデルは、人間とのシミュレートされた対話中に適切なタイミングでトレーニングされた 5 つの動作を正常に生成したため、彼らの最初の発見は有望でした。

「深層学習アプローチを使用して、ロボットにさまざまな種類の社会的行動を教えることが可能であることを示しました」と Ko 氏は述べています。 「私たちのモデルは、既存のルールベースのアプローチで事前に定義された行動を繰り返す代わりに、より自然な行動を生成することもできます。ロボットがこれらの社会的行動を生成することで、ユーザーは自分の行動が理解され、感情的にケアされていると感じるでしょう。」

この研究者チームによって作成された新しいモデルは、ソーシャル ロボットの適応性と社会的応答性を高めるのに役立ち、人間のユーザーとの相互作用の全体的な品質とフローを改善する可能性があります。 将来的には、ホーム サービス ロボット、ガイド ロボット、テスト済みの配達ロボット、教育用ロボット、テレプレゼンス ロボットなど、さまざまなロボット システムに実装および実装される可能性があります。

「私たちは現在、ロボットが実際の世界に展開され、人間に面しているときに適切な社会的行動を示す能力をテストするために、さらなる実験を行う予定です。提案された行動ジェネレーターは、ロボットが取得する可能性のあるノイズの多い入力データに対する堅牢性についてテストされます。 .” “、” Ko が追加されました。 「さらに、より多くの相互作用データを収集して学習することで、ロボットが示すことができる社会的行動や複雑な行動の数を拡張する予定です。」

詳しくは:
Woo-Ri Ko 他、エンドツーエンド学習を使用したソーシャル ロボットのための非言語的社会的行動の生成、 arXiv (2022)。 DOI: 10.48550/arxiv.2211.00930

Ilya Sutskever 他、ニューラル ネットワークを使用したシーケンスからシーケンスへの学習、 arXiv (2014)。 DOI: 10.48550/arxiv.1409.3215

Woo-Ri Ko et al、AIR-Act2Act: ロボットに非言語的社会的行動を教えるための人間と人間の相互作用のデータセット、 ロボティクス研究の国際ジャーナル (2021)。 DOI: 10.1177/0278364921990671

© 2022 サイエンス X ネットワーク

引用: ロボットの非言語的社会的行動を生成するディープ ラーニング モデル (2022 年、11 月 24 日)

このドキュメントは著作権の対象です。 個人的な研究または調査を目的とした公正な取引を除き、書面による許可なしに、いかなる部分も複製することはできません。 コンテンツは情報提供のみを目的として提供されています。

Leave a Comment

Your email address will not be published. Required fields are marked *