[English]

研究プロジェクト

アリやハチの群れや人間社会の営みを観察していると,各々が自分の意思で勝手に行動しているにも関わらず,全体として秩序や均衡が生み出される様子に驚かされます。このように,自ら状況を判断し意思決定する複数の主体(エージェント)が,互いに影響を及ぼし合いながら全体としてある目的を達成するシステムをマルチエージェントシステムと呼びます。工学的観点からは,中央集中制御によらない自律分散型のシステムもまたマルチエージェントシステムの一種と考えることができます。

当研究室では,広い意味でのマルチエージェントシステムを対象に,個々のエージェントの振る舞いから秩序や均衡が創発されるメカニズムの解明と,その工学的応用について研究しています。とりわけ,数理論理学(形式手法),ゲーム理論,分散アルゴリズム,分散最適化などの様々な理論や手法をもとにした分野横断的な研究に特色があります。現在取り組んでいる主なテーマとしては,以下のものが挙げられます。


1. 形式手法によるシステムの仕様記述・検証

論理学の応用の一分野に,形式手法(formal methods)があります。これは,ソフトウェアの仕様がプログラマの意図した通りに書かれているかどうかを,数学的に厳密に検証(証明)するための方法です。私たちの研究室では様々なシステム(特に自律分散型のネットワークシステム)を対象とした形式手法について研究しています。そのうちの一つが,認識論的ゴシッププロトコルの耐障害性に関する研究です。

ゴシッププロトコルは,Peer-to-Peer型のネットワークにおいて,隣接するノード同士の一対一の通信により全ノードが情報共有するためのプロトコルです。ゴシッププロトコルに関する研究は古くから行われており,その起源は1970年代の「ゴシップ問題」の研究にまで遡ることができます。この問題は,集団において各人が持つ秘密の情報を電話で(一対一のコミュニケーションで)交換するとき,全員が全員の秘密を知っている状態になるためには何回の通話が必要かを問うものです。その後,こうした理論的研究を経て,様々なゴシッププロトコルが考案されました。 近年,各ノードが知識状態に基づいて決定論的に通信相手を決める認識論的ゴシッププロトコル(Epistemic Gossip Protocol)が提案されました。その基本的なアイデアは,各ノードが知識状態をもとに自律的に通信相手を決定するというものです。これにより,各ノードはこれまでの通信で得られた情報をもとに他のノードの知識状態を推論しながら,必要最小限の送受信のみを行うことが可能となります。

認識論的ゴシッププロトコルに関する従来の研究では,与えられたネットワーク構造に対する効率の良いプロトコルを特定することに主要な関心がありました。一方,実システムへの応用を視野に入れると,ネットワーク内のノードや通信経路における様々な障害に対する信頼性の確保が必要不可欠ですが,そうした研究はこれまでほとんど行われてきませんでした。 このような課題に対して私たちの研究室では,過去の通信で得た他のノードの秘密の情報が消失する障害に対して耐性のある認識論的ゴシッププロトコルを提案しました。具体的には,複数の経路からのメッセージの不整合をもとに他ノードの障害を推論し,消失した可能性のある情報を再度伝えることで,最終的に全員が全員の秘密の情報を共有するというものです。


私たちの研究室ではこの他にも,モデル検査を用いたスケジューリング手法や,論理推論を用いたセキュリティプロトコルの安全性検証法などについて研究しています。また,分散システムに関する研究として,大規模分散ストレージシステムの省電力手法やアクセス制御に関する研究なども行っています。


2. 社会システムの分析

私たちの研究室では,エージェントアプローチによる社会システムの分析を行っています。特に,信念と意見の相互作用による世論の形成過程の分析に関する研究を,フランスINRIA Grenoble Rhône-AlpesのJérôme Euzenat博士の研究グループmOeXと共同で推進しています。

社会の人々が持つ意見の推移を数理モデルにより分析する世論形成(opinion dynamics)の研究がこれまで数多く行なわれてきました。先行研究の多くは,各人(エージェント)があるトピックに対して持つ賛成・反対の意見を数値で表し,世論の形成を近隣のエージェント同士の意見の同調の過程によってモデル化しています。しかしながら,現実には我々は周囲からの意見の表明だけを頼りに自らの意見を決めるのではなく,周囲や環境から得た知識をもとに意見を決めていると考えられます。こうした知識の果たす役割を捉えるために,私たちは数理論理学によるエージェントの知識表現を取り入れた世論形成モデルの構築を目的に研究を行っています。これにより,知識と意見が相互に影響を及ぼし合いながら世論を形成する過程を明らかにすることを目指しています。特に,誤った情報の伝播と世論形成との関係に焦点を当て,陰謀論者による極端な政治的主張の出現やエコーチェンバーによる世論の分断といった,近年SNSにおいて観察される現象の解明を試みています。


この他にも,私達はボードゲームやカードゲームなどを一種の社会モデルとして捉え,ゲームにおける集団の振る舞いがなすさまざまな現象について研究しています。そのうちの一つが,ゲームにおけるプレイスタイルの創出に関する研究です。

近年,特徴的なプレイスタイルによってビデオゲームやボードゲームをプレイするエージェントの研究開発が行われています。これらの研究の多くは,あらかじめ特定のプレイスタイルを想定した上で,それに合わせて定義された報酬関数を用いてエージェントに学習させるという方法が採用されてきました。しかしながら,このような方法では未知のプレイスタイルを発見することが困難です。 私たちは,進化計算を基に,事前に想定することなく同時に複数のプレイスタイルを自動生成するためのフレームワークの構築を目指して研究しています。具体的には,ゲームをプレイする際の特徴的な行動を遺伝子によって表現し,エージェント同士を互いに戦わせて生き残ったもの同士を交配させることにより世代交代を繰り返します。これによって得られた適応度の高いエージェントの特徴をクラスタリングを用いて抽出することにより,最終的に,ゲームに適応したプレイスタイルを特定することができます。 以上の枠組みを用いて,私たちは複雑な戦略が求められる多人数ゲームを対象に,生成された多様なプレイスタイルがゲームの進行に与える影響やプレイスタイル間の相性などを分析しています。さらに,以上で得られた成果の応用として,集団の多様性がパレート最適性などの全体の効用に与える影響を明らかにすることを目指して研究を行っています。 この他にも,私たちは様々なボードゲームやカードゲームを対象に,強化学習やゲーム理論,論理推論などをもとに上手にゲームをプレイするエージェントの研究開発に取り組んでいます。


3. 分散制約最適化

分散制約最適化問題 (Distributed Constraint Optimization Problem: DCOP) は,ネットワーク内に存在する複数のエージェントが協調し,それぞれが持つ変数の値を調整しながら,全体として最適となる変数値の組み合わせを見つける問題です。この問題は,多数のセンサーから構成されるセンサーネットワークの制御など,複数のエージェントが協調するマルチエージェントシステムをモデル化するフレームワークの一つとして知られています。

DCOPを解く代表的なアルゴリズムにADOPT (Asynchronous Distributed OPTimization) があります。ADOPTは,アルゴリズムが有限時間で停止する「停止性」と停止時に必ず最適解が得られる「最適性」という2つの重要な性質を持つとされ,ADOPTに基づく後継のアルゴリズムにおいても同様の性質が成り立つと考えられていました。私たちの研究室では,ADOPTとそれに基づくアルゴリズムの停止性と最適性に対する反例を示しました。これは,ADOPTや後継のアルゴリズムに対して与えられた証明に誤りがあり,実際にはアルゴリズムが停止しない,または、停止時に最適解が得られない可能性が存在することを意味しています。また,ADOPTにおいて反例が存在する原因を特定し,それを修正したアルゴリズム(修正版ADOPT)を提案しました。さらに,修正版ADOPTにおける停止性と最適性を証明しました。

また,私たちの研究室ではDCOPの高信頼化についても研究しています。DCOPを解くためのアルゴリズムはこれまで数多く提案されてきましたが,そのほとんどが,全てのエージェントが正常に動作することを暗に仮定してしました。しかしながら,現実のシステムでは一部のエージェントが故障によって異常動作をする可能性があり,既存のアルゴリズムをそのまま使うと,故障によって最適な解から大きく逸脱するなどの結果を引き起こす恐れがあります。私たちの研究室では,エージェントやネットワークの故障に対して耐性のある分散制約最適化アルゴリズムの開発を行っています。

この他にも,強化学習と分散制約最適化を組み合わせたエージェントの協調動作を実現するためのフレームワークの開発なども行っています。