グラフ深層学習
近近年の機械学習の普及に伴い,より汎用なデータ構造を有するグラフデータを対象とした深層学習の研究が盛んに行われています. 本プロジェクトでは,グラフ深層学習をより高精度で高速に処理する技術開発,およびグラフ深層学習技術を性能評価するためのベンチマーク開発に取り組んでいます.
スマート・エージェント
Smart agents are intelligent, adaptive, and computational entities. While humans are the canonical smart agents, the advent of foundation models - imbued with remarkable language, vision, and reasoning abilities that emulate human behavior - enables us to expand the concept of smart agents to agent-based modeling (ABM). This evolution leads to the introduction of smart agent-based modeling (SABM). Unlike traditional ABM, SABM incorporates foundation models as agents and formulates models using natural language. We employ SABM to investigate natural processes across various fields such as economics and behavioral science. We believe that SABM offers a more nuanced and realistic approach to enhancing our comprehension of natural systems.
大規模言語モデル最適化
Large language models (LLMs) are designed to handle and produce extensive natural language content. They develop an understanding of the structure, meaning, and knowledge embedded in human language datasets. Our focus includes three specific areas: (1) Fundamental technologies in Transformer-based LLMs, (2) Tailoring LLMs to specialized tasks, and (3) Refining methods for LLM agents.
検証可能なデータエコシステム
データに付随する信頼度やリネージュ(来歴)を第一級のデータとしてサポートし、任意のデータを検証可能なデータエコシステムを研究開発します。 包括的な信頼度・検証モデル及びトランザクションを考慮したデータベース修復の理論的基盤を構築します。 さらに、高信頼分散ストレージを含むシステムのアーキテクチャを検討、プロトタイプシステムによる実証実験を行い、提案システムの有効性を検証します。
分散クエリ処理最適化
現代のデータベースの複雑さと、ますます高まる高速データ処理の需要が、クエリ最適化に重大な課題をもたらしています。 データベースシステムの進歩にもかかわらず、すべてのクエリに対して最適なパフォーマンスを達成することは、膨大な数の実行計画や基盤となるデータ分布のために依然として困難です。 本プロジェクトでは、クエリの実行をデータパターンやワークロード特性に基づいて自動的に改善するために、機械学習技術をクエリ最適化に統合することを探求します。
グラフデータベース管理システム
グラフデータは、モノ間の関係性をモデル化することができ、様々な身近な応用に利用されています。
例えば、モノとモノの関係性を知識グラフとして構造化することで、Web検索や商品の推薦システムに利用されています。
他にも、分子データは原子をモノとし原子間のつながりを関係性として表現することで、同じデータ構造をもつ分子の検索などに活用できます。
ソーシャルネットワークサービスや道路網なども、我々の生活に密接しており、グラフの大規模化と多様化が進んでいます。
大規模かつ多様なグラフデータに対して、効率的な管理と高速な検索を可能にするデータベース技術が求められています。
企業においてもグラフデータベースは最も注目されているデータベースであり、Amazon, Microsoft, Googleなどの大企業が開発している一方で、まだまだ開発余地が大きいシステムです。
本研究では、グラフデータベース管理における基礎技術を研究し、新たなデータベース管理システムの開発を目指しています。
例えば、グラフデータ問合せの高速化のための索引技術や問合せ最適化技術の開発や、機械学習を活用した検索の高速化を研究しています。加えて、グラフデータベースの国際標準化にも貢献しています。