【フィジカルAI検証事例】4足歩行ロボットのAIを用いた実用可能性の検証|株式会社Athena Technologies、東京電力ホールディングス株式会社と4足歩行ロボットの音声制御を行うAIエージェントの有効性を検証

株式会社Athena Technologies(本社:東京都文京区、代表取締役:阿部 武 以下、「Athena」)は東京電力ホールディングス株式会社(本社:東京都千代田区、代表執行役社長:小早川 智明 以下、「東京電力HD」)と、四足歩行ロボットに対し、ユーザーが音声指示のみで操作可能にする「AIエージェント制御パイプライン」の検証を実施しました。
本検証では、音声で与えた指示を認識・解釈し、四足歩行ロボットの操作コマンドへ変換して実機で実行する仕組みを構築しました。これにより、ロボットの標準操作に加えて、音声を起点としたより自然なロボット操作インターフェースの可能性を検証しました。
四足歩行ロボットの活用に向けて検証した2つのポイント
四足歩行ロボットは、タブレットアプリによる遠隔操作に加え、SDKを用いたアプリケーションからのロボット制御や状態情報の取得も可能です。本検証では、こうした既存機能を前提に、より扱いやすい操作インターフェースを実現するため、以下の2点開発・検証しました。
- 自然言語の指示とロボット操作の接続
- 「パトロールして」「異常がないか確認して」といった言語ベースでの操作が可能になることによって、適用の可能性が模索されています。AIエージェントでの操作の場合、ロボットを実際に動作させるためには、音声指示を実行可能な操作コマンドに落とし込む必要があります。本検証では、音声認識によって取得した指示内容を解釈し、あらかじめ定義した四足歩行ロボットの操作コマンドを参照してコード生成を行うパイプラインを構築しました。
- 安定性、安全性の向上を目指す実行制御
- ロボットの制御では、意図しない動作を避けるため実行範囲や操作手順を適切に制御することが重要です。本検証では、AIに制約なくコードを生成させる方式ではなく、利用可能な操作を限定したうえで、音声入力から四足歩行ロボット実機実行までを接続する構成とすることで、動作の安定性や安全性の担保を目指しました。
Athenaでは、これらのポイントに対して、音声認識と意図解釈をAIで行い、自然言語の指示を四足歩行ロボットの操作へ接続する新たなインターフェースの可能性を検証してまいりました。
4足歩行ロボットの音声制御AIエージェントで事前定義した動作の実行を確認
今回の検証では、主に以下の3つの取り組みを行いました。
| 本検証における取り組み | 実証結果 |
|---|---|
| 音声認識から動作スクリプト生成まで効率化する一気通貫パイプライン | 事前定義した動作の実行を確認 |
| 聞き返し機能による曖昧な音声指示の具体化 | コード生成成功率の改善 |
| 聞き返し機能による曖昧な音声指示の具体化 | 誤作動のリスク最小化 |
- AIエージェントによる音声制御パイプラインの構築
- 音声認識から意図解釈・タスク分解、ツール選択を経てコード生成を行うパイプラインを構築しました。事前に定義した動作シナリオを対象として評価を行い、対象とした各動作について実行を確認しました。一方で、現時点では動作の安定性に課題が残っており、利用環境や条件によっては挙動にばらつきが生じることを確認しています。
- 曖昧な指示を、「聞き返す」ことで具体化
- 現場特有の「パトロールして」といった抽象的な音声指示に対し、AIが不足情報を自動で判別し、ユーザーに確認を求める「聞き返し機能」を実装しました。聞き返しを行わない場合のコード生成成功率と比較して、聞き返しを実施した際のコード生成成功率は大きく改善しました。曖昧な指示ほど聞き返しの効果が大きく、ユーザーの意図をより正確にロボットへ伝えることが可能となります。
- コードを事前に定義することで、動作の安定性を確保
- AIにスクラッチでコードを書かせるのではなく、いくつかの動作(歩く、撮る、掴むなど)をあらかじめToolとして定義し、参照させることで、その中にある手順だけを組み合わせてコード生成が可能になります。この設計により、誤作動のリスクを最小化しました。
多段階の安全設計でロボットの誤動作を防止
本システムでは、AIが音声言語による指示を正確に理解した上で決められた動作の中から適切な動作を選択するシステム設計としました。

これにより、AIが予期しない動作を引き起こすリスクを軽減し、動作の安定性の担保を目指しました。
今後の技術拡張の可能性
本検証を通じて、音声による直感的操作の有効性が確認されました。この成果を起点に、将来的には四足歩行ロボットを単なる命令実行ロボットから、自ら判断し説明もできる「AIエージェント」へと進化させていきたいと考えております。 以下のような機能開発を検討しており、さらなる拡張を目指します。
- 自律性の向上による運用効率化
- 撮影失敗時の自動再撮影やバッテリー残量に応じた自律充電など、ロボット自身が状況を判断して行動を修正することによる、より複雑なタスクへの適用可能性の向上
- 外部環境に合わせて再プランニング
- 四足歩行ロボットが撮影した画像データなどを入力として、AIエージェントが外部環境を認識し、再度プランを立て直す機能の開発
- 参考資料の参照による指示の改善
- 音声指示をロボットへの制御コードへ変換する前に、RAGを活用した知識検索を行うことで、業務に沿った制御指示を行える機能の検証
「命令を実行するロボット」から「考え、判断し、説明し、閉域でも自律運用できるロボット」へ。今回の成果を起点として、今後もフィジカルAIが現場のパートナーとなる未来を目指して参ります。
代表コメント
代表取締役CEO 阿部 武
「現場の安全性と効率性を高めるためには、専門知識の壁を取り払い、誰もが直感的に扱えるインターフェースが必要です。今回のプロジェクトを通じて、AIエージェントが現場作業員の『声』を理解し、事前定義した動作の実行を確認ができました。 かつてはSFの世界の話であった『声でロボットを操る』技術が、すでに実用可能な水準に到達しつつあることを確信しています。今後は、検証で得られた知見を礎に、実験室レベルの検証に留まらない、実際の現場で機能する『フィジカルAI』の実現に向けた検証開発を加速させてまいります。」
会社概要
【株式会社Athena Technologiesについて】
「松尾研発スタートアップ(※1)」として、アカデミアの最先端技術と社会実装力を兼ね備え、セキュアなAI開発・ガバナンス支援を展開しています。
社名:株式会社Athena Technologies
設立:2023年12月
代表取締役:阿部 武
所在地:東京都文京区本郷6丁目25番14号 HONGOEGG(東京オフィス)、京都府京都市左京区田中門前町 百万遍ビル3F(京都オフィス)
(※1)「松尾研発スタートアップ」とは、松尾研出身者が創業または松尾研の支援を受け創業された企業の内、技術・事業力がともに成長可能性が認められ、且つ松尾研の理念に共感し共に後進の育成に取り組む、選抜されたスタートアップ群です。(登録商標第6667237号、第6710069号)
本件に関するお問い合わせ
株式会社Athena Technologies 広報担当