Adept(米国・PC操作自動化エージェントAI)

Adept(米国・PC操作自動化エージェントAI)

2022年に設立されたAdeptは、自然言語の指示をPC操作に変換し、複数アプリケーション間の業務フローを自動化するエージェント型AIを開発している。2024年6月にAmazonがAdeptの共同創業者らを採用し、同時にAdeptの技術をライセンス契約によりAGI開発に利用することを発表した。創業者や一部チームはAmazonに移籍しつつも、Adeptの技術開発は継続されており、エージェントAI分野におけるリーダー的地位を固めつつある。

 

1. Adept AIの技術概要と特徴

Adeptの中核技術は、自然言語の指示をPC操作に変換して実行するACTモデル、及びその推論基盤となるマルチモーダル大規模言語モデルFuyuである。

 

ACT(Action Transformer)

  • ACT-1:ACTシリーズの初代モデルであり、自然言語指示を受けて、ブラウザを含むPC上でのクリックや入力、スクロールなどの操作を自動化する能力を備えている。
  • ACT-2:大規模言語モデルFuyuを活用し、複数アプリ間の連携、推論精度の向上、非定型業務対応の柔軟性強化を実現した後継モデルである。

 

Fuyu(およびFuyu-Heavy)

  • Fuyu-8B:Adeptがオープンソース公開したマルチモーダルモデルであり、あらゆる画像解像度の理解やUI認識、チャートや図表への対応が可能な、デジタルエージェント向け設計のトランスフォーマーである。
  • Fuyu-Heavy:Fuyuアーキテクチャをスケールアップしたモデルであり、UI理解やマルチモーダル推論に秀でている。

 

技術的特徴

  • マルチモーダル対応:テキスト、画面(GUI)、構造化データなどを統合して処理し、複雑な業務シナリオにも対応する (Fuyu/Fuyu-Heavyによる対応)。
  • マルチモデル構成:OpenAIやAnthropicのLLMとFuyuなどの自社モデルを組み合わせ、タスクに応じた最適なモデルを動的に選択することが可能である。
  • RPA統合:従来のルールベースRPA(Robotic Process Automation)では非定型業務やUI依存タスクを対象とするのが難しかった。Adeptは自然言語理解を組み合わせることで、API非公開のアプリケーションでもGUI操作を通じた自動化が可能であり、業務フローの変更や例外処理にも対応できる。

 

Adeptはこれらの技術により、業務シナリオ全体を自律的に実行できる業務実行型エージェントとしての性格を強化している。

 

2. 業務プロセスへの構造的影響

AdeptのエージェントAIは、企業の業務プロセスに次のような変革をもたらす可能性がある。

 

  • 業務フローの分断解消:テキスト、画面情報、構造化データを統合的に処理することで、従来はシステム間連携が困難だった業務フローを一元的に自動化し、アプリケーションをまたぐエンドツーエンドの処理を実現する。これにより、CRM、ERP、会計システムなど異なるシステムを横断する業務フローが統合され、エンドツーエンドでの自動処理が可能になる。
  • 非定型業務の自動化:タスクの種類や複雑さに応じて最適なモデルを選択し、自然言語理解と推論を組み合わせることで、例外処理や変動要素を含む業務でも柔軟な対応が可能となる。定型処理に限定されてきた従来RPAの制約を超え、非定型業務を自律的に完結させる基盤を形成する。
  • セルフサービス化と業務自律化:定型業務はAIエージェントに任せる仕組みが定着し、業務プロセスは自律化に向かう。既存のRPAが担ってきた定型業務自動化の範囲を拡張し、エンドユーザが自然言語で直接業務依頼を行える環境を整備する。これにより、IT部門を介さずに業務が即時完結し、定型業務はAIが自律的に処理する体制が可能になる。

 

これらの変化は、部門ごとにサイロ化されていた業務を横断的に統合し、企業全体の業務設計を再構築する構造的インパクトを持つ。Adeptの技術は単なる自動化ツールではなく、業務プロセス変革の担い手として位置づけることができる。

 

※以下の節と情報源は、PDF版全文をご参照ください

  • 3. 導入・活用事例
  • 4. まとめと展望
  • 情報源一覧(出典リンク含む)

 

分析記事全文はこちらからダウンロードできます ↓生成AI特集「海外企業の事例分析」Adept