Amazon Bedrock AgentCore Browser がOS レベルのインタラクション機能に対応
Amazon Bedrock AgentCore Browser adds OS-level interaction capabilities
概要
Amazon Bedrock AgentCore Browser がOS レベルのインタラクション機能をサポートし、Chrome DevTools Protocol(CDP)の機能を超えたブラウザワークフローの自動化が可能になりました。マウス操作、キーボード操作、デスクトップスクリーンショット撮影がOS座標で実行でき、ブラウザビューポートを超えた範囲での制御ができるようになりました。本機能は14のAWSリージョンで利用可能です。
何が変わったか
- ・マウス操作(クリック、移動、ドラッグ、スクロール)がOS レベルの座標で実行可能に
- ・キーボード操作(入力、キープレス、Ctrl+A、Ctrl+P などのショートカット)が実装可能に
- ・ブラウザビューポート外を含むデスクトップ全体のスクリーンショット撮影が可能に
- ・システムダイアログ、ネイティブアラート、印刷ダイアログなどの処理に対応
影響
既存ユーザーは追加の設定なしに全14リージョンでこの機能をデフォルトで利用でき、既存のワークフローに影響はありません。
対象ユーザー
AI エージェント開発者、テスト自動化エンジニア、LLM 駆動のウェブインタラクションツールを構築する組織
まとめ
Bedrock AgentCore Browser がOS レベルのインタラクション機能に対応し、CDP のみでは対応できないシステムダイアログやネイティブ要素の自動化が全14リージョンで利用可能になった。
原文タイトル
Amazon Bedrock AgentCore Browser adds OS-level interaction capabilities
AWS公式アナウンスを読む →