Open Claw とは?
最近話題のオープンソースAIアシスタント「Open Claw」を触ってみました。
Open Claw の概要についてはこちらの記事が参考になります。
Open Claw を自分のローカルPC上で動かすと、重要なデータを勝手に削除されたり、PCの設定を意図せず変更されるリスクがあります。
そこで今回は、クラウドサーバ上(EC2内)に隔離環境を構築し、Open Claw が大暴れしても問題ない環境を構築してから実験を行いました。
環境構築
環境構築で参考にしたのはこちらの記事です。

CloudFormation で面倒な環境構築をサクッと終わらせられます。
Open Claw を触った後も、CloudFormation スタックを削除すれば構築したインフラ環境をきれいさっぱりなくせるので、検証用途にはぴったりです。
ちなみに、環境構築後の UI はこんな感じでした。

Open Clowを使ってみた感想
最初にお互いの呼び名を決めるやり取りがあり、親密さが高まっていい感じでした。
話し方も適度にフランクで、気軽にコミュニケーションが取れます。
Open Clawとのやり取り抜粋↓


※ 以降、記事内では Open Claw のことを「クロウ」と呼びます。
クロウ自身に何ができるか聞いたところ、以下の返答が返ってきました。

セキュリティチェックもできるとのことだったので、早速試してみました。

あくまで読み取りしかしないことを事前に強調してくれたのは、好印象です。

セキュリティチェックの結果は、レポート形式でまとめて提示してくれました。
警告の4つ目では、ディレクトリの権限について言及がありました。
実際にサーバ内で .openclaw ディレクトリを確認すると、指摘通り権限が 775 になっていました。

そこで権限の修正を指示したところ、700 に変更してくれました。

こちらで一切コマンドを打たずに作業してくれるのは非常にありがたいです。
一方で、こちらから聞かない限り、裏でどんなコマンドを実行したか教えてくれないのは少し怖いとも感じました。
曖昧な指示をした場合、意図しない範囲まで変更されて、しかもそのことを報告してもらえない可能性があります。
とはいえ、人間が目視で行うと時間がかかったり、漏れが発生しがちなセキュリティチェックを、一瞬で対応してくれるのは非常に優秀です。
今後は各サーバにAIエージェントが常駐し、セキュリティの不備チェック、セキュリティパッチ適用、インシデントの自動検知や通知まで行ってくれるようになるかもしれませんね。
画像生成はできないらしいが、、
画像生成のクオリティも知りたいと思い聞いてみたところ、画像は直接生成できないとのことでした。

そこで、「Gemini などの画像生成AIに指示を出して画像を生成し、ダウンロードして共有してほしい」 と依頼してみました。
クロウが取った行動の流れは以下の通りです:
- EC2サーバ内にブラウザがないため、Chrome のインストールを試みる
- GUIは不要と判断し、軽量な Chromium に切り替えてインストール
- ブラウザ制御がうまく動かず、Gemini API キーを私に発行させて API 経由を試みる
- API キーの無料枠では画像生成が使えず断念
- サーバに既に組み込まれていた Amazon Bedrock Titan Image Generator で画像生成に成功
- 生成した画像を共有
いくつも壁にぶつかりながら、最終的に自力で解決策を見つけてタスクを完遂してくれました。
この辺りの試行錯誤している姿は、人間と変わりませんね(試行錯誤のスピードが段違いですが、、)
共有してくれたのは、サイバーパンクなフクロウの画像です。

クロウに横断的な指示をした感想
APIキーの発行やGoogleアカウントのログインなど、人間の認証が必要な作業はどうしてもユーザー側の対応が必要になります。
マルチタスクエージェントとしては、こうした部分まで自動化したいところですが、AIが暴走した場合のリスク(アカウント乗っ取り、APIの過剰消費など)を考えると、どこまでの作業をAIに委ねるかは今後も議論が続くでしょう。
また、今回の実験で感じたのは、AIエージェントの作業環境には、あらかじめ使用頻度の高いソフトウェアを入れておくべきだということです。
タスクのたびに各種ソフトをインストールしていては効率が悪く、トークン消費量も無駄に増えてしまいます。
人間が作業環境を整えるのと同じように、AIエージェントにも適切なツールを事前に用意しておく工夫が必要だと思いました。
AIエージェントの進化は、AGIへの大きな一歩だと感じます。
