コンテンツにスキップ
use-cases / watch-your-agent-think-from-the-coffee-shop / hero
PIPE · トレース · ライブ

カフェからエージェントの思考を眺める

エージェントは自宅のコンテナで動作。あなたは街の反対側にいる。エージェントループが各ステップを Hoody Pipe にパイプ; スマートフォンのタブから同じパスを curl。トレースが文字単位で届く — SSH なし、ダッシュボードなし、アップロードなし。

Pipe API を読む
use-cases / watch-your-agent-think-from-the-coffee-shop / mechanism

各ステップをパイプアウト、curl でパイプイン

エージェントのループはすでに構造化されたイベント — think、tool_use、result — を発行している。それらを PUT でパスにパイプ。スマートフォンから、同じパスを GET。パイプはバイトを保存しない; 読み手にそのまま流す。

agent.loop · 自宅コンテナ
PUT/api/v1/pipe/trace
# inside the agent loop$ echo "$step" | curl -T - \ https://agent-pipe.…hoody.com/api/v1/pipe/trace[INFO] Streaming to 1 receiver(s)...バッファなし · エージェント自身でバックプレッシャー
termux · カフェのテーブル
GET/api/v1/pipe/trace
# read from the same path$ curl -N \ https://agent-pipe.…hoody.com/api/v1/pipe/trace[think] check schema first…スマートフォンタブ起動中 · トレースは届くと印刷される

2 つの HTTP コネクション、1 つのパス。パイプは送信側が到着するまで受信側のコネクションを保持する — エージェントが起動する前にスマートフォンを開いておくこともできるし、実行中に参加することもできる。Hoody Pipe はその間のワイヤーであり、決してデータベースではない。

use-cases / watch-your-agent-think-from-the-coffee-shop / anatomy

読めるトレースの解剖

エージェントは 4 種類の行を発行する。それぞれがダッシュボードでは得られないことを伝える: 何が起こったかだけでなく、起こったときにエージェントが何を考えていたか。

01 · 青

[think] — 推論ステップ

モデルの計画を、自分の言葉で。なぜこのツールを選んだのか、何を期待しているのか、どこで分岐する可能性があるか。これらを読むことは、エージェントの心をリアルタイムで読むこと。

[think] user wants invoice CSV…
02 · ニュートラル

[tool_use] — 呼び出し

エージェントが呼び出すと決めた正確な関数と引数。1 つの呼び出しにつき 1 行、ループが発火した順序で。SDK の抽象化なし; ワイヤーレベルのリクエストそのもの。

[tool_use] sql.describe("invoices")
03 · 緑

[result] — 返ってきたもの

ツールのレスポンスを、行に要約。行数、ファイルサイズ、ステータスコード、エラーメッセージ。次の [think] 行が推論する対象。

[result] 12 rows · 41 ms
04 · ライブ

ポーリングではなくストリーミング

エージェントが発行するごとに各行が届く。5 秒ごとの更新なし、「2 分前に更新」なし。カーソルが点滅しているとき、エージェントは思考の合間にいる。リフレッシュではなく tail している。

[tool_use] files.write("invoices.csv")
use-cases / watch-your-agent-think-from-the-coffee-shop / punchline

エージェントは 40 分間動いた。あなたは本のように読んだ。

40 分の推論、ツール呼び出し、結果 — 1 つの連続した、色分けされたテキストストリームとしてレンダリング。エンドポイントをポーリングしているのではない。ダッシュボードをリロードしているのではない。カフェからエージェントの心を tail している。

トレース · ライブ TAIL00:00 → 40:12
  1. 00:00[think]
  2. 00:14[tool_use]
  3. 00:31[result]
  4. 06:02[think]
  5. 12:48[tool_use]
  6. 23:11[result]
  7. 31:55[think]
  8. 40:12[result]
  • ダッシュボードなし
  • ポーリングなし
  • アップロードなし
  • ただの curl
Pipe API を読む
use-cases / watch-your-agent-think-from-the-coffee-shop / replaces

これが置き換えるもの

エージェントを観察することは、これまで SaaS、ダッシュボード、または独自の WebSocket アプリを意味してきた。「ただ curl したらどうなる?」という質問の前にはどれも生き残れない。

  • AgentOps / LangSmith ダッシュボード自分のログを読むための SaaS レイヤー
  • エージェントトレース用の Datadog APMサービス向けに作られ、ループには不器用
  • エージェントロギング SaaSあなたの推論ステップが他人のデータベースの中
  • 自分自身との画面共有カフェから自宅へ VNC · バッテリー殺し
  • 5 秒ごとに /status をポーリングあなたが発明したレイテンシ · あなたが支払うコスト
  • カスタム WebSocket ダッシュボード永遠にメンテする週末プロジェクト
use-cases / watch-your-agent-think-from-the-coffee-shop / cta

ループをパイプ、パスを curl。エージェントの思考は、読める tail になる。

Pipe API を読む
use-cases / watch-your-agent-think-from-the-coffee-shop / related

他のユースケースを読む