Skip to main content

API.md

# CMDC Gateway API 参考

> 所有端点的完整请求/响应规范。Base URL 示例: `http://localhost:4000`

---

## 目录

- [认证](#认证)
- [通用错误格式](#通用错误格式)
- [健康检查](#健康检查)
- [Agent Card / A2A](#agent-card--a2a)
- [Session 管理](#session-管理)
  - [创建 Session](#创建-session)
  - [查询 Session](#查询-session)
  - [删除 Session](#删除-session)
- [Prompt API](#prompt-api)
- [事件流](#事件流)
  - [SSE 事件流](#sse-事件流)
  - [Group SSE 事件流](#group-sse-事件流)
  - [SSE 事件类型详解](#sse-事件类型详解)
  - [WebSocket 双向通信](#websocket-双向通信)
- [Workflow / AgentOps Replay](#workflow--agentops-replay)
- [控制 API](#控制-api)
  - [审批通过](#审批通过)
  - [审批拒绝](#审批拒绝)
  - [回答 Agent 提问](#回答-agent-提问)
  - [切换模型](#切换模型)
  - [运行时工具控制](#运行时工具控制)
  - [批量工具控制](#批量工具控制)
  - [中段注入与中止](#中段注入与中止)
  - [Plugin opts 热更新](#plugin-opts-热更新)
  - [Checkpoint / Resume](#checkpoint--resume)
- [Provider Registry](#provider-registry)
- [统计与历史](#统计与历史)
  - [用量统计](#用量统计)
  - [对话历史](#对话历史)
- [SDK 兼容与迁移说明](#sdk-兼容与迁移说明)
- [Gateway 边界](#gateway-边界)
- [回调工具注册](#回调工具注册)

---

## 认证

所有 `/v1/*` 端点需要 API Key 认证。支持两种方式(二选一):

| 方式 | 请求头 | 示例 |
|------|--------|------|
| X-API-Key 头 | `X-API-Key` | `X-API-Key: sk-abc123` |
| Bearer Token | `Authorization` | `Authorization: Bearer sk-abc123` |

API Key 在服务端配置中绑定 `tenant_id`,用于多租户隔离:

```elixir
config :cmdc_gateway, CMDCGateway.Plugs.Auth,
  api_keys: %{
    "sk-abc123" => "tenant-a",
    "sk-xyz789" => "tenant-b"
  }
```

**认证失败响应:**

```
HTTP/1.1 401 Unauthorized
Content-Type: application/json

{
  "error": "unauthorized",
  "message": "Missing or invalid API key"
}
```

> `/healthz` 端点无需认证。

---

## 通用错误格式

所有错误响应遵循统一 JSON 结构:

```json
{
  "error": "<error_code>",
  "message": "<人类可读描述>"
}
```

| HTTP 状态码 | error 代码 | 触发条件 |
|-------------|-----------|---------|
| 400 | `bad_request` | 缺少必要参数(如 prompt 的 `text`、approve 的 `approvalId`) |
| 401 | `unauthorized` | API Key 无效、缺失、或未配置 |
| 404 | `not_found` | Session ID 不存在 |
| 404 | `session_dead` | Session 存在但 Agent 进程已终止 |
| 422 | `create_failed` | Agent 创建失败(模型不支持、参数非法等) |
| 422 | `registration_failed` | 回调工具注册失败 |
| 429 | `rate_limited` | 超出请求频率限制 |

**429 特殊响应头:**

```
HTTP/1.1 429 Too Many Requests
Retry-After: 15
Content-Type: application/json

{
  "error": "rate_limited",
  "message": "Rate limit exceeded. Retry after 15 seconds.",
  "retryAfter": 15
}
```

**404 路由不匹配:**

```json
{
  "error": "not_found",
  "message": "No route matches GET /v1/unknown"
}
```

---

## 健康检查

检查 Gateway 服务状态,无需认证。

### `GET /healthz`

**请求:**

```
GET /healthz HTTP/1.1
Host: localhost:4000
```

无请求体、无认证。

**响应 200:**

```json
{
  "status": "ok",
  "version": "0.6.0",
  "sessions": {
    "active": 5
  },
  "meter": {
    "tracked_keys": 3
  },
  "timestamp": "2026-04-08T12:00:00.000000Z"
}
```

| 字段 | 类型 | 说明 |
|------|------|------|
| `status` | string | 固定 `"ok"` |
| `version` | string | Gateway 版本号 |
| `sessions.active` | integer | 当前存活的 Session 数量 |
| `meter.tracked_keys` | integer | 有用量记录的 API Key 数量 |
| `timestamp` | string | ISO 8601 UTC 时间戳 |

---

## Agent Card / A2A

Agent Card 用于外部 registry / orchestrator 发现 Gateway 的协议能力。A2A
JSON-RPC 端点复用相同 API Key 认证;`/.well-known/agent.json` 可按部署公开。

### `GET /.well-known/agent.json`

**响应 200:**

```json
{
  "a2aVersion": "1.0",
  "name": "cmdc-gateway",
  "version": "0.6.0",
  "capabilities": {
    "a2a": true,
    "jsonRpc": true,
    "streaming": true,
    "serverSentEvents": true,
    "webSocket": true,
    "webhook": true,
    "taskPolling": true,
    "groupEvents": true,
    "auditProjection": true,
    "sessionReplay": true,
    "workflowReplay": true
  },
  "endpoints": {
    "a2aSend": {"method": "POST", "url": "http://localhost:4000/v1/a2a/tasks/send"},
    "a2aSendSubscribe": {"method": "POST", "url": "http://localhost:4000/v1/a2a/tasks/sendSubscribe"},
    "a2aSendWithWebhook": {"method": "POST", "url": "http://localhost:4000/v1/a2a/tasks/sendWithWebhook"},
    "a2aTaskStatus": {"method": "GET", "url": "http://localhost:4000/v1/a2a/tasks/{taskId}"}
  }
}
```

### `POST /v1/a2a/tasks/send`

同步 JSON-RPC task。Gateway 会创建或复用 task-scoped session,投递单次
prompt,并等待 Agent 完成或超时。

```json
{
  "jsonrpc": "2.0",
  "id": "req-1",
  "method": "tasks/send",
  "params": {
    "id": "task-001",
    "message": {
      "role": "user",
      "parts": [{"type": "text", "text": "总结这个仓库"}]
    },
    "agent_config": {
      "model": "deepseek:deepseek-chat",
      "workingDir": "."
    },
    "timeout_ms": 60000
  }
}
```

### `POST /v1/a2a/tasks/sendSubscribe`

流式 JSON-RPC task。请求体与 `tasks/send` 相同,响应为 SSE,事件 payload
为 A2A `TaskStatusUpdateEvent` / `TaskArtifactUpdateEvent` 形态。

### `POST /v1/a2a/tasks/sendWithWebhook`

异步 webhook task。立即返回 accepted;后续状态通过 `callbackUrl` 接收。

```json
{
  "jsonrpc": "2.0",
  "id": "req-2",
  "method": "tasks/sendWithWebhook",
  "params": {
    "id": "task-002",
    "callbackUrl": "https://client.example.com/cmdc/webhook",
    "webhookSecret": "shared-secret",
    "message": {
      "role": "user",
      "parts": [{"type": "text", "text": "跑一次长任务"}]
    }
  }
}
```

Webhook 会携带 `X-CMDC-Signature: sha256=<hex>`;签名输入为原始 JSON body。
同步派发失败后进入 dead-letter dispatcher,后台按指数退避重试。

### `GET /v1/a2a/tasks/:task_id`

查询 webhook / SSE 客户端漏接时的短期 task 兜底状态。

```json
{
  "taskId": "task-002",
  "status": "completed",
  "lastEvent": "completed",
  "payload": {"event": "task.completed", "taskId": "task-002"},
  "updatedAtMs": 1780267200000,
  "ttlUntilMs": 1780267800000
}
```

该缓存由 `CMDCGateway.TaskStore` 提供,默认短期 ETS 存储,不替代业务持久化。

---

## Session 管理

### 创建 Session

创建一个 CMDC Agent Session,Agent 进程随即启动并进入 `idle` 状态。

### `POST /v1/sessions`

**请求头:**

```
Content-Type: application/json
X-API-Key: sk-abc123
```

**请求体:**

```json
{
  "model": "deepseek:deepseek-chat",
  "sessionId": "my-session-001",
  "systemPrompt": "你是一个专业的编程助手",
  "workingDir": "/home/user/project",
  "tools": ["CMDC.Tool.Shell", "CMDC.Tool.ReadFile", "CMDC.Tool.WriteFile"],
  "plugins": ["CMDC.Plugin.Builtin.ApprovalGuard"],
  "blueprint": "CMDC.Blueprint.Base",
  "groupId": "agentops-run-001",
  "eventBufferSize": 512,
  "maxSteeringQueue": 5,
  "maxTurns": 50,
  "maxTokens": 4096,
  "skillsDirs": ["/home/user/skills"],
  "messages": [
    {"role": "user", "content": "之前我们在审查 billing 模块"},
    {"role": "assistant", "content": "我已经看过入口文件,下一步看测试。"}
  ],
  "providerOpts": {
    "temperature": 0.7,
    "top_p": 0.95
  }
}
```

**请求体字段:**

| 字段 | 类型 | 必填 | 默认值 | 说明 |
|------|------|------|--------|------|
| `model` | string | **是** | — | LLM 模型标识。格式 `provider:model`,如 `"deepseek:deepseek-chat"`、`"anthropic:claude-sonnet-4-20250514"` |
| `sessionId` | string | 否 | 自动生成 16 位 hex | 自定义 Session ID,用于后续所有操作的标识符 |
| `systemPrompt` | string | 否 | Blueprint 默认值 | Agent 系统提示词,决定 Agent 的行为和人格 |
| `workingDir` | string | 否 | `"."` | 工具(Shell、ReadFile 等)的工作根目录 |
| `tools` | string[] | 否 | `[]` | 启用的 CMDC Tool 模块名列表,使用 Elixir 模块全名 |
| `plugins` | string[] | 否 | `[]` | 启用的 CMDC Plugin 模块名列表 |
| `blueprint` | string | 否 | `nil` | Blueprint 模块名,定义 Agent 的完整配置模板 |
| `groupId` / `group_id` | string | 否 | `nil` | core 0.6 group event stream 标识 |
| `hibernateAfterMs` / `hibernate_after_ms` | integer | 否 | core 默认 | idle 后 hibernate 配置 |
| `eventBufferSize` / `event_buffer_size` | integer | 否 | `0` | per-session EventBus ring buffer 大小;开启后可用 SSE `since` replay |
| `maxSteeringQueue` / `max_steering_queue` | integer | 否 | core 默认 | steering queue 上限 |
| `memory` | string[] | 否 | `[]` | AGENTS.md 等服务端工作目录内记忆文件 |
| `subagents` | object[] | 否 | `[]` | 子 Agent 安全 JSON 规格,字段同 core whitelist |
| `interruptImmuneTools` / `interrupt_immune_tools` | string[] | 否 | `[]` | abort/steer 时不杀掉的工具名 |
| `responseFormat` / `response_format` | object | 否 | `nil` | 透传给 core 的响应格式约束 |
| `messages` | object[] | 否 | `[]` | 安全历史导入;仅允许 `user` / `assistant` / `tool_result` |
| `maxTurns` | integer | 否 | `100` | 最大 Agent 轮次数(一次 prompt → response 为一轮) |
| `maxTokens` | integer | 否 | 模型默认 | LLM 单次回复最大输出 token 数 |
| `skillsDirs` | string[] | 否 | `[]` | Skill 文件扫描目录列表 |
| `providerOpts` | object | 否 | `{}` | 透传给 LLM Provider 的额外参数(如 `temperature`、`top_p`) |

`messages` 导入限制:

- 角色只允许 `"user"`、`"assistant"`、`"tool_result"`;`"system"` 会返回 `invalid_messages`。
- 单次最多 100 条,单条文本最多 32KB,总 JSON 内容最多 256KB。
- `assistant.toolCalls[]` 只接受 `callId/call_id`、`name`、`arguments` object。
- Gateway 会重新构造 `%CMDC.Message{}`,忽略外部 `id/parent_id`;任何 `__struct__` / `module` 字段都会被拒绝。
- 任意 `skillSelector` / `skill_selector` 模块注入不通过 public JSON;请在宿主 Elixir app 服务端配置。

**响应 201 Created:**

```json
{
  "sessionId": "my-session-001",
  "status": "created",
  "groupId": "agentops-run-001",
  "importedMessages": 2
}
```

| 字段 | 类型 | 说明 |
|------|------|------|
| `sessionId` | string | Session 标识符(自定义或自动生成) |
| `status` | string | 固定 `"created"` |
| `groupId` | string \| null | 当前 session 的 group id |
| `importedMessages` | integer | 本次安全导入的历史消息数 |

**响应 422 Unprocessable Entity:**

```json
{
  "error": "create_failed",
  "message": ":unknown_provider"
}
```

**cURL 示例:**

```bash
curl -X POST http://localhost:4000/v1/sessions \
  -H "X-API-Key: sk-abc123" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek:deepseek-chat",
    "systemPrompt": "你是助手",
    "tools": ["CMDC.Tool.Shell"],
    "maxTurns": 20
  }'
```

---

### 查询 Session

获取 Session 的当前运行状态。`GET /v1/sessions/:id` 与
`GET /v1/sessions/:id/status` 当前返回相同结构;保留两个路径是为了兼容旧
SDK 和 dashboard。

### `GET /v1/sessions/:id`

### `GET /v1/sessions/:id/status`

**路径参数:**

| 参数 | 类型 | 说明 |
|------|------|------|
| `id` | string | Session ID |

**请求:**

```
GET /v1/sessions/my-session-001 HTTP/1.1
X-API-Key: sk-abc123
```

**响应 200:**

```json
{
  "sessionId": "my-session-001",
  "state": "idle",
  "model": "deepseek:deepseek-chat",
  "groupId": "agentops-run-001",
  "workingDir": "/home/user/project",
  "turns": 3,
  "toolCalls": 5,
  "totalTokens": 12800,
  "costUsd": "0.0123",
  "tokenUsage": {
    "promptTokens": 8200,
    "completionTokens": 4600,
    "totalTokens": 12800,
    "costUsd": "0.0123",
    "cachedTokens": 0
  },
  "uptimeMs": 45200,
  "activeSinceMs": null,
  "timestampMs": 1780267200000,
  "messagesCount": 8,
  "pendingTools": [],
  "pendingApprovals": [],
  "queues": {
    "promptQueue": 0,
    "steeringQueue": 0
  },
  "eventBufferSize": 512,
  "lastEventIndex": 42,
  "eventBufferCount": 42,
  "maxSteeringQueue": 5,
  "hibernateAfterMs": 60000
}
```

| 字段 | 类型 | 说明 |
|------|------|------|
| `sessionId` | string | Session ID |
| `state` | string | Agent 状态机当前状态,如 `"idle"` / `"running"` / `"streaming"` / `"executing_tools"` |
| `model` | string | 当前模型,模型切换为异步控制,最终值以 status 为准 |
| `groupId` | string \| null | 当前 session 所属 group |
| `workingDir` | string | 服务端校验后的工作目录 |
| `turns` | integer | 已完成的对话轮次数 |
| `toolCalls` | integer | 累计工具调用次数 |
| `totalTokens` | integer | 累计消耗 token 数 |
| `costUsd` | number \| string \| null | core 统计的成本估算 |
| `tokenUsage` | object | core `CMDC.TokenUsage` 摘要 |
| `uptimeMs` | integer | Session 存活时间(毫秒) |
| `pendingTools` | array | 等待中的工具调用摘要 |
| `pendingApprovals` | array | 等待人类审批的请求 |
| `queues.promptQueue` | integer | prompt 队列长度 |
| `queues.steeringQueue` | integer | steering 队列长度 |
| `eventBufferSize` | integer | session replay ring buffer 配置大小 |
| `lastEventIndex` | integer | 当前 EventBus 最新事件 index |
| `eventBufferCount` | integer | ring buffer 当前保留事件数 |

**响应 404:**

```json
{
  "error": "not_found",
  "message": "Session my-session-001 not found"
}
```

---

### 删除 Session

停止 Agent 进程,清理 Session 数据和已注册的回调工具。

### `DELETE /v1/sessions/:id`

**路径参数:**

| 参数 | 类型 | 说明 |
|------|------|------|
| `id` | string | Session ID |

**请求:**

```
DELETE /v1/sessions/my-session-001 HTTP/1.1
X-API-Key: sk-abc123
```

**响应 200:**

```json
{
  "sessionId": "my-session-001",
  "status": "deleted"
}
```

| 字段 | 类型 | 说明 |
|------|------|------|
| `sessionId` | string | 被删除的 Session ID |
| `status` | string | 固定 `"deleted"` |

**副作用:**

1. Agent 进程被 `CMDC.stop/1` 终止
2. `SessionStore` 中的条目被删除
3. 该 Session 注册的所有 `CallbackTool` 被清理
4. 活跃的 SSE/WebSocket 连接收到最终事件后断开

---

## Prompt API

向 Agent 发送用户消息(异步)。消息被投递到 Agent 状态机后立即返回 202,后续处理结果通过 SSE 或 WebSocket 推送。

### `POST /v1/sessions/:id/prompt`

**路径参数:**

| 参数 | 类型 | 说明 |
|------|------|------|
| `id` | string | Session ID |

**请求头:**

```
Content-Type: application/json
X-API-Key: sk-abc123
```

**请求体:**

```json
{
  "text": "帮我用 Python 写一个快速排序"
}
```

| 字段 | 类型 | 必填 | 说明 |
|------|------|------|------|
| `text` | string | **是** | 用户消息文本。也接受 `"prompt"` 作为别名字段 |

**响应 202 Accepted:**

```json
{
  "requestId": "a1b2c3d4e5f67890",
  "sessionId": "my-session-001",
  "queued": false
}
```

| 字段 | 类型 | 说明 |
|------|------|------|
| `requestId` | string | 本次请求的唯一 ID(16 位 hex) |
| `sessionId` | string | Session ID |
| `queued` | boolean | 是否排队等待(Agent 正忙时为 `true`) |

**响应 400:**

```json
{
  "error": "bad_request",
  "message": "Missing 'text' field"
}
```

**典型调用流程:**

```
1. POST /v1/sessions/:id/prompt  →  202 (消息已投递)
2. GET  /v1/sessions/:id/events  →  SSE 流接收处理事件
   - event: agent_start
   - event: message_delta (多次,逐 token)
   - event: tool_execution_start (如果 Agent 调用了工具)
   - event: tool_execution_end
   - event: agent_end (本轮完成)
```

**cURL 示例:**

```bash
curl -X POST http://localhost:4000/v1/sessions/my-session-001/prompt \
  -H "X-API-Key: sk-abc123" \
  -H "Content-Type: application/json" \
  -d '{"text": "帮我用 Python 写一个快速排序"}'
```

---

## 事件流

### SSE 事件流

建立 Server-Sent Events 长连接,实时接收 Agent 事件推送。

### `GET /v1/sessions/:id/events`

**路径参数:**

| 参数 | 类型 | 说明 |
|------|------|------|
| `id` | string | Session ID |

**请求:**

```
GET /v1/sessions/my-session-001/events HTTP/1.1
X-API-Key: sk-abc123
Accept: text/event-stream
```

**Query 参数:**

| 参数 | 类型 | 说明 |
|------|------|------|
| `since` | integer | 从指定 EventBus index 之后 replay;也可使用 `Last-Event-ID` 请求头 |
| `types` | string | 逗号分隔的 core event type 白名单,如 `message_delta,agent_end` |
| `mode` | string | 默认轻量事件;`audit` 时投影为 `audit_event` |

`since/types` 只支持 session SSE。group SSE 是 live-only,带 replay 参数会返回
`group_replay_not_supported`。

**响应头:**

```
HTTP/1.1 200 OK
Content-Type: text/event-stream; charset=utf-8
Cache-Control: no-cache
X-Accel-Buffering: no
Transfer-Encoding: chunked
```

**SSE 数据格式:**

每个事件由 `event:` 行(事件类型)和 `data:` 行(JSON 载荷)组成,以双换行分隔:

```
event: agent_start
data: {}

event: message_delta
data: {"delta":"你"}

event: message_delta
data: {"delta":"好"}

event: message_delta
data: {"delta":"!"}

event: agent_end
data: {"messageCount":2,"lastMessage":{"content":"你好!","role":"assistant"},"tokenUsage":{"promptTokens":50,"completionTokens":5,"totalTokens":55}}

```

**心跳:**

每 30 秒发送一次 SSE 注释行,保持连接:

```
: heartbeat

```

**连接终止条件:**

- 客户端主动断开
- 收到 `agent_end` 或 `agent_abort` 事件后 SSE 流自动关闭
- 60 秒无事件超时自动断开

**cURL 示例:**

```bash
curl -N http://localhost:4000/v1/sessions/my-session-001/events \
  -H "X-API-Key: sk-abc123"
```

---

### Group SSE 事件流

订阅同一 `groupId` 下多个 session 的实时事件,适合 AgentOps run console
按 group 聚合展示。

### `GET /v1/groups/:group_id/events`

**Query 参数:**

| 参数 | 类型 | 说明 |
|------|------|------|
| `mode` | string | 默认轻量事件;`audit` 时投影为 `audit_event` |

group SSE 是 live-only:`since`、`types` 和 `Last-Event-ID` 都会返回
`group_replay_not_supported`。断线补帧请使用每个 session 的
`/v1/sessions/:id/events?since=...&types=...`。

**事件示例:**

```text
event: message_delta
data: {"sessionId":"my-session-001","groupId":"agentops-run-001","delta":"hello"}
```

---

### SSE 事件类型详解

基础事件按 Agent 生命周期阶段分组;启用 `cmdc_rag_arcana` 时还会输出
RAG / GraphRAG / Eval 专用 trace 事件。

#### 1. 会话生命周期

**`agent_start`** — Agent 开始处理当前 prompt

```
event: agent_start
data: {}
```

| data 字段 | 类型 | 说明 |
|-----------|------|------|
| (空对象) | — | 无额外数据 |

---

**`agent_end`** — Agent 完成当前 prompt 处理

```
event: agent_end
data: {"messageCount":4,"lastMessage":{"content":"代码已完成","role":"assistant"},"tokenUsage":{"promptTokens":500,"completionTokens":200,"totalTokens":700}}
```

| data 字段 | 类型 | 说明 |
|-----------|------|------|
| `messageCount` | integer | 当前对话总消息数 |
| `lastMessage` | object \| null | 最后一条 assistant 消息,含 `content`(string) 和 `role`(string) |
| `tokenUsage` | object | Token 用量统计 |
| `tokenUsage.promptTokens` | integer | 输入 token 数 |
| `tokenUsage.completionTokens` | integer | 输出 token 数 |
| `tokenUsage.totalTokens` | integer | 总 token 数 |

---

**`agent_abort`** — Agent 被中止

```
event: agent_abort
data: {"reason":"max_turns_exceeded"}
```

| data 字段 | 类型 | 说明 |
|-----------|------|------|
| `reason` | string | 中止原因,如 `"max_turns_exceeded"`、`"user_cancelled"`、`"aborted"` |

---

**`prompt_received`** — Agent 确认收到用户 prompt

```
event: prompt_received
data: {"text":"帮我写个排序算法"}
```

| data 字段 | 类型 | 说明 |
|-----------|------|------|
| `text` | string | 用户发送的 prompt 文本 |

---

#### 2. 流式响应

**`message_start`** — LLM 开始生成回复

```
event: message_start
data: {}
```

| data 字段 | 类型 | 说明 |
|-----------|------|------|
| (空对象) | — | 无额外数据 |

---

**`message_delta`** — 流式文本片段(逐 token)

```
event: message_delta
data: {"delta":"def quick_sort"}
```

| data 字段 | 类型 | 说明 |
|-----------|------|------|
| `delta` | string | 文本增量片段,客户端应追加到当前消息 |

> 一次 LLM 回复会产生大量 `message_delta` 事件,客户端应逐个追加拼接完整回复。

---

**`thinking_start`** — Agent 思考链(Chain-of-Thought)开始

```
event: thinking_start
data: {}
```

| data 字段 | 类型 | 说明 |
|-----------|------|------|
| (空对象) | — | 仅在模型支持 thinking 功能时触发 |

---

**`thinking_delta`** — 思考链文本片段

```
event: thinking_delta
data: {"delta":"让我分析一下这个问题..."}
```

| data 字段 | 类型 | 说明 |
|-----------|------|------|
| `delta` | string | 思考过程的文本增量 |

---

#### 3. 工具执行

**`tool_calls`** — Agent 本轮决定调用的工具数量

```
event: tool_calls
data: {"count":2}
```

| data 字段 | 类型 | 说明 |
|-----------|------|------|
| `count` | integer | 本轮工具调用总数 |

---

**`tool_execution_start`** — 工具开始执行

```
event: tool_execution_start
data: {"toolName":"Shell","callId":"tc_a1b2c3","args":{"command":"python3 sort.py","working_dir":"."}}
```

| data 字段 | 类型 | 说明 |
|-----------|------|------|
| `toolName` | string | 工具名称 |
| `callId` | string | 本次调用的唯一 ID |
| `args` | object | 工具调用参数(key-value 均为 string,超过 1024 字节的值会被截断并追加 `...[truncated]`) |

---

**`tool_execution_end`** — 工具执行完成

```
event: tool_execution_end
data: {"toolName":"Shell","callId":"tc_a1b2c3","status":"ok","result":"[1, 2, 3, 4, 5]"}
```

| data 字段 | 类型 | 说明 |
|-----------|------|------|
| `toolName` | string | 工具名称 |
| `callId` | string | 调用 ID(与 `tool_execution_start` 的 `callId` 对应) |
| `status` | string | 执行状态:`"ok"` 成功 / `"error"` 失败 |
| `result` | string | 执行结果文本(超过 4096 字节会被截断并追加 `...[truncated]`) |
| `rag` | object \| null | 仅 RAG 工具成功时出现,含 `query`、`answer`、`citations`、`grounding`、`pipelineRunSummary`、`graphEvidence`、`graphStatus` 或 `ingestStatus` 摘要;默认不包含 chunk 原文 |

RAG 工具包括 `rag_search`、`rag_answer`、`rag_pipeline_answer`、
`rag_graph_search`、`rag_graph_status`、`rag_ingest_status`。Gateway 会保留
原始 `result` 字段以兼容旧客户端,同时补充 `rag` 结构化摘要供 AgentOps
Trace Viewer / Run Console 使用。

---

#### 3.1 RAG / GraphRAG Trace

以下事件来自 `cmdc_rag_arcana` Phase 18 插件、pipeline、maintenance、GraphRAG
和 Eval telemetry bridge。事件 payload 统一 camelCase,并默认移除
`text` / `chunkText` / `content` / `prompt` / `chunks` / `results` 等正文或
chunk 字段。

| 事件 | 说明 |
|------|------|
| `rag_acl_blocked` | collection ACL 阻断 |
| `rag_retrieved` | `rag_search` / `rag_graph_search` 检索摘要 |
| `rag_answered` | `rag_answer` / `rag_pipeline_answer` 回答摘要 |
| `rag_citation_used` | citation provenance |
| `rag_pipeline_step` | Pipeline step timeline |
| `rag_ingestion_progress` | ingestion job 进度 |
| `rag_reembed_progress` | reembed job 进度 |
| `rag_graph_progress` | GraphRAG rebuild/embed/community 进度 |
| `rag_graph_audit` | GraphRAG 只读查询审计 |
| `rag_eval_progress` | RAG Eval / 发布门禁进度 |

示例:

```text
event: rag_citation_used
data: {"toolName":"rag_answer","callId":"tc_1","collections":["policies"],"citationCount":1,"citation":{"documentId":"doc-1","sourceUri":"kb://policies/approval"}}
```

---

#### 4. 人机交互(HITL)

**`approval_required`** — Agent 需要人类审批才能继续

```
event: approval_required
data: {"approvalId":"apr_x7y8z9","toolName":"Shell","args":{"command":"rm -rf /tmp/old"},"hint":"危险操作:删除文件","requestedAt":"2026-04-08T12:00:00Z"}
```

| data 字段 | 类型 | 说明 |
|-----------|------|------|
| `approvalId` | string | 审批请求 ID,用于后续 `approve` / `reject` 操作 |
| `toolName` | string | 待审批的工具名称 |
| `args` | object | 工具调用参数 |
| `hint` | string | 审批提示信息(可能为空字符串) |
| `requestedAt` | string \| null | 审批请求时间(ISO 8601) |

> 收到此事件后,Agent 会暂停等待,直到客户端发送 `approve` 或 `reject`。

---

**`approval_resolved`** — 审批已决定

```
event: approval_resolved
data: {"approvalId":"apr_x7y8z9","status":"approved"}
```

| data 字段 | 类型 | 说明 |
|-----------|------|------|
| `approvalId` | string | 审批请求 ID |
| `status` | string | 审批结果:`"approved"` / `"rejected"` |

---

**`ask_user`** — Agent 向用户提问,等待回答

```
event: ask_user
data: {"ref":"ask_001","question":"你希望使用哪种排序算法?","options":["快速排序","归并排序","堆排序"]}
```

| data 字段 | 类型 | 说明 |
|-----------|------|------|
| `ref` | string | 提问引用 ID,用于后续 `respond` 操作 |
| `question` | string | Agent 的问题文本 |
| `options` | array \| null | 可选的预设选项列表,`null` 表示自由文本回答 |

> 收到此事件后,Agent 会暂停等待,直到客户端发送 `respond`。

---

#### 5. 错误

**`error`** — 运行时错误

```
event: error
data: {"reason":"Provider stream failed: connection timeout"}
```

| data 字段 | 类型 | 说明 |
|-----------|------|------|
| `reason` | string | 错误原因描述 |

---

### WebSocket 双向通信

全双工连接,出站推送事件 + 入站接收控制消息。适合需要实时双向交互的场景(如审批、对话式 Agent)。

### `WS /v1/sessions/:id/ws`

**连接参数:**

| 参数 | 位置 | 类型 | 必填 | 说明 |
|------|------|------|------|------|
| `id` | 路径 | string | 是 | Session ID |
| `api_key` | Query String | string | 是 | API Key(WebSocket 不支持自定义请求头,故用 query 传递) |

**连接 URL 示例:**

```
ws://localhost:4000/v1/sessions/my-session-001/ws?api_key=sk-abc123
```

**连接失败响应:**

| 场景 | HTTP 状态码 | 响应体 |
|------|-----------|--------|
| 未提供 API Key | 401 | `{"error":"unauthorized"}` |
| Session 不存在 | 404 | `{"error":"session_not_found"}` |

**连接配置:**

| 参数 | 值 | 说明 |
|------|---|------|
| idle_timeout | 300,000 ms (5 分钟) | 无消息超时断开 |
| heartbeat | 30 秒 | WebSocket ping 帧保活 |

---

#### 入站消息(客户端 → Gateway)

所有入站消息为 JSON 格式,必须包含 `action` 字段。

**1. 发送 Prompt**

```json
{
  "action": "prompt",
  "text": "帮我写一个 Hello World"
}
```

| 字段 | 类型 | 必填 | 说明 |
|------|------|------|------|
| `action` | string | 是 | 固定 `"prompt"` |
| `text` | string | 是 | 用户消息文本 |

成功响应:

```json
{"ok": true, "action": "prompt"}
```

---

**2. 审批通过**

```json
{
  "action": "approve",
  "approvalId": "apr_x7y8z9"
}
```

| 字段 | 类型 | 必填 | 说明 |
|------|------|------|------|
| `action` | string | 是 | 固定 `"approve"` |
| `approvalId` | string | 是 | 来自 `approval_required` 事件的审批 ID |

成功响应:

```json
{"ok": true, "action": "approve"}
```

---

**3. 审批拒绝**

```json
{
  "action": "reject",
  "approvalId": "apr_x7y8z9"
}
```

| 字段 | 类型 | 必填 | 说明 |
|------|------|------|------|
| `action` | string | 是 | 固定 `"reject"` |
| `approvalId` | string | 是 | 来自 `approval_required` 事件的审批 ID |

成功响应:

```json
{"ok": true, "action": "reject"}
```

---

**4. 回答 Agent 提问**

```json
{
  "action": "respond",
  "ref": "ask_001",
  "response": "快速排序"
}
```

| 字段 | 类型 | 必填 | 说明 |
|------|------|------|------|
| `action` | string | 是 | 固定 `"respond"` |
| `ref` | string | 是 | 来自 `ask_user` 事件的引用 ID |
| `response` | string | 是 | 用户的回答文本 |

成功响应:

```json
{"ok": true, "action": "respond"}
```

---

**入站错误响应:**

| 场景 | 响应 |
|------|------|
| JSON 解析失败 | `{"error": "invalid_json", "message": "Failed to parse JSON"}` |
| 缺少 `action` 字段 | `{"error": "missing_action", "message": "Message must contain 'action' field"}` |
| 未知 action | `{"error": "unknown_action", "action": "xxx"}` |
| Session 进程已终止 | `{"error": "session_not_found"}` |

---

#### 出站消息(Gateway → 客户端)

与 SSE 事件内容一致,但封装为 JSON 对象:

```json
{
  "event": "<event_type>",
  "data": { ... }
}
```

**示例:**

```json
{"event": "agent_start", "data": {}}
{"event": "message_delta", "data": {"delta": "Hello"}}
{"event": "message_delta", "data": {"delta": " World"}}
{"event": "tool_execution_start", "data": {"toolName": "Shell", "callId": "tc_001", "args": {"command": "echo hi"}}}
{"event": "tool_execution_end", "data": {"toolName": "Shell", "callId": "tc_001", "status": "ok", "result": "hi\n"}}
{"event": "approval_required", "data": {"approvalId": "apr_001", "toolName": "Shell", "args": {"command": "rm -rf /tmp"}, "hint": "危险操作", "requestedAt": null}}
{"event": "agent_end", "data": {"messageCount": 3, "lastMessage": {"content": "完成", "role": "assistant"}, "tokenUsage": {"promptTokens": 100, "completionTokens": 50, "totalTokens": 150}}}
```

**JavaScript 客户端示例:**

```javascript
const ws = new WebSocket('ws://localhost:4000/v1/sessions/my-session-001/ws?api_key=sk-abc123');

ws.onopen = () => {
  ws.send(JSON.stringify({ action: 'prompt', text: '你好' }));
};

ws.onmessage = (event) => {
  const msg = JSON.parse(event.data);
  switch (msg.event) {
    case 'message_delta':
      process.stdout.write(msg.data.delta);
      break;
    case 'approval_required':
      // 自动审批示例
      ws.send(JSON.stringify({ action: 'approve', approvalId: msg.data.approvalId }));
      break;
    case 'ask_user':
      ws.send(JSON.stringify({ action: 'respond', ref: msg.data.ref, response: '是的' }));
      break;
    case 'agent_end':
      console.log('\nAgent 完成');
      ws.close();
      break;
  }
};
```

---

## Workflow / AgentOps Replay

Gateway 只读取并翻译 workflow event ledger,不启动 workflow executor,不持有
RunStore,也不处理审批人解析、RBAC 或业务审计。

宿主应用需要在服务端配置事件来源:

```elixir
config :cmdc_gateway,
  workflow_event_source: MyApp.WorkflowRunStore
```

事件来源模块必须实现 `list_events/2` 或 `events/2`,签名为
`(run_id, opts) -> {:ok, events} | {:error, reason}`。`opts` 支持
`limit`、`after_id`、`after_seq`、`type`、`node_id`。

### `GET /v1/workflows/runs/:run_id/events`

**Query 参数:**

| 参数 | 类型 | 说明 |
|------|------|------|
| `limit` | integer | 单页数量,默认 50,最大 500 |
| `afterId` | string | 上一页最后一个 event id |
| `afterSeq` | integer | 上一页最后一个 seq |
| `type` | string | 原始 RunEvent.type 过滤,如 `human_task.created` |
| `nodeId` | string | 节点 ID 过滤 |

**响应 200:**

```json
{
  "runId": "run_123",
  "events": [
    {
      "event": "workflow.human_task.created",
      "run_id": "run_123",
      "node_id": "legal_review",
      "trace_id": "trace_123",
      "span_id": "run_123:legal_review:human_task.created",
      "timestamp": "2026-06-01T00:00:00.000Z",
      "payload": {
        "task_id": "task_legal",
        "approval_mode": "any_of",
        "correlation_id": "corr_legal"
      }
    }
  ],
  "page": {
    "limit": 50,
    "count": 1,
    "nextCursor": "run_123:evt:3",
    "nextSeq": 3
  }
}
```

**标准事件名:**

| RunEvent.type | Gateway event |
|---|---|
| `run.started/resumed/paused/waiting/completed/failed/cancelled/retry` | `workflow.run.*` |
| `orchestrator.node.started/completed/failed/skipped/retry` | `workflow.node.*` |
| `orchestrator.node.*` 且 `node_type=fork` | `workflow.fork.*` |
| `orchestrator.node.*` 且 `node_type=join` | `workflow.join.*` |
| `orchestrator.edge.signaled` / `edge.signaled` / `signal.edge` | `workflow.signal.edge` |
| `human_task.created/progress/completed/timeout/failed` | `workflow.human_task.*` |
| `human_task.decision_recorded` | `workflow.human_task.decision` |

**未配置事件来源:**

```json
{
  "error": "workflow_event_source_not_configured",
  "message": "Configure :cmdc_gateway, :workflow_event_source with a module exposing list_events/2 or events/2"
}
```

企业平台必须自行实现:

- `ApprovalService`:审批人解析、通知、幂等提交和 `CMDCOrchestrator.submit_human_task_decision/4` 调用。
- `RunStore`:生产级 event ledger、分页索引、并发锁和恢复游标。
- `audit hooks`:RBAC/ABAC、审批业务审计、租户隔离和合规留痕。

---

## 控制 API

REST 版本的控制接口,适合不使用 WebSocket 的场景(如服务端集成、CLI 工具)。功能与 WebSocket 入站消息等价。

### 审批通过

### `POST /v1/sessions/:id/approve`

**路径参数:**

| 参数 | 类型 | 说明 |
|------|------|------|
| `id` | string | Session ID |

**请求头:**

```
Content-Type: application/json
X-API-Key: sk-abc123
```

**请求体:**

```json
{
  "approvalId": "apr_x7y8z9"
}
```

| 字段 | 类型 | 必填 | 说明 |
|------|------|------|------|
| `approvalId` | string | **是** | 来自 `approval_required` 事件的审批 ID |

**响应 200:**

```json
{
  "ok": true,
  "action": "approve",
  "approvalId": "apr_x7y8z9"
}
```

**响应 400:**

```json
{
  "error": "bad_request",
  "message": "Missing 'approvalId'"
}
```

---

### 审批拒绝

### `POST /v1/sessions/:id/reject`

**路径参数:**

| 参数 | 类型 | 说明 |
|------|------|------|
| `id` | string | Session ID |

**请求头:**

```
Content-Type: application/json
X-API-Key: sk-abc123
```

**请求体:**

```json
{
  "approvalId": "apr_x7y8z9"
}
```

| 字段 | 类型 | 必填 | 说明 |
|------|------|------|------|
| `approvalId` | string | **是** | 来自 `approval_required` 事件的审批 ID |

**响应 200:**

```json
{
  "ok": true,
  "action": "reject",
  "approvalId": "apr_x7y8z9"
}
```

**响应 400:**

```json
{
  "error": "bad_request",
  "message": "Missing 'approvalId'"
}
```

---

### 回答 Agent 提问

### `POST /v1/sessions/:id/respond`

**路径参数:**

| 参数 | 类型 | 说明 |
|------|------|------|
| `id` | string | Session ID |

**请求头:**

```
Content-Type: application/json
X-API-Key: sk-abc123
```

**请求体:**

```json
{
  "ref": "ask_001",
  "response": "快速排序"
}
```

| 字段 | 类型 | 必填 | 说明 |
|------|------|------|------|
| `ref` | string | **是** | 来自 `ask_user` 事件的引用 ID |
| `response` | string | **是** | 用户的回答文本 |

**响应 200:**

```json
{
  "ok": true,
  "action": "respond",
  "ref": "ask_001"
}
```

**响应 400:**

```json
{
  "error": "bad_request",
  "message": "Missing 'ref' or 'response'"
}
```

---

### 切换模型

### `POST /v1/sessions/:id/switch_model`

异步调用 `CMDC.switch_model/2` 或 `CMDC.switch_model/3`。返回 202 只表示
控制请求已进入 Agent;最终结果请监听 `model_switched` /
`model_switch_failed` 事件或查询 status。

**请求体:**

```json
{
  "model": "openai:gpt-4o",
  "providerOpts": {
    "baseUrl": "https://llm.example.com",
    "timeout": 30000
  }
}
```

`providerOpts` 只接受已存在 atom key,未知 key 返回
`invalid_provider_opts`,避免外部 JSON 动态创建 atom。

**响应 202:**

```json
{
  "ok": true,
  "action": "switch_model",
  "model": "openai:gpt-4o",
  "async": true,
  "providerOptsKeys": ["base_url", "timeout"]
}
```

---

### 运行时工具控制

### `POST /v1/sessions/:id/attach_tool`

单个 Tool attach,`tool` 必须是已加载的 Elixir Tool 模块名。

```json
{
  "tool": "CMDC.Tool.ReadFile"
}
```

### `DELETE /v1/sessions/:id/tools/:tool_name`

按 Tool name 卸载单个工具。需要批量或原子替换时使用
`/v1/sessions/:id/tools/batch`。

---

### 批量工具控制

### `POST /v1/sessions/:id/tools/batch`

批量暴露 core 0.6 的 `CMDC.attach_tools/2`、`detach_tools/2`、`replace_tools/2`。
这是原子控制面:请求进入 core 前会先完成 Gateway 侧 JSON 校验;core validation 失败时工具表不变。

> 注意:该端点与 `POST /v1/sessions/:id/tools` 回调工具注册不同。`/tools/batch`
> 只操作已加载且服务端 allowlist 允许的 Elixir Tool 模块。

**请求体:**

```json
{
  "action": "replace",
  "tools": ["CMDC.Tool.ReadFile", "CMDC.Tool.Grep"]
}
```

| 字段 | 类型 | 必填 | 说明 |
|------|------|------|------|
| `action` | string | **是** | `"attach"` / `"detach"` / `"replace"` |
| `tools` | string[] | **是** | attach/replace 为 Tool 模块名;detach 为 tool name 字符串 |

服务端 allowlist:

```elixir
config :cmdc_gateway, :tool_module_allowlist,
  [CMDC.Tool.ReadFile, CMDC.Tool.Grep, "CMDC.Tool.ListDir"]
```

未配置时默认允许 CMDC 内置 Tool。生产环境可以收窄该列表;`CMDC.Tool.Shell`
这类高权限工具尤其建议按租户部署策略显式配置。

**响应 200:**

```json
{
  "ok": true,
  "action": "replace_tools",
  "attached": ["grep"],
  "detached": ["shell"]
}
```

`attach` 成功时 `action` 为 `"attach_tools"`,`attached` 为新增工具名;
`detach` 成功时 `action` 为 `"detach_tools"`,`detached` 为移除工具名;
`replace` 成功时同时返回 diff。

**校验失败:**

```json
{
  "error": "tool_not_allowed",
  "message": "batch tool request failed validation",
  "details": [
    {"index": 0, "tool": "CMDC.Tool.Shell", "reason": "tool_not_allowed"}
  ]
}
```

core 原子校验失败返回 422:

```json
{
  "error": "attach_tools_failed",
  "message": "core validation failed; no tools were changed",
  "details": [
    {"target": "CMDC.Tool.ReadFile", "reason": "already_attached"}
  ]
}
```

成功批量变更会通过 SSE/WS 发出 `tools_updated`:

```json
{
  "attached": ["read_file"],
  "detached": []
}
```

---

### 中段注入与中止

### `POST /v1/sessions/:id/steer`

把一条 steering 文本插入当前或下一轮 Agent 执行。

```json
{
  "text": "优先检查测试失败,不要重构无关代码"
}
```

**响应 200:**

```json
{
  "ok": true,
  "action": "steer",
  "ref": "#Reference<0.1.2.3>"
}
```

### `POST /v1/sessions/:id/abort`

异步中止当前执行。`killTools` / `kill_tools` 可取 `"none"`、
`"killable"`、`"all"`;`clearQueue` / `clear_queue` 为 boolean。

```json
{
  "reason": "user_cancelled",
  "killTools": "killable",
  "clearQueue": true
}
```

**响应 202:**

```json
{
  "ok": true,
  "action": "abort",
  "opts": {
    "reason": "user_cancelled",
    "kill_tools": "killable",
    "clear_queue": true
  },
  "async": true
}
```

---

### Plugin opts 热更新

### `PATCH /v1/sessions/:id/plugins/:plugin/opts`

调用 core 0.6 `CMDC.update_plugin_opts/3`。Gateway 只允许服务端
`:plugin_opts_allowlist` 中的 Plugin 被更新。

```elixir
config :cmdc_gateway, :plugin_opts_allowlist,
  [CMDC.Plugin.Builtin.CostGuard]
```

**请求体:**

```json
{
  "opts": {
    "maxTokens": 120000
  }
}
```

`opts` / `pluginOpts` / `plugin_opts` 均可;key 必须能转换为已存在 atom。

**响应 202:**

```json
{
  "ok": true,
  "async": true,
  "sessionId": "my-session-001",
  "plugin": "CMDC.Plugin.Builtin.CostGuard"
}
```

---

### Checkpoint / Resume

### `POST /v1/sessions/:id/checkpoints`

保存当前 session checkpoint。checkpoint backend 只能由服务端配置,客户端传
`backend` / `backendModule` / `backendOpts` 会被拒绝。

```json
{
  "label": "before-risky-change",
  "metadata": {
    "source": "dashboard"
  }
}
```

**响应 201:**

```json
{
  "checkpointId": "chk_123",
  "sessionId": "my-session-001",
  "label": "before-risky-change",
  "metadata": {"source": "dashboard"},
  "strippedFields": ["pending_approvals"],
  "savedAt": "2026-06-01T00:00:00Z",
  "schemaVersion": 1
}
```

### `POST /v1/sessions/resume`

从已保存 checkpoint 恢复到新的 Gateway session。

```json
{
  "sessionId": "my-session-001",
  "checkpointId": "chk_123",
  "newSessionId": "my-session-001-resumed",
  "workingDir": "/home/user/project",
  "groupId": "agentops-run-001",
  "eventBufferSize": 512,
  "providerOpts": {
    "temperature": 0.2
  }
}
```

**请求体字段:**

| 字段 | 类型 | 必填 | 说明 |
|------|------|------|------|
| `sessionId` / `session_id` | string | **是** | checkpoint 来源 session |
| `checkpointId` / `checkpoint_id` | string | 否 | 不传时由 backend 决定默认 checkpoint |
| `newSessionId` / `targetSessionId` | string | 否 | 新 session id;默认自动生成 |
| `workingDir` / `working_dir` | string | 否 | 恢复后的工作目录,仍经过 `WorkingDirPolicy` 校验 |
| `groupId` / `group_id` | string | 否 | 恢复 session 所属 group |
| `eventBufferSize` / `event_buffer_size` | integer | 否 | 新 session replay ring buffer |
| `hibernateAfterMs` / `hibernate_after_ms` | integer | 否 | 新 session hibernate 配置 |
| `providerOpts` / `provider_opts` | object | 否 | 透传 provider opts,只接受已存在 atom key |

**响应 201:**

```json
{
  "sessionId": "my-session-001-resumed",
  "status": "resumed",
  "checkpointId": "chk_123",
  "groupId": "agentops-run-001"
}
```

---

## Provider Registry

Provider Registry 是 admin-only 控制面,用于运行时注册服务端 provider
profile。admin key 通过 `:admin_api_keys` 配置;普通 API key 返回 403。

```elixir
config :cmdc_gateway, :admin_api_keys, ["admin-key"]
```

### `GET /v1/provider_profiles`

```json
{
  "profiles": [
    {
      "name": "prod-openai",
      "provider": "openai",
      "optsKeys": ["api_key", "base_url"],
      "registeredAtMs": 1780267200000
    }
  ]
}
```

### `POST /v1/provider_profiles`

```json
{
  "name": "prod-openai",
  "provider": "openai",
  "opts": {
    "apiKey": "sk-prod",
    "baseUrl": "https://api.openai.com/v1"
  }
}
```

响应只回显 `optsKeys`,不回显密钥值。Gateway JSON API 明确拒绝
`resolverFn` / `resolver_fn`;resolver 函数只能由宿主 Elixir app 服务端配置。

### `DELETE /v1/provider_profiles/:name`

```json
{
  "ok": true,
  "name": "prod-openai",
  "status": "deleted"
}
```

---

## 统计与历史

### 用量统计

获取 Session 运行状态 + API Key 维度的用量计量数据。

### `GET /v1/sessions/:id/stats`

**路径参数:**

| 参数 | 类型 | 说明 |
|------|------|------|
| `id` | string | Session ID |

**请求:**

```
GET /v1/sessions/my-session-001/stats HTTP/1.1
X-API-Key: sk-abc123
```

**响应 200:**

```json
{
  "sessionId": "my-session-001",
  "state": "idle",
  "turns": 5,
  "toolCalls": 12,
  "totalTokens": 25600,
  "costUsd": "0.0251",
  "tokenUsage": {
    "promptTokens": 15000,
    "completionTokens": 10600,
    "totalTokens": 25600,
    "costUsd": "0.0251",
    "cachedTokens": 2048
  },
  "uptimeMs": 120000,
  "meter": {
    "promptCount": 5,
    "totalPromptTokens": 15000,
    "totalCompletionTokens": 10600,
    "totalTokens": 25600,
    "totalCostUsd": "0.0251",
    "cachedTokens": 2048,
    "lastActivityAt": "2026-06-01T00:00:00Z"
  },
  "eventBufferSize": 512,
  "lastEventIndex": 42,
  "eventBufferCount": 42
}
```

| 字段 | 类型 | 说明 |
|------|------|------|
| `sessionId` | string | Session ID |
| `state` | string | Agent 状态机当前状态 |
| `turns` | integer | 已完成的对话轮次数 |
| `toolCalls` | integer | 累计工具调用次数 |
| `totalTokens` | integer | 累计消耗 token 数(Agent 侧统计) |
| `costUsd` | number \| string \| null | Agent 侧成本估算 |
| `tokenUsage` | object | Agent 侧 `CMDC.TokenUsage` 摘要 |
| `uptimeMs` | integer | Session 存活时间(毫秒) |
| `meter.promptCount` | integer | 该 API Key 发送的 prompt 次数(跨 Session 累计) |
| `meter.totalPromptTokens` | integer | 该 API Key 的累计输入 token 数 |
| `meter.totalCompletionTokens` | integer | 该 API Key 的累计输出 token 数 |
| `meter.totalTokens` | integer | 该 API Key 的累计总 token 数 |
| `meter.totalCostUsd` | number \| string \| null | 该 API Key 的累计成本估算 |
| `meter.cachedTokens` | integer | 该 API Key 累计缓存命中 token |
| `meter.lastActivityAt` | string \| null | 最近一次计量活动时间 |
| `eventBufferSize` | integer | session replay ring buffer 配置大小 |
| `lastEventIndex` | integer | 当前 EventBus 最新事件 index |
| `eventBufferCount` | integer | ring buffer 当前保留事件数 |

> `meter` 数据是 API Key 维度的全局统计,不仅限于当前 Session。

---

### 对话历史

获取 Session 的完整消息列表。

### `GET /v1/sessions/:id/messages`

**路径参数:**

| 参数 | 类型 | 说明 |
|------|------|------|
| `id` | string | Session ID |

**请求:**

```
GET /v1/sessions/my-session-001/messages HTTP/1.1
X-API-Key: sk-abc123
```

**响应 200:**

```json
{
  "sessionId": "my-session-001",
  "messages": [
    {
      "id": "msg_001",
      "role": "system",
      "content": "你是一个专业的编程助手",
      "toolCalls": null,
      "callId": null,
      "name": null,
      "isError": false
    },
    {
      "id": "msg_002",
      "role": "user",
      "content": "帮我用 Python 写一个快速排序",
      "toolCalls": null,
      "callId": null,
      "name": null,
      "isError": false
    },
    {
      "id": "msg_003",
      "role": "assistant",
      "content": "好的,这是一个 Python 快速排序实现:\n\n```python\ndef quick_sort(arr):\n    ...\n```",
      "toolCalls": [
        {
          "call_id": "tc_001",
          "name": "WriteFile",
          "arguments": {"path": "sort.py", "content": "def quick_sort(arr): ..."}
        }
      ],
      "callId": null,
      "name": null,
      "isError": false
    },
    {
      "id": "msg_004",
      "role": "tool_result",
      "content": "File written successfully",
      "toolCalls": null,
      "callId": "tc_001",
      "name": "WriteFile",
      "isError": false
    }
  ]
}
```

**Message 对象字段:**

| 字段 | 类型 | 说明 |
|------|------|------|
| `id` | string | 消息唯一 ID |
| `role` | string | 角色:`"system"` / `"user"` / `"assistant"` / `"tool_result"` |
| `content` | string \| null | 消息文本内容 |
| `toolCalls` | array \| null | 仅 `assistant` 消息可能包含,工具调用列表 |
| `toolCalls[].call_id` | string | 工具调用 ID |
| `toolCalls[].name` | string | 工具名称 |
| `toolCalls[].arguments` | object | 工具调用参数 |
| `callId` | string \| null | 仅 `tool_result` 消息包含,关联的工具调用 ID |
| `name` | string \| null | 仅 `tool_result` 消息包含,工具名称 |
| `isError` | boolean | 是否为错误消息 |

---

## SDK 兼容与迁移说明

`cmdc_gateway 0.6` 对 HTTP/JSON 客户端保持加性升级:已有路径、字段名和
成功状态码尽量不变,新能力通过新增字段或新增端点暴露。

### 兼容承诺

- Python / Node / Go 旧 SDK 可以继续只依赖 `sessionId`、`status`、`requestId`、
  SSE `event/data` 和 HITL `approvalId/ref` 字段;新增字段可以忽略。
- `POST /v1/sessions/:id/prompt` 仍异步返回 202;排队语义仍通过 `queued`
  表达。
- `POST /v1/sessions/:id/approve` 默认 `autoResume=true`,`reject` 默认
  `autoResume=false`;显式 `autoResume: false` / `auto_resume: false` 会被保留。
- `GET /v1/sessions/:id/events` 不带 `since/types` 时仍是实时 SSE;带
  `since` 后才启用 replay。
- `POST /v1/sessions/:id/tools` 仍是外部 HTTP callback tool 注册;
  `POST /v1/sessions/:id/tools/batch` 是 core Tool attach/detach/replace,
  两者不能混用。

### 0.6 迁移重点

- 创建 session 时建议显式传 `eventBufferSize`,否则断线后无法通过 `since`
  补 replay。
- 需要跨 session 聚合展示时传 `groupId` 并订阅
  `/v1/groups/:group_id/events`;group stream 不保证 replay。
- 恢复会话优先使用 checkpoint/resume。`messages` 仅用于客户端已持有的、
  受大小限制的安全历史导入。
- `workingDir` 会被服务端 `WorkingDirPolicy` 约束;旧客户端如果传绝对路径,
  需要确保该路径位于服务端允许 root 内,且路径段不含 symlink escape。
- `providerOpts`、`plugin opts` 和 Provider Profile `opts` 只接受已存在
  atom key。SDK 不应发送任意动态 key。
- `skillSelector`、checkpoint backend、provider resolver、plugin module
  注入均不接受 public JSON,请迁移到宿主 Elixir app 服务端配置。

### 最小 replay 调用示例

```bash
curl -N \
  "http://localhost:4000/v1/sessions/my-session/events?since=42&types=message_delta,agent_end" \
  -H "X-API-Key: sk-abc123" \
  -H "Accept: text/event-stream"
```

---

## Gateway 边界

Phase 20E 明确以下能力不下沉为 public HTTP JSON API:

| core 能力 | Gateway 边界 | 原因 |
|-----------|--------------|------|
| `skill_selector` | 不接受 `skillSelector` / `skill_selector` JSON 字段 | 任意模块注入风险;Skill 选择器应由宿主 Elixir app 在服务端配置 |
| system-wide telemetry audit | 不提供 `/v1/audit/events` 之类全局 SSE | Gateway 的 `?mode=audit` 只投影当前 EventBus 事件;全局 telemetry 审计应由宿主 app 使用 `:telemetry.attach_many/4` 接入观测栈 |
| group replay | `GET /v1/groups/:group_id/events` 是 live-only;带 `since/types/Last-Event-ID` 返回 `group_replay_not_supported` | core 0.6 只提供 per-session ring buffer replay |
| `CMDC.monitor/1` / `demonitor/2` | 不提供 HTTP monitor endpoint | 这是 BEAM 进程内生命周期集成;跨语言客户端请使用 SSE/WS terminal events 和 HTTP status |
| checkpoint backend / provider resolver / plugin module | 不接受客户端 JSON 指定任意模块或 resolver 函数 | 这些属于服务端信任边界和部署配置 |

外部系统恢复会话优先使用 checkpoint/resume。仅当宿主系统已经有安全、尺寸受控的 JSON
历史时,才使用 `POST /v1/sessions` 的 `messages` 导入。

---

## 回调工具注册

为 Session 动态注册外部 HTTP 回调工具。注册后 Agent 可像使用内置工具一样调用它,Gateway 会代理 HTTP 请求到你的服务。

### `POST /v1/sessions/:id/tools`

**路径参数:**

| 参数 | 类型 | 说明 |
|------|------|------|
| `id` | string | Session ID |

**请求头:**

```
Content-Type: application/json
X-API-Key: sk-abc123
```

**请求体:**

```json
{
  "name": "query_database",
  "description": "Run a SQL query on the production database",
  "callbackUrl": "https://my-service.example.com/tools/query",
  "parameters": {
    "type": "object",
    "properties": {
      "query": {
        "type": "string",
        "description": "SQL query to execute"
      },
      "database": {
        "type": "string",
        "description": "Target database name",
        "enum": ["production", "staging"]
      }
    },
    "required": ["query"]
  },
  "timeoutMs": 30000
}
```

| 字段 | 类型 | 必填 | 默认值 | 说明 |
|------|------|------|--------|------|
| `name` | string | **是** | — | 工具名称,Agent 调用时使用此名称 |
| `description` | string | 否 | `"External tool: <name>"` | 工具描述,帮助 Agent 理解何时使用此工具 |
| `callbackUrl` | string | **是** | — | 你的 HTTP 服务端点 URL,Gateway 向此 URL 发 POST |
| `parameters` | object | 否 | `{"type":"object","properties":{}}` | JSON Schema 格式的参数定义,Agent 根据此 schema 构造调用参数 |
| `timeoutMs` | integer | 否 | `30000` | HTTP 请求超时时间(毫秒) |

**响应 201 Created:**

```json
{
  "ok": true,
  "sessionId": "my-session-001",
  "toolName": "query_database"
}
```

**响应 422:**

```json
{
  "error": "registration_failed",
  "message": "Missing required fields: name, callbackUrl"
}
```

---

#### 回调执行流程

当 Agent 决定调用已注册的回调工具时:

**1. Gateway → 你的服务(POST 请求)**

Gateway 向 `callbackUrl` 发送 POST 请求:

```
POST https://my-service.example.com/tools/query HTTP/1.1
Content-Type: application/json

{
  "callId": "tc_a1b2c3d4",
  "toolName": "query_database",
  "args": {
    "query": "SELECT count(*) FROM users WHERE active = true",
    "database": "production"
  },
  "sessionId": "my-session-001"
}
```

| 字段 | 类型 | 说明 |
|------|------|------|
| `callId` | string | 工具调用唯一 ID |
| `toolName` | string | 工具名称 |
| `args` | object | Agent 传入的调用参数 |
| `sessionId` | string | Session ID |

**2. 你的服务 → Gateway(HTTP 响应)**

成功返回(HTTP 2xx):

```json
{
  "result": "Active users: 42,851"
}
```

| 字段 | 类型 | 说明 |
|------|------|------|
| `result` | string | 工具执行结果文本,将作为工具返回值传给 Agent |

错误返回(HTTP 2xx,业务错误):

```json
{
  "error": "Permission denied: read-only user cannot execute write queries"
}
```

| 字段 | 类型 | 说明 |
|------|------|------|
| `error` | string | 错误描述,Agent 会收到此错误信息并据此调整策略 |

> HTTP 非 2xx 状态码或网络错误会被 Gateway 转换为工具执行失败,Agent 会收到包含错误详情的 `tool_execution_end` 事件(`status: "error"`)。

---

#### 完整回调工具示例(Python Flask)

```python
from flask import Flask, request, jsonify

app = Flask(__name__)

@app.route('/tools/query', methods=['POST'])
def handle_query():
    data = request.json
    call_id = data['callId']
    args = data['args']
    query = args.get('query', '')
    
    try:
        result = execute_sql(query)  # 你的业务逻辑
        return jsonify({"result": str(result)})
    except Exception as e:
        return jsonify({"error": str(e)})

if __name__ == '__main__':
    app.run(port=9999)
```

对应注册请求:

```bash
curl -X POST http://localhost:4000/v1/sessions/my-session-001/tools \
  -H "X-API-Key: sk-abc123" \
  -H "Content-Type: application/json" \
  -d '{
    "name": "query_database",
    "description": "Execute SQL queries on the database",
    "callbackUrl": "http://localhost:9999/tools/query",
    "parameters": {
      "type": "object",
      "properties": {
        "query": {"type": "string", "description": "SQL query"}
      },
      "required": ["query"]
    }
  }'
```