信任模型

一条原则统辖 Plexus 对 agent 每一次请求的处理：能触达网关的 agent，默认依然没有任何权限。 本页专讲信任机制。想在语境里看完整心智模型，先读核心概念；对抗视角和凭据边界，见安全模型。

默认拒绝就是全部承诺

触达网关——哪怕握手成功——换来的只是 agent 知道"这里有什么"，绝不是调用任何东西的权利。握手成功授予完整 manifest，仅此而已。从未被授予任何 capability 的 agent，在 /invoke 处以 grant_required 被拒。

权限由人授予：限定到具体 capability、有时限、随时可撤销。agent 抢不来、推断不出，也自封不了。

两个时钟，而非一个

Plexus 刻意把你的批准能常驻多久和单个 token 存活多久分开：

两个时钟 — 信任窗口之上的短时受限 token

信任窗口（trust-window）——你这个决定的存活期。批准授权时你选一个窗口：once、1h、1d、 7d、until-revoked，或自定义（custom）时长。窗口结束（或你撤销）之前，agent 不必再问。这就是常驻授权。
受限 token（scoped token）——爆炸半径。每次实际调用都携带一个短寿命的 bearer token，默认 15 分钟 （DEFAULT_TOKEN_LIFETIME_MS，钳制在 [1m, 60m]）。token 过期后，只要信任窗口还在，agent 就通过 POST /grants/refresh 从常驻授权静默换发一个新的——不需要 connection-key，也不再提示。所以泄漏的 token 几分钟内就一文不值，哪怕常驻授权还在生效。

once 授权是特例：只为一次使用而立（expiresAt = grantedAt），不能刷新，也绝不会让未来的某次批准被跳过。

来源（provenance）——三类组织轴

来源到默认姿态——第一方与受管的读自动授予，所有写/执行挂起待批，扩展的任何动作都挂起

决定 Plexus 对一项 capability 有多谨慎的唯一事实，是它的来源——这项 capability 从哪来。信任随出身而定。

来源	含义	默认姿态
first-party	保留的进程内 source（Apple Calendar/Reminders、Obsidian 文件系统、cc-master）。	read 顺畅放行；write/execute 仍要问人。
managed	你通过可信的 `/admin` UI 添加的 source（如 Obsidian REST vault），添加时经过人的审查。	read 姿态与第一方相同；write/exec 仍挂起等人批准。
extension	agent 经 `POST /extensions` 在 wire 上注册，最严格的一类。	任何动词都挂起等人批准。

第一方日历 read 和 agent 注册的 shell 包装器不是同一种风险，Plexus 从不假装它们是。来源印记由网关盖在 source 上——扩展无法冒充第一方 id（那些 id 是保留的）。

敏感度（sensitivity）——推导出的风险层级

网关从 provenance + verb + transport 推导出一个敏感度层级，目的只有一个：让 UI 和每个 agent 描述的是同一种风险：

low——第一方 / 受管上的 read。
elevated——第一方 / 受管上的 write/exec，或扩展上的 read。
high——扩展上的 write/exec，或任何带 write/exec 的 cli / local-rest transport。

Workflow 的敏感度按成员上卷（取最大值）。

常驻资格随敏感度而定，而非随出身（ADR-5）

不是每个窗口对每项 capability 都可选。一次授权能不能常驻，由该 capability 自身的敏感度决定 ——从 provenance × verb 推导——而绝不由它从哪来决定：

read capability 可以常驻：一经批准就取一个真实窗口（第一方/受管默认 7d；write 默认 1d），之后范围内的 read 在窗口结束或你撤销之前都零摩擦。
execute（或其他高敏感度）capability 永远不能常驻：每次使用都要批准，上限就是 once ——即便管理员给出了更长的信任窗口。运行代码（claudecode.run、codex.run）的敏感度确实要求每次都有一个新鲜的人类决定，所以它永远配不上 7d/until-revoked 窗口。

execute 永不常驻的上限是结构性的

拥有者也无法把一项 execute capability 变成常驻授权——那道 once 上限即便在管理员提供的信任窗口下依然成立。read cap 可以携带真实的常驻窗口（1d/7d）；execute 永远不会。常驻是 capability 的属性，不是 agent——甚至管理员——能为一项危险的 cap 覆盖掉的选项。

暴露门控——拥有者的外层开关

默认拒绝的漏斗——暴露、发现、授权、调用；每道闸都收窄，未通过即拒绝

授权决定 agent 可以调用什么；暴露（我暴露什么）是拥有者摆在授权之前的外层门控。被拥有者禁用的 capability 在 discovery 里不可见、不可授权，invoke 时以 capability_unexposed 被拒——这一步在授权检查之前执行。所以有效访问 = 已授权 ∧ 已暴露：撤掉暴露就切断了这项 capability，不管还有什么常驻授权。

可见、可撤销、诚实叙述

常驻授权是一等公民，两侧都看得见：拥有者在 /admin 的 Grants 标签页看到全部；agent 在 GET /grants 只看到它自己的。每一行都带着 agent、capability、动词、来源、敏感度、信任窗口和到期时间。

随时撤销。 人从 Grants 标签页撤销，或持 connection-key 调 POST /grants/revoke——按 jti、按 (agentId, capabilityId)，或按 bundleId 撤销一整个任务 bundle。agent 出示某个 token 及其 jti，可以放弃它自己的 token。
叙述由网关撰写，绝非 agent 的措辞。 人批准时读到的风险摘要出自网关之手。agent 那段可选的 "为什么是现在"说明展示时标注为 "the agent says：（agent 说：）"，会被净化和截断，且不影响任何决定。 agent 永远伪造不了那份风险摘要。
一切都有审计。 每次握手、授权、token、invoke 和撤销——包括派发前的拒绝——都记进一份只追加的本地审计轨迹（GET /admin/api/audit），密钥已抹除。把它当作尽力而为的可观测性，而不是防篡改账本。

接下来去哪

读一遍就通——本页所展开的完整心智模型。
编译模型——launcher 如何收起 enroll → handshake → grant → invoke 这条链，而网关实时强制授权。
安全模型——两种凭据、威胁模型，以及 Plexus 不防什么。

信任模型 ​

默认拒绝就是全部承诺 ​

两个时钟，而非一个 ​

来源（provenance）——三类组织轴 ​

敏感度（sensitivity）——推导出的风险层级 ​

常驻资格随敏感度而定，而非随出身（ADR-5） ​

暴露门控——拥有者的外层开关 ​

可见、可撤销、诚实叙述 ​

接下来去哪 ​