extra="forbid" 严格模式,LLM 多返回一个字段直接拒绝。13 个契约覆盖全链路。
PipelineBreak 受控中断。雷达熔断(CRITICAL ≥ 5)、法官驳回、编译失败——安全停下,不带病执行。
自定义代码必须通过 AST 语法树审查。import / exec / eval / open —— 从语法层面杜绝。
每步操作前自动存档(parquet)。操作失败 → 丢弃快照 → 数据零污染。
tool_use 优先 → 不支持时降级正则提取 → 自由文本永远被约束为 JSON。
SHA-256 链式审计。每条日志串联前一条的哈希,篡改任意一条 → verify() 立即暴露。
| 原始数据 | |
|---|---|
| 张三 | 110101200001011234 |
| 李四 | 110101200002021234 |
| 王五 | 110101200003031234 |
| LLM 看到的 | |
|---|---|
| PERSON_a3f8c21e | [BLOCKED] |
| PERSON_7b2e9f04 | [BLOCKED] |
| PERSON_d1c45a87 | [BLOCKED] |
完全移除。身份证号、银行卡号。LLM 看不到该列。
HMAC token 化。姓名、手机、邮箱。不可逆,同一密钥跨会话一致。
不处理。成绩、日期等非敏感字段。
每条 OperationLog 包含 SHA-256(payload + prev_hash)。seal() 封装,verify() 校验。
递归追踪 Excel 公式链:普通引用 / 绝对引用 / 结构化表引用 / 范围引用全覆盖。输出带"表头名 + 真实数值"的拓扑树,让 LLM 看到的是事实而非猜测。
LLM 会把 =SUM(A1:A10) 篡改成"求和函数"。三道防线拦截:
1. 精确匹配:修复被去掉 "=" 前缀的公式
2. 列名锚定:提到公式列时自动追加原始公式
3. 公式附录:报告末尾强制追加对照表