VENUS V5 · WHITE-BOX DATAFLOW ENGINE
Venus — AI 原生数据处理智能体
面向高校“教-学-管-评”的白盒数据流引擎

把 Excel 里的重复搬砖,升级成可审计、可回滚、可复用的五阶段智能数据处理系统。

AI-NativeWhite-BoxAudit-ReadyRust-Accelerated
V5
项目主张

从“复制-粘贴 40 次”到“几分钟批量完成”

Schema · Radar · Dispatcher · ManagerAI · Sandbox
Agenda
演示结构与页面系统

本版直接融合两张参考图:一张负责 Stage 总览,一张负责 Runtime 监控台。

至少 5 种固定模板 · 已落地成稿
T1
封面母版

大标题 + 系统代号 + 状态标签。

T2
议程/目录

分章节组织演示逻辑。

T3
问题/价值卡片

多卡片强信息密度展示。

T4
Stage 作战图

继承第一张图的大段式链路总览。

T5
Runtime 监控台

继承第二张图的节点、日志和状态块。

T6
结果/指标母版

性能、测试、团队、路线图收束。

Pain Points
高校行政人员的 Excel 困境

问题不是“不会用 AI”,而是数据处理流程低效、脏乱、不可追溯、无法复用。

学期末 · 40 名学生 · 40 次往返
P1
逐人操作,效率极低

辅导员需要在 Excel 和 AI 网页工具之间反复切换,一个班的评价常常耗掉整整一个下午。

P2
数据质量无保障

空值、错行、混合类型、重复姓名都可能潜伏在原始表里,人工很难提前发现。

P3
操作不可追溯

谁改了什么、什么时候改、改前是什么,没有日志链,就难以应对异议和审计。

P4
重复劳动无法复用

同类报表每学期都要从头再来,缺乏模板化、结构化、可复放的工作流资产。

Users & Scenes
三类用户,一个白盒引擎

Venus 统一底层引擎,但针对不同角色强调不同价值:效率、透明性、可复现。

教 · 学 · 管 · 评
User A
辅导员 / 班主任

综合评价、综测计算、奖学金材料整理。需求是“一键批量 + 内容个性化”。

User B
教务处行政人员

成绩汇总、毕业审核、评估统计。需求是异常检测准确、操作透明、结果可查。

User C
科研团队 / 研究生

实验清洗、问卷预处理、文献数据整理。需求是清洗快速、过程可复现。

场景 A

学生综合评价批量生成与填写。

场景 B

成绩数据清洗与异常检测。

场景 C

教务报表批量处理与模板复用。

Architecture
双模式融合架构:工作台 + 工作流

用户前台看到的是简单入口,后台运行的是同一条受控的数据流与安全引擎。

共享会话状态 · 切换即同步
Mode A
表格工作台
上传 Excel 后直接看到真实表格与侧边栏聊天。
普通操作静默执行,破坏性操作再请求确认。
COW 快照保证随时撤销。
Mode B
工作流管道
五阶段流水线完整可视化。
适用于正式审计与评审场景。
流程完成后支持存为模板。
Shared V5 Engine
SchemaAnchor → RadarStation → Dispatcher → ManagerAI → SandboxWorker
安全底座

契约、AST、断路器

数据底座

Polars、Arrow、Rust 解析

状态底座

OperationLog、DecisionRecord

模板底座

ZasaCommand 序列可复用

Pipeline Overview
五阶段白盒数据流:全链路物理执行图

左侧展示方法结构,右侧展示真实系统界面,形成“架构设计”与“工程落地”的对应关系。

系统总览页 · 已替换真实截图
🧭
Stage 0
意图锚定 · SchemaAnchor
先识别数据结构,再让系统进入下一步
7 种类型枚举,不依赖 LLM 猜结构
SchemaContract 作为下游入口契约
📡
Stage 1
雷达侦察 · RadarStation
扫描问题并生成 visual_df / shadow_df 双轨视图
缺失值、混合类型、隐藏行列、混合语言
CRITICAL 超阈值自动熔断
⚖️
Stage 2–3
调度 + 法官层
自然语言编译为结构化命令,再做理解力考试与样本审批
ZasaCommand 强类型对象
3 道问答 + 5 条铁律双重验证
🛠
Stage 4
沙箱执行 · SandboxWorker
最小权限执行,写入不可变日志链
COW 快照先执行,校验通过后再合并
失败即回滚,保证主表零污染
Real Project UI
真实系统总览截图
Venus 项目真实界面截图,展示五阶段节点与雷达扫描报告

截图展示阶段节点、雷达扫描报告、问题列表与状态标签,证明本方案基于真实系统界面。

Stages 0 · 1
先识别,再体检:Runtime 上半场

本页采用 Runtime Context 与 Radar Matrix 的可视语言,突出“识别结构”和“发现问题”的双重能力。

参考图 2 的控制台语汇
SchemaAnchor
数据结构身份证
列名
类型
非空率
角色
姓名
text
90%
主识别
高数成绩
integer
80%
待填充列
英语成绩
mixed
90%
类型预警
综合评价
empty
0%
待写入
SchemaContract 是所有后续操作的前置契约。
RadarStation
6 维体检 + 双轨分离
Visual DF

给人看,保留原始格式与问题标记。

Shadow DF

给 AI 吃,深度清洗与类型统一。

发现 2 个空值、1 列混合类型、1 列全空、2 处中英混排。
输出 RadarReport:列名、行号、严重等级、修复建议齐全。
CRITICAL 超过 5 个时熔断,拒绝带病执行。
Stages 2 · 3 · 4
编译、审批、执行:法官与工程兵分离

这不是“让大模型直接改表”,而是先编译、再审批、最后在沙箱中最小权限执行。

结构化命令,不做黑盒施法
Dispatcher
自然语言编译器

把“把高数成绩空值用班级平均分填充”转成 ZasaCommand。

intent: data_clean operation_type: fill_missing target_column: 高数成绩 strategy: mean
ManagerAI
双盲验证法官层

3 道理解力考试 + 5 条铁律样本验证,全部通过才签发 VerifiedPlan。

Q1 目标列? 高数成绩 Q2 策略? mean Q3 影响行? 2 VERDICT APPROVED
SandboxWorker
最小权限工程兵

只执行批准操作,不做自由决策;一切在 COW 快照上发生。

[INFO] executing fill_missing rows_affected = 2 integrity_check = PASS merge_back = YES
Security & Performance
三道防线,三道机制,外加 Rust 原生加速

目标不是“尽量正确”,而是“即使出错也必须可控、可停、可回滚、可追责”。

Safe by Contract · Fast by Native
安全体系
三道防线 + 三道机制
Pydantic V2 严格契约层:13 个契约、11 种操作 Schema。
AST 白名单沙箱:禁用 import、exec、eval、open。
断路器、COW 快照、不可变日志链,共同保证数据零污染。
性能体系
Rust / Native 加速层
读取加速
10–50×
计算加速
50–70%
内存下降
CPU
全核利用
84
自动化测试
13
ADR 记录
11
后端模块
3
LLM 后端
Example Trace
运行追踪页:控制台流程与真实运行画面

本页以结构化说明配合真实项目截图,展示执行流程与运行证据。

运行追踪页 · 已替换真实截图
Trace Script
运行流程摘要
输入样本:学生花名册 10 行 × 7 列,包含空值、混合类型与全空列。
Radar 阶段:系统先完成体检并生成问题列表。
Dispatcher 与 ManagerAI:自然语言先被编译,再经审批后放行。
SandboxWorker:完成两行空值填充,完整性校验 PASS,结果回写主表。
输入指令: 把高数成绩列的空值用班级平均分填充 输出结果: rows_affected = 2 integrity_check = PASS merge_back = YES
Runtime Evidence
真实运行监控界面
Venus 项目真实运行监控截图,展示雷达扫描与问题统计

该截图用于展示“先发现问题,再决定是否执行”的安全逻辑,体现白盒与审计优势。

Delivery Evidence
成果展示页:真实工程落地与产品完成度

本页将终端输出、项目目录和真实 Web 界面并置展示,用于说明工程完成度与产品落地程度。

成果展示页 · 已替换真实截图
Engineering Proof
终端与代码组织现场
Venus 项目真实开发截图,展示终端运行输出与项目文件结构

终端日志、项目目录与方案文档共同呈现,说明该系统具备后端管道、文档资产与工程实现。

Product Proof
Web 界面落地效果
Venus 项目真实产品截图,展示数据扫描页面

左图体现工程完成度,右图体现产品完成度,两者共同构成“可运行”与“可使用”的双重证据。

84
自动化测试
13
ADR 记录
11
后端模块
3
LLM 后端
THANK YOU · VENUS V5
系统总结 / 在线运行

本方案保留“全链路作战图”的架构表达,同时保留“运行控制台”的系统现场感。

WHITE-BOXSAFEAUDITABLEREADY FOR DEFENSE