Codex 对宪章 v1 的独立审计

原文：raw/sources/web4-codex-audit.txt（Codex gpt-5.5，read-only 沙盒，对抗性审计指令）。一句话总评：“更像原则宣言，不够像可执行系统规格。最大风险是把 agent/audit 流程当成可靠性来源。”

Top 3 可行性风险

“公开数据+速度”的 edge 未被证明：没定义可测指标（提前多久、相对谁、历史胜率）；公开数据还有延迟/限流/索引错误/与付费数据的差距
概率化输出缺 calibration 机制：base rate 怎么构造、如何防 survivorship/lookahead/data snooping、没有 Brier/hit rate 等校准指标
audit 独立性被高估：同类 LLM 共享盲点、可能复述生产者结论；没要求 frozen dataset、独立 query、checksum、notebook replay

关键缺口

数据层规格（entity resolution/snapshot 版本化/API 故障）、研究输出模板（候选必含什么字段）、评估闭环（怎样判定“有用”而非“看起来严谨”）、安全边界（prompt injection/恶意项目文档）、合规边界（“提早布局”仍可能被当成 trading signal）。

过度声称

“这就是全部 edge，足够了”过强（最多是待验证假设）；“audit 能复现”写得像能力保证但无基础设施；“自主推进”暗示 autonomous reliability；“连续 N 期过 audit”的 N 未定义、audit 通过 ≠ 研究有效。

五条修复（全部被 v2 采纳）

edge 改为可验证假设 → 标准 output schema → audit 附 reproducibility artifact → 新增 data governance 章节 → 弱化误导性措辞。逐条对应关系见宪章演化史。