测试说明 点击展开 5 步 quick-probe-v1 详解
Codex/OpenAI 版快速探针:前 4 步同一会话,第 5 步(知识召回)独立新会话,覆盖服务无关的核心信号—— 1. ping/pong —— 单字指令遵循 + 建立会话。 2. 身份(结构化)—— 三行 vendor / brand / model,机器可解析(期望按官方基线多数派 baseline-derived,不硬编码 OpenAI 身份)。 3. 知识截止 —— YYYY-MM 格式,与官方基线对照。 4. 身份(自由格式)—— 自然语言自报,给包装层暴露品牌的机会。 5. 知识召回 —— 工具禁用、独立新会话的参数化公共事实题。 codex 走 /responses wire:缓存 / Anthropic 信封 / extended-thinking 等维度对其 N/A(见 codex 评分 profile),故无需 claude 版的 5 分钟 sliding-cache 边界时序,步间仅轻量间隔避免限流。
5 通道 · 5 步骤
2026/07/02 运行日期
gpt-5.4 官方基准
1 任务失败 执行不完整
已揭晓 揭晓进度
步骤 / 指标
luminai
M-Team/Plus/API
TopRouterCN
O-Pro
ClaudeZZ
O-Pro
FineCoding
O-Plus
官方基准
通道不可用
基本信息
服务名 CodexCodexCodexCodexCodex
模型 gpt-5.4gpt-5.4gpt-5.4gpt-5.4gpt-5.4
客户端 codex_exec v0.139.0codex_exec v0.139.0codex_exec v0.139.0codex_exec v0.139.0-
偏差标红基于官方基准
综合结论
与基线相似度 官方基准失败,本组不评分官方基准失败,本组不评分官方基准失败,本组不评分官方基准失败,本组不评分 基准(参考)
维度雷达 基准无指纹
平均延迟 4788 ms2974 ms20961 ms4541 ms-
输出速度 47.8 tok/s-52.5 tok/s71.3 tok/s-
完成步骤 5/5 成功 5/5 成功 5/5 成功 5/5 成功 0/5 成功 · 1 失败 · 4 跳过
按官方价目重估
同等内容若直发 Anthropic 的估算 ⓘ
$0.0408$0.0375$0.1033$0.0620$0.0000 (部分)
缓存读取占比 74%78%88%74%- (部分)
揭晓
通道
服务商 luminai ↗
通道M-Team/Plus/API
通道O-Pro
服务商 ClaudeZZ ↗
通道O-Pro
通道O-Plus
官方基准