测试说明 点击展开 5 步 quick-probe-v1 详解
Codex/OpenAI 版快速探针:前 4 步同一会话,第 5 步(知识召回)独立新会话,覆盖服务无关的核心信号—— 1. ping/pong —— 单字指令遵循 + 建立会话。 2. 身份(结构化)—— 三行 vendor / brand / model,机器可解析(期望按官方基线多数派 baseline-derived,不硬编码 OpenAI 身份)。 3. 知识截止 —— YYYY-MM 格式,与官方基线对照。 4. 身份(自由格式)—— 自然语言自报,给包装层暴露品牌的机会。 5. 知识召回 —— 工具禁用、独立新会话的参数化公共事实题。 codex 走 /responses wire:缓存 / Anthropic 信封 / extended-thinking 等维度对其 N/A(见 codex 评分 profile),故无需 claude 版的 5 分钟 sliding-cache 边界时序,步间仅轻量间隔避免限流。
4 通道 · 5 步骤
2026/07/02 运行日期
gpt-5.5 官方基准
2 通道分数 < 70 另含 1 任务失败
已揭晓 揭晓进度
1 通道不可测 · 已从主对比表移除 点击展开原因
  • 100X / O-Puls/Pro
    评测失败
步骤 / 指标
lucen.cc
O-Plus/Pro
OmniaKey
O-Pro
right
o-cx
官方基准
基本信息
服务名 CodexCodexCodexCodex
模型 gpt-5.5gpt-5.5gpt-5.5gpt-5.5
客户端 codex_exec v0.139.0codex_exec v0.139.0codex_exec v0.139.0codex_exec v0.139.0
偏差标红基于官方基准
综合结论
与基线相似度 68 v3.26.0 93 v3.26.0 81 v3.26.0 基准(参考)
雷达图例
共 8 个维度(顺时针,从顶部 12 点起)— 点击展开对照
  1. 1 模型匹配 model_match
  2. 2 知识截止 cutoff_match
  3. 3 自由身份 identity_free_clean
  4. 4 系统提示纯净 system_prompt_clean
  5. 5 缓存命中比 cache_hit_ratio_match
  6. 6 知识召回 knowledge_recall_match
  7. 7 延迟基线 latency_baseline_match
  8. 8 结构化身份 identity_structured_match

每根轴长度 = 该维度 0-10 分(越长越接近基线)。蓝色虚线圆 = 满分基准。具体权重见 方法论页

维度雷达
平均延迟 7910 ms4394 ms5198 ms3035 ms
输出速度 102.2 tok/s47.4 tok/s46.6 tok/s35.0 tok/s
完成步骤 5/5 成功 5/5 成功 5/5 成功 5/5 成功
按官方价目重估
同等内容若直发 Anthropic 的估算 ⓘ
$0.1326$0.0880$0.1179$0.0806
缓存读取占比 57%76%64%79%
揭晓
通道
服务商 lucen.cc ↗
通道O-Plus/Pro
服务商 OmniaKey ↗
通道O-Pro
服务商 right ↗
通道o-cx
官方基准