2026-01-14 系统化测试生成:如何自动捕获 Anthropic 的 top-K 采样 bug 针对 LLM 推理中的 top-K 采样 bug,探讨基于分数证明分解的系统化测试生成框架,提供可落地的参数配置与监控策略。 ai-systems-testing · 2026-01