Daily Engineering Notes

最新文章 · 第 633 页

每日更新技术热点和实战干货,聚焦软件工程、系统架构与 AI 工程化实践。

  • 共 16387 篇文章
  • 分类 266 个
  • 当前第 633 页
2025-10-18

分布式凸松弛技术优化SGD:多GPU LLM微调加速30%

将单纯形优化的凸松弛技术适应到分布式SGD变体中,通过优化all-reduce模式和分片策略,实现多GPU LLM微调中30%更快的收敛。聚焦工程化实现,避免通信瓶颈,提供可落地参数和监控要点。

ai-engineering · 2025-10
上一页第 633 / 820 页下一页