Daily Engineering Notes

最新文章 · 第 733 页

每日更新技术热点和实战干货,聚焦软件工程、系统架构与 AI 工程化实践。

  • 共 16387 篇文章
  • 分类 266 个
  • 当前第 733 页
2025-09-28

FlashAttention-4 中的 IO 感知块分块策略

探讨 FlashAttention-4 中 IO-aware 块分块策略的工程实现,通过重叠计算与 HBM 访问,在 A100 GPU 上实现长序列 MQA 推理的 2 倍吞吐量提升。提供参数调优与监控要点。

ai-systems · 2025-09
2025-09-28

优化 Typst 的并行渲染管道

Typst 通过并行处理标记语言优化大型技术文档的 PDF 生成,实现亚秒级编译。探讨管道设计、可落地参数与监控要点。

compiler-design · 2025-09
上一页第 733 / 820 页下一页