Daily Engineering Notes

最新文章 · 第 708 页

每日更新技术热点和实战干货,聚焦软件工程、系统架构与 AI 工程化实践。

  • 共 16387 篇文章
  • 分类 266 个
  • 当前第 708 页
2025-10-03

从零实现最小 Transformer LLM

使用 PyTorch 从头构建小型 Transformer 语言模型,包括自定义 BPE 分词器、GPT-2 式架构,并在莎士比亚数据集上训练的核心组件。

ai-systems · 2025-10
上一页第 708 / 820 页下一页