LLM工程基础:分词方案、缩放定律、预训练/微调策略与KV缓存优化
基于ZJU-LLMs教材与经典论文,工程化剖析LLM管道:BPE分词、Kaplan/Chinchilla缩放定律、PEFT微调及KV缓存量化/分页优化,提供参数清单与监控要点。
Daily Engineering Notes
每日更新技术热点和实战干货,聚焦软件工程、系统架构与 AI 工程化实践。
基于ZJU-LLMs教材与经典论文,工程化剖析LLM管道:BPE分词、Kaplan/Chinchilla缩放定律、PEFT微调及KV缓存量化/分页优化,提供参数清单与监控要点。
Django 6 强化异步视图/ORM,支持非阻塞 I/O,并优化表单/模板,提升高吞吐 web 应用的可扩展性。
CUDA-L2 通过强化学习搜索 GEMM 调度与平铺策略,在 A100 上 1000 个配置中多数超越 cuBLAS。给出工程部署参数、基准脚本与 QPS 监控要点。
针对mchess变体象棋平台,探讨环面棋盘下棋引擎改造,包括wraparound移动生成、Zobrist哈希无限板模拟及minimax参数调优。
精选从零实现数据库、Docker、Git、神经网络等核心技术的多语言教程,帮助系统工程师掌握底层算法与实现原理。
剖析 Lynx 开源 C++ 渲染引擎的核心架构、布局算法参数与跨平台 JS 集成实践,提供工程化落地清单。
剖析 SET 钓鱼向量模块,包括网站克隆、凭证采集、批量邮件与 Arduino 攻击的工程参数、监控要点与防御策略。
浏览器内轻量多用户 Python 代码编辑与共享 REPL,基于 Y.js CRDT 和 Django Channels 的工程参数与落地指南。
基于 MultiVox 开源项目,探讨双 HUB75 LED 平面旋转扫掠的 3D 体素渲染同步机制、刷新率优化及硬件参数配置。
AI GPU HBM 需求挤占 DDR5 产能,提供服务器 RAM 采购预测、多渠道策略、DDR4 备选参数及 homelab 扩展限界要点。
Bootloader Unlock Wall of Shame 项目系统追踪手机厂商解锁政策,分类曝光限制自定义 ROM 和 Root 的反用户措施,提供选购与绕过清单。
剖析Transformer推理中KV缓存的核心作用、内存消耗机制与工程优化参数,实现高吞吐、低延迟的LLM部署实践。
基于 Claude Code 的 agents 项目,实现多代理协作的终端代码自动化。详解插件安装、混合模型编排参数与工作流监控要点。
基于 Basecamp Fizzy 开源项目,剖析 Rails 中用 ActionCable 和 Hotwire 实现简约 Kanban 板的实时多用户拖拽协作,提供工程参数、阈值与部署清单。
基于 Opencode 开源框架,用 TypeScript 实现终端 AI 编码代理,集成 Claude 模型,支持代码编辑、自动化任务及多代理协作,提供工程参数与部署清单。
借鉴 Browser Buddy,利用嵌入向量和协同过滤构建跨浏览器个性化写作内容推荐系统,提供算法参数、落地清单与监控策略。
小数据集评估模型时,传统train-test split方差过大;转向repeated k-fold CV、bootstrap重采样,提供参数阈值、监控指标和实现清单。
Proxmox Datacenter Manager 1.0 统一管理多站点 Proxmox VE 集群,支持实时迁移、HA 与资源编排,给出工程化部署参数与监控要点。
Ladybird 用 C++ 从零打造独立 Web 引擎,聚焦标准合规、渲染性能与模块化设计,提供多进程架构参数与优化清单,避免遗留依赖。
OpenAI Codex CLI 轻量 Rust 终端代理,支持代码生成编辑自动化。详解 Execpolicy 参数、Sandbox 清单与工程化落地要点。