使用提示工程实现确定性 LLM 分类输出
面向生产环境中的 LLM 分类任务,介绍结构化思维链提示、少样本示例和零温度采样的工程实践,以最小化输出方差。
Daily Engineering Notes
每日更新技术热点和实战干货,聚焦软件工程、系统架构与 AI 工程化实践。
面向生产环境中的 LLM 分类任务,介绍结构化思维链提示、少样本示例和零温度采样的工程实践,以最小化输出方差。
基于 PaddleOCR 开发高效 OCR 系统,从 PDF 和图像中提取结构化数据,支持多语言文本检测与识别,便于集成到 LLM 工作流中。
Async Rust promises memory safety without data races, but what happens when the safety guarantees themselves become a subtle hazard? This deep dive explores "futurelock," a counterintuitive deadlock pattern where safe Rust code can still hang indefinitely.
基于 Claude Cookbook,利用 Jupyter notebooks 工程化模块化提示模式和工具集成,实现可重现的 AI 工作流和智能代理应用。包括提示模板设计、工具调用参数及 agentic 工作流优化要点。
探讨 ripgrep 在大型代码仓库中的工程实现,聚焦 Rust 并行正则匹配、gitignore 集成与二进制文件检测机制,提供亚秒级搜索的参数配置与优化策略。
基于 Tauri 的 Judo GUI 为 Jujutsu VCS 提供可视化操作,支持操作日志、合并差异和拖拽重基等功能,优化开发工作流。
解析LeRobot中多传感器时间对齐、域随机化参数与扩散策略训练的数据增强技术,提供可落地的工程化配置清单。
工程化 Claude 在浏览器中的代码生成与执行,支持无缝协作编辑、实时反馈和零设置开发环境。
利用 DeepSeek-VL 通过视觉语言提示实现零样本文档布局检测,提供工程参数和监控要点。
基于 ChkTag 规范,探讨硬件标签与编译器结合实现边界和时序内存安全,提供无开销检查的参数配置与部署策略。
将BERT的掩码语言建模目标重新诠释为扩散模型的一个去噪步骤,实现无自回归解码的迭代文本生成精炼。
探讨 DeepSeek-OCR 通过动态分辨率裁剪和视觉编码优化,实现边缘设备上的实时多语言文档扫描,包含工程参数和最佳实践。
探讨基于 WebAssembly 的 x86-64 模拟器构建,提供内联代码编辑、断点步进及寄存器内存检查的工程实践与参数配置。
探讨5M+文档RAG系统的混合检索实现,包括BM25与向量嵌入融合、学习查询扩展,以及召回/精确率权衡的评估策略,提供工程参数与监控要点。
探讨 ClickHouse 与 Redpanda 集成的缓冲管理策略,针对流式数据管道的低延迟 OLAP 写入,提供批次大小、压缩和错误恢复的工程参数。
基于 5M+ 文档处理经验,详解 MinHash LSH 近重复去重与语义阈值质量过滤的工程参数,确保 RAG 索引纯净高效。
利用 LLM 和计算机视觉实现浏览器自动化,针对非结构化网页的动态元素检测与工作流执行,提供工程化参数与恢复机制。
针对 MooseStack 的 OLAP 写操作,介绍自适应缓冲刷新策略的实现,帮助优化写放大问题,提供关键参数配置和监控要点。
探讨如何通过抽象语法树(AST)将推断的心理状态转化为可执行代码,实现AI代理在多代理交互中的人类般社会推理,提供工程参数和落地清单。
利用 Omarchy 一键部署 Hyprland,配置动态平铺窗口管理、可脚本化快捷键及 Waybar 状态栏集成,实现 Arch Linux 上高效的多监视器开发环境。提供参数设置、监控要点及落地清单。