Daily Engineering Notes

最新文章 · 第 620 页

每日更新技术热点和实战干货，聚焦软件工程、系统架构与 AI 工程化实践。

共 16387 篇文章
分类 266 个
当前第 620 页

2025-10-20

使用提示工程实现确定性 LLM 分类输出

面向生产环境中的 LLM 分类任务，介绍结构化思维链提示、少样本示例和零温度采样的工程实践，以最小化输出方差。

ai-systems · 2025-10

2025-10-20

用 PaddleOCR 构建轻量级 OCR 系统：解析 PDF/图像为 LLM 结构化数据，支持 100+ 语言

基于 PaddleOCR 开发高效 OCR 系统，从 PDF 和图像中提取结构化数据，支持多语言文本检测与识别，便于集成到 LLM 工作流中。

ai-systems · 2025-10

2025-10-20

Futurelock: A subtle risk in async Rust

Async Rust promises memory safety without data races, but what happens when the safety guarantees themselves become a subtle hazard? This deep dive explores "futurelock," a counterintuitive deadlock pattern where safe Rust code can still hang indefinitely.

systems-engineering · 2025-10

2025-10-20

Claude Cookbook：Jupyter 中模块化提示工程与工具集成实践

基于 Claude Cookbook，利用 Jupyter notebooks 工程化模块化提示模式和工具集成，实现可重现的 AI 工作流和智能代理应用。包括提示模板设计、工具调用参数及 agentic 工作流优化要点。

ai-systems · 2025-10

2025-10-20

Rust 实现的并行正则目录搜索：集成 gitignore 解析与二进制检测工程实践

探讨 ripgrep 在大型代码仓库中的工程实现，聚焦 Rust 并行正则匹配、gitignore 集成与二进制文件检测机制，提供亚秒级搜索的参数配置与优化策略。

systems-engineering · 2025-10

2025-10-20

使用 Tauri 构建 Judo：JJ VCS 的跨平台 GUI 实现

基于 Tauri 的 Judo GUI 为 Jujutsu VCS 提供可视化操作，支持操作日志、合并差异和拖拽重基等功能，优化开发工作流。

systems-engineering · 2025-10

2025-10-20

LeRobot数据流水线：传感器融合与仿真到真实迁移的关键参数配置

解析LeRobot中多传感器时间对齐、域随机化参数与扩散策略训练的数据增强技术，提供可落地的工程化配置清单。

ai-systems · 2025-10

2025-10-20

使用 Claude 实现浏览器原生代码生成与 Web 集成

工程化 Claude 在浏览器中的代码生成与执行，支持无缝协作编辑、实时反馈和零设置开发环境。

ai-systems · 2025-10

2025-10-20

DeepSeek OCR 中的零样本布局分析：基于视觉语言提示的工程实现

利用 DeepSeek-VL 通过视觉语言提示实现零样本文档布局检测，提供工程参数和监控要点。

ai-systems · 2025-10

2025-10-20

ChkTag 硬件标签与编译器插桩：x86 内存安全的运行时检查

基于 ChkTag 规范，探讨硬件标签与编译器结合实现边界和时序内存安全，提供无开销检查的参数配置与部署策略。

ai-security · 2025-10

2025-10-20

BERT作为单步文本扩散：掩码语言建模的去噪视角

将BERT的掩码语言建模目标重新诠释为扩散模型的一个去噪步骤，实现无自回归解码的迭代文本生成精炼。

ai-systems · 2025-10

2025-10-20

Token-Efficient Edge Deployment of DeepSeek-OCR: Dynamic Resolution Cropping and Visual Encoding

探讨 DeepSeek-OCR 通过动态分辨率裁剪和视觉编码优化，实现边缘设备上的实时多语言文档扫描，包含工程参数和最佳实践。

ai-systems · 2025-10

2025-10-20

浏览器端 x86-64 汇编 playground：内联编辑与 GDB 式调试实现

探讨基于 WebAssembly 的 x86-64 模拟器构建，提供内联代码编辑、断点步进及寄存器内存检查的工程实践与参数配置。

compiler-design · 2025-10

2025-10-20

生产级RAG系统中BM25与嵌入混合检索：学习式查询扩展与端到端评估指标

探讨5M+文档RAG系统的混合检索实现，包括BM25与向量嵌入融合、学习查询扩展，以及召回/精确率权衡的评估策略，提供工程参数与监控要点。

ai-systems · 2025-10

2025-10-20

通过 Redpanda 集成优化 ClickHouse 的 OLAP 缓冲写入：批次大小、压缩与错误恢复

探讨 ClickHouse 与 Redpanda 集成的缓冲管理策略，针对流式数据管道的低延迟 OLAP 写入，提供批次大小、压缩和错误恢复的工程参数。

systems-engineering · 2025-10

2025-10-20

RAG 工程化实践：5M+ 文档摄入中的 MinHash LSH 近重复去重与语义质量过滤

基于 5M+ 文档处理经验，详解 MinHash LSH 近重复去重与语义阈值质量过滤的工程参数，确保 RAG 索引纯净高效。

ai-systems · 2025-10

2025-10-20

LLM 与计算机视觉整合：Skyvern 的自适应浏览器自动化

利用 LLM 和计算机视觉实现浏览器自动化，针对非结构化网页的动态元素检测与工作流执行，提供工程化参数与恢复机制。

ai-systems · 2025-10

2025-10-20

在 MooseStack 中实现自适应缓冲刷新策略以减少 OLAP 写放大

针对 MooseStack 的 OLAP 写操作，介绍自适应缓冲刷新策略的实现，帮助优化写放大问题，提供关键参数配置和监控要点。

systems-engineering · 2025-10

2025-10-20

使用AST工程化可执行心理状态代码模型：AI心智理论的多代理社会推理

探讨如何通过抽象语法树（AST）将推断的心理状态转化为可执行代码，实现AI代理在多代理交互中的人类般社会推理，提供工程参数和落地清单。

ai-systems · 2025-10

2025-10-20

基于 Omarchy 的 Hyprland 动态平铺配置：多监视器开发者工作流优化

利用 Omarchy 一键部署 Hyprland，配置动态平铺窗口管理、可脚本化快捷键及 Waybar 状态栏集成，实现 Arch Linux 上高效的多监视器开发环境。提供参数设置、监控要点及落地清单。

systems-engineering · 2025-10