使用 Hermes 模型部署本地 Hermes Agent:可靠工具调用与离线自治任务
利用 Hermes Agent 和 Hermes-3 模型栈,实现本地离线 LLM agent 的工具调用、函数执行与自治任务,提供 vLLM 参数、沙箱配置与监控清单。
Daily Engineering Notes
每日更新技术热点和实战干货,聚焦软件工程、系统架构与 AI 工程化实践。
利用 Hermes Agent 和 Hermes-3 模型栈,实现本地离线 LLM agent 的工具调用、函数执行与自治任务,提供 vLLM 参数、沙箱配置与监控清单。
剖析 Windows 95 UI 迭代开发流程:启发式评估、用户测试、快速原型与问题跟踪,形成现代可用性工程参数化指南。
企业级 Ruflo 平台下分布式 Claude 代理群的 RAG 管道与原生代码支持,实现自主长运行工作流的协调参数、阈值与监控清单。
基准Qwen3.5 122B/35B在消费级GPU上的本地推理性能,包括延迟、显存占用与量化策略,并与Claude Sonnet 4.5 API对比,提供部署参数。
工程化自建 Claude 中继服务,实现 Claude/OpenAI/Gemini/Droid 统一 API 接入,支持订阅池化、成本分摊与原生工具无缝集成,提供部署参数、限流阈值与监控清单。
剖析三星 Galaxy 最新 OTA 移除 ADB/fastboot 侧载选项的机制,提供 locked 设备下 payload.bin 提取、boot.img Magisk 修补及模块配置的工程参数、阈值与风险清单。
利用 Ruflo 实现分布式 Claude agent swarm 的编排,支持 RAG 增强、沙箱化工作流与实时多代理协调的企业架构参数与监控要点。
基于 SpacetimeDB 订阅机制与 Three.js 实现浏览器多人 3D 实时渲染与物理模拟,提供数据模型、连接参数与场景同步清单。
基于消费级 Ryzen AI Max+ 构建万亿参数 LLM 推理集群,详述模型分片策略、4bit 量化参数及节点间通信优化,实现低延迟本地部署。
基于 Karpathy microGPT 与 nanoGPT,详解最小 GPT 分词、训练循环及单 GPU 推理参数,提供纯 Python 快速原型参数与监控清单。
Rust xmloxide 的 SAX 流式解析优化,实现零拷贝事件驱动的高吞吐 XML 处理,内存安全替换 libxml2,支持 agent 实时工作流集成。
详解生产级近似最近邻(ANN)系统的工程实践,包括混合内存-磁盘索引、动态增删、WAL持久化和背景合并,确保高QPS、亚毫秒延迟与>95%召回率。
通过固定种子、零温度设置、结构化提示,实现可靠、可重现的 LLM 生成编程逻辑;工程参数、清单与 lint/test 强制策略。
面向生产可靠性的 LLM 代码生成,给出固定种子配置、结构化提示模板与验证循环的工程参数与监控要点。
AI 代理辅助实现的 xmloxide 项目,提供内存安全的 libxml2 替换方案,包括性能基准、C FFI 迁移与工程参数配置。
基于 awesome-llm-apps 100+ 开源示例,总结生产部署的 Agent 协调、RAG 管道、多模型路由与评估框架的关键模式、参数与清单,确保可扩展性与可靠性。
基于 liblzma 实现 XZ Utils 的多线程 LZMA2 块并行编码器,聚焦多核系统线程亲和性绑定与动态块调度策略,提供参数阈值与生产部署清单。
针对生产级近似最近邻搜索,实证对比HNSW与IVF-PQ在recall@10、QPS和内存上的表现,给出调优参数、缩放策略与评估清单。
通过 laravel-inertia-toast 库,实现 Laravel + Inertia 应用的 toast 通知,支持后端 PHP 和前端 JS 调用,提供多位置、多 toast 配置,无需页面刷新。
剖析 XZ Utils 多线程 LZMA2 压缩机制,通过块并行加速多核压缩,详解线程同步、独立字典设计及 .xz 流集成,提供参数配置与工程清单。