首页 第 45 页

2026-03-01

使用 Hermes 模型部署本地 Hermes Agent：可靠工具调用与离线自治任务

利用 Hermes Agent 和 Hermes-3 模型栈，实现本地离线 LLM agent 的工具调用、函数执行与自治任务，提供 vLLM 参数、沙箱配置与监控清单。

ai-systems · 2026-03

2026-03-01

Windows 95 用户界面可用性工程：迭代开发实践

剖析 Windows 95 UI 迭代开发流程：启发式评估、用户测试、快速原型与问题跟踪，形成现代可用性工程参数化指南。

systems · 2026-03

2026-03-01

Ruflo 分布式 Claude 代理群 RAG 集成与代码支持编排

企业级 Ruflo 平台下分布式 Claude 代理群的 RAG 管道与原生代码支持，实现自主长运行工作流的协调参数、阈值与监控清单。

ai-systems · 2026-03

2026-03-01

消费级GPU上Qwen3.5 122B/35B对比Claude Sonnet 4.5：推理延迟、内存与量化权衡

基准Qwen3.5 122B/35B在消费级GPU上的本地推理性能，包括延迟、显存占用与量化策略，并与Claude Sonnet 4.5 API对比，提供部署参数。

mlops · 2026-03

2026-03-01

自建 Claude Relay Service：多 LLM API 池化与成本共享工程实践

工程化自建 Claude 中继服务，实现 Claude/OpenAI/Gemini/Droid 统一 API 接入，支持订阅池化、成本分摊与原生工具无缝集成，提供部署参数、限流阈值与监控清单。

mlops · 2026-03

2026-03-01

三星 Galaxy OTA 移除恢复模式侧载：boot.img 修补与 Magisk 持久化策略

剖析三星 Galaxy 最新 OTA 移除 ADB/fastboot 侧载选项的机制，提供 locked 设备下 payload.bin 提取、boot.img Magisk 修补及模块配置的工程参数、阈值与风险清单。

security · 2026-03

2026-03-01

Ruflo：Claude 多代理 Swarm 编排框架的企业级部署与实时协调实践

利用 Ruflo 实现分布式 Claude agent swarm 的编排，支持 RAG 增强、沙箱化工作流与实时多代理协调的企业架构参数与监控要点。

ai-systems · 2026-03

2026-03-01

浏览器端 Three.js 与 SpacetimeDB pub-sub 集成：多人 3D 渲染同步实践

基于 SpacetimeDB 订阅机制与 Three.js 实现浏览器多人 3D 实时渲染与物理模拟，提供数据模型、连接参数与场景同步清单。

web · 2026-03

2026-03-01

Ryzen AI Max+ 集群实现万亿参数 LLM 本地推理：分片、量化和低延迟通信

基于消费级 Ryzen AI Max+ 构建万亿参数 LLM 推理集群，详述模型分片策略、4bit 量化参数及节点间通信优化，实现低延迟本地部署。

ai-systems · 2026-03

2026-03-01

微型 GPT 从零构建：核心训练循环、分词与单 GPU 高效推理

基于 Karpathy microGPT 与 nanoGPT，详解最小 GPT 分词、训练循环及单 GPU 推理参数，提供纯 Python 快速原型参数与监控清单。

ai-systems · 2026-03

2026-03-01

Xmloxide 流式 SAX 解析器优化：高吞吐 XML 处理与 libxml2 替换

Rust xmloxide 的 SAX 流式解析优化，实现零拷贝事件驱动的高吞吐 XML 处理，内存安全替换 libxml2，支持 agent 实时工作流集成。

systems · 2026-03

2026-03-01

生产级ANN系统：混合内存-磁盘索引、动态增删与WAL持久化实践

详解生产级近似最近邻（ANN）系统的工程实践，包括混合内存-磁盘索引、动态增删、WAL持久化和背景合并，确保高QPS、亚毫秒延迟与>95%召回率。

ai-systems · 2026-03

2026-03-01

LLM 确定性编程：固定种子、温度控制与结构化提示

通过固定种子、零温度设置、结构化提示，实现可靠、可重现的 LLM 生成编程逻辑；工程参数、清单与 lint/test 强制策略。

ai-systems · 2026-03

2026-03-01

通过固定种子、结构化 CoT 和验证循环实现 LLM 代码生成的确定性重现

面向生产可靠性的 LLM 代码生成，给出固定种子配置、结构化提示模板与验证循环的工程参数与监控要点。

ai-systems · 2026-03

2026-03-01

工程化 Xmloxide：安全高效 Rust XML 解析器作为 libxml2 无缝替换

AI 代理辅助实现的 xmloxide 项目，提供内存安全的 libxml2 替换方案，包括性能基准、C FFI 迁移与工程参数配置。

systems · 2026-03

2026-02-28

生产级 LLM 应用架构模式：Agent 编排、RAG 流水线与多模型切换

基于 awesome-llm-apps 100+ 开源示例，总结生产部署的 Agent 协调、RAG 管道、多模型路由与评估框架的关键模式、参数与清单，确保可扩展性与可靠性。

ai-systems · 2026-03

2026-02-28

LZMA2 多线程块并行编码器：多核线程亲和性与块调度优化

基于 liblzma 实现 XZ Utils 的多线程 LZMA2 块并行编码器，聚焦多核系统线程亲和性绑定与动态块调度策略，提供参数阈值与生产部署清单。

systems · 2026-03

2026-02-28

生产ANN系统中HNSW与IVF-PQ索引选择：recall@10调优与QPS/内存缩放实测

针对生产级近似最近邻搜索，实证对比HNSW与IVF-PQ在recall@10、QPS和内存上的表现，给出调优参数、缩放策略与评估清单。

ai-systems · 2026-03

2026-02-28

在 Laravel Inertia 中集成 Toast 通知：支持 Vue 和 React 的 SPA 无刷新反馈

通过 laravel-inertia-toast 库，实现 Laravel + Inertia 应用的 toast 通知，支持后端 PHP 和前端 JS 调用，提供多位置、多 toast 配置，无需页面刷新。

web · 2026-03

2026-02-28

XZ Utils 中多线程 LZMA2 块并行编码器实现：线程同步、字典独立与流格式集成

剖析 XZ Utils 多线程 LZMA2 压缩机制，通过块并行加速多核压缩，详解线程同步、独立字典设计及 .xz 流集成，提供参数配置与工程清单。

systems · 2026-03

最新文章 · 第 45 页