Daily Engineering Notes

最新文章 · 第 789 页

每日更新技术热点和实战干货，聚焦软件工程、系统架构与 AI 工程化实践。

共 16387 篇文章
分类 266 个
当前第 789 页

2025-09-14

使用自定义插件扩展 garak：模块化 LLM 红队测试管道，聚焦探测器链式与风险评分

通过自定义插件扩展 garak 工具，实现模块化 LLM 红队测试，重点介绍探测器链式连接、风险评分机制，以及与生产推理管道的集成，用于高效幻觉探测。

ai-systems · 2025-09

2025-09-14

Flash 线性注意力实现 Transformer 的 O(n) 缩放

通过高效 Triton 内核实现线性注意力，支持长序列 Transformer 的 O(n) 复杂度和子二次方计算，无需注意力掩码，提供工程化集成参数。

ai-systems · 2025-09

2025-09-14

从零实现Transformer-based LLM：PyTorch训练管道构建与优化

基于Happy-LLM项目，探讨使用PyTorch从零构建Transformer LLM的训练管道，包括tokenization、注意力机制、fine-tuning及部署优化。

ai-systems · 2025-09

2025-09-14

使用 Triton 融合线性注意力内核：长序列 Transformer 的亚二次复杂度优化

针对长序列 Transformer，利用 Triton 融合内核实现亚二次复杂度，通过重计算和分块策略最小化内存带宽。

ai-systems · 2025-09

2025-09-14

Go 中使用 gRPC 实现双向流式 RPC：负载均衡与截止时间传播

基于 HTTP/2 和 Protocol Buffers，在 Go 中实现 gRPC 双向流式 RPC，聚焦于微服务的负载均衡和截止时间传播，提供工程化参数和示例代码。

systems-engineering · 2025-09

2025-09-14

使用 Lexy 在 C++17 中实现可组合解析器组合子，用于领域特定语言：强调语义错误恢复与模块化语法定义

本文指导如何利用 Lexy 库构建模块化 DSL 解析器，聚焦组合子设计、语义错误恢复机制及工程化参数配置。

compiler-design · 2025-09

2025-09-14

RDNA4中实现双发射波前执行：并行ALU/SIMD操作与AI张量核心优化

RDNA4 GPU的双发射波前执行机制，支持wave32/64灵活调度，优化AI张量核心性能，减少开销。

systems-engineering · 2025-09

2025-09-14

在 Ripple 中实现高效的虚拟 DOM Diffing 和 Reconciliation

面向高性能 UI 更新，给出 Ripple 中虚拟 DOM diffing 与 reconciliation 的 TypeScript 实现参数与优化要点。

application-security · 2025-09

2025-09-14

使用 Gleam 和 BEAM 运行时实现容错 Web API：Erlang/Elixir 互操作与监督树

基于 Gleam 的类型安全特性，在 BEAM VM 上构建可扩展并发 Web 服务，通过 Erlang/Elixir 互操作和监督树实现容错，提供工程化参数与最佳实践。

systems-engineering · 2025-09

2025-09-14

使用 GPG 加密文本文件实现分层密码存储，并通过 Git 同步实现安全离线多设备访问

pass 密码管理器利用 GPG 加密文件构建层次化存储，支持 Git 同步，实现无需中心服务器的多设备安全访问。

ai-security · 2025-09

2025-09-14

在 RDNA4 GPU 中实现双发行波前执行以提升计算吞吐量

RDNA4 GPU 引入双发行波前执行机制，通过并行 ALU 操作和优化指令调度显著提升计算吞吐量。本文提供工程化实现参数、优化清单及监控要点，帮助开发者落地高效 GPU 计算。

systems-engineering · 2025-09

2025-09-14

TypeScript 中高效虚拟 DOM 差异计算与协调实现：面向高性能响应式 UI

基于 Ripple 框架理念，在 TypeScript 中实现虚拟 DOM 差异算法与协调过程，支持细粒度响应式更新，减少不必要重渲染。

application-security · 2025-09

2025-09-14

用 Rust 构建高性能 PHP 执行引擎：JIT 编译、零开销 ABI 桥接与遗留扩展无缝加载

探讨利用 Rust 实现高性能 PHP 执行引擎，聚焦 JIT 编译、零开销 ABI 桥接以及遗留 PHP 生态的扩展加载策略，提供工程化参数与落地清单。

compiler-design · 2025-09

2025-09-14

Java 25 异步 CPU 时间剖析器实现：结合 JFR 事件与火焰图识别并发瓶颈

利用 Java 25 的低开销 CPU 时间剖析器，通过 JFR 事件实现线程级 CPU 测量，并集成火焰图可视化，针对并发应用中的异步瓶颈提供参数配置与监控清单。

systems-optimization · 2025-09

2025-09-14

使用 ReVanced 实现 Android 应用的模块化字节码修补

通过 ReVanced 的模块化字节码修补技术，为 Android 应用添加自定义功能，如去除广告和 UI 调整，涉及 smali 操作和钩子集成。

systems-engineering · 2025-09

2025-09-14

SigNoz 查询构建器中实现 OR 逻辑：性能权衡与用户偏好 raw SQL 的洞察

探讨 SigNoz 查询构建器添加 OR 逻辑的工程挑战，分析用户转向 raw SQL 的原因，并提出混合 UI 设计以实现无缝回退，提升复杂过滤查询的可用性。

systems-engineering · 2025-09

2025-09-14

Safe C++ 提案中止后：在现有 C++ 代码库中使用 AddressSanitizer 实现运行时边界检查和别名控制

Safe C++ 提案中止后，探讨如何在遗留 C++ 系统中集成 AddressSanitizer 等工具，实现运行时边界检查和别名控制，提升内存安全。

compiler-design · 2025-09

2025-09-14

将 garak 集成到 CI/CD 管道中：自动化 LLM 红队测试与风险评分

在 LLM 模型部署流程中集成 garak，实现探针链式执行与自定义检测器，自动化漏洞扫描与连续红队评估。

ai-systems · 2025-09

2025-09-14

Integrate Multiple LLMs in Genkit Flows for Composable AI Apps

Explore integrating multiple LLMs using Genkit's flow-based orchestration, with JS/Go/Python support, tracing for debugging, and practical model switching strategies.

ai-systems · 2025-09

2025-09-14

在高吞吐管道中集成 simdjson 实现每秒吉字节级 JSON 解析：利用 AVX2 内部函数进行结构索引与错误恢复

面向高吞吐 JSON 管道，给出 simdjson 集成与 AVX2 优化的工程化参数与监控要点。

systems-engineering · 2025-09