Forth 数组实现深度解析：内存布局、CREATE-DOES> 与 DO-LOOP 边界机制

在 Forth 语言的简洁语法背后，隐藏着一套精炼的内存管理哲学。与主流语言将数组视为独立抽象不同，Forth 把数组直接实现为字典中的连续数据区域，这种设计既保留了底层控制能力，又避免了额外的运行时开销。本文从内存布局、定义词模式、循环结构三个维度，系统解析 Forth 数组的实现机制。

字典中的线性天地：数组的内存布局

Forth 字典是程序的根基，每定义一个词（word），系统就在字典中分配一段连续的内存空间。数组本质上就是一个带有预定长度的参数域（parameter field）的词。执行 CREATE 命令时，Forth 会为新词创建头部信息，包括名称字段和代码字段，随后将参数域的起始地址留在栈顶供后续操作使用。

以创建一个包含 10 个单元的数组为例：

CREATE A  10 CELLS ALLOT

这条语句的执行流程如下：首先 CREATE A 在字典中为词 A 分配头部，参数域起始地址由 HERE 记录；接着 10 CELLS ALLOT 从当前位置向前移动 10 个单元的字节数，为数组预留存储空间。此时字典的内存布局从低地址到高地址依次为：名称字段（存储字符串 "A" 及其属性标志）、代码字段（指向该词的执行代码）、参数域（A [0] 到 A [9] 共 10 个单元）。

执行词 A 时，它会将参数域首地址放在栈上，这意味着：

A .    \ 打印 A[0] 的地址

这种设计将数组的起始地址与索引计算分离，程序员需要自行完成偏移量计算：

: A[]  ( i -- addr )  CELLS A + ;

这种看似原始的机制，实则给予了开发者对内存布局的完全控制权 —— 你可以精确知道每个元素位于哪个地址，没有任何隐藏的边界检查或动态分配开销。

定义词的构建术：CREATE 与 DOES> 的协同

Forth 语言的强大之处在于其元编程能力。CREATE ... DOES> 模式允许程序员定义全新的数据结构类型，这是一种在编译时生成代码、在运行时执行自定义行为的双阶段机制。在数组上下文中，这个模式用于创建可复用的数组定义词。

一个典型的数组定义词实现如下：

: ARRAY:  ( n -- )
  CREATE
    CELLS ALLOT
  DOES>  ( i -- addr )
    SWAP CELLS + ;

使用方式变为：

10 ARRAY: FOO    \ 创建包含 10 个单元的数组 FOO
5 FOO           \ 返回 FOO[5] 的地址

这里的双阶段行为清晰可辨：CREATE 部分在定义时执行，负责分配参数域空间；DOES> 部分在每次调用时执行，负责计算索引地址。每个通过 ARRAY: 创建的数组都拥有独立的参数域，但共享同一套索引计算逻辑。

从内存角度看，每个实例词都保持独立的词头结构和参数域。以 10 ARRAY: BAR 为例，生成的内存布局包含：BAR 的名称字段、代码字段（指向 DOES> 运行时逻辑），以及紧跟其后的 10 个单元的参数域。多个数组实例之间完全隔离，各自占据字典中的不同区域。

这种模式的精妙之处在于其极简主义：无需额外的类型系统，词本身就是类型的载体；无需虚函数表，DOES> 直接嵌入代码字段的运行时部分。

循环边界的底层逻辑：DO-LOOP 的实现与约束

Forth 的 DO ... LOOP 结构提供了一种高效的低层循环机制，但其语义与常见语言存在关键差异：它基于半开区间设计，循环变量的取值范围是 [start, limit)，即从起始值递增到极限值减一。

对于语句：

limit start DO  ...  LOOP

运行时的执行步骤如下：DO 将起始值和极限值压入循环控制栈（通常基于返回栈实现），保存循环体起始地址；每次执行 LOOP 时，循环计数器加一并与极限值比较，只有当计数器仍小于极限值时才继续循环。这意味着：

10 0 DO  I .  LOOP

会依次打印 0 到 9，共执行 10 次。

关于边界检查，必须明确一个核心事实：Forth 标准不提供任何自动的数组边界检查机制。DO-LOOP 执行的唯一检查是循环终止条件 —— 即计数器是否已达到极限值，这与数组安全毫无关联。程序员必须自行确保循环变量的取值范围与数组维度匹配。

以下代码在理论上是安全的：

CREATE A  100 CELLS ALLOT
100 0 DO
  I CELLS A + @ .
LOOP

因为循环变量 I 的取值范围是 0 到 99，正好覆盖数组 A 的所有有效索引。但若写成：

200 0 DO
  I CELLS A + @ .
LOOP

Forth 不会抛出任何错误，程序会访问 A [100] 到 A [199]，这些地址上可能是未定义的数据或其他词的内容，后果完全不可预知。

对于更复杂的 +LOOP，终止条件涉及符号感知的边界穿越检测：当循环变量跨越极限值边界时退出。许多实现通过巧妙的算术技巧（如预计算偏移量、利用有符号整数溢出检测）用单一测试同时处理正向和反向增量，但这仍然不涉及数组边界验证。

若需在应用层实现边界保护，典型做法是在索引访问前显式检查：

: SAFE-ACCESS  ( i addr len -- addr|0 )
  OVER < IF  \ 如果索引 >= 长度
    DROP DROP 0
  ELSE
    CELLS + @
  THEN ;

或者在定义数组时将长度信息编码进数据结构中，供运行时查询验证。

工程实践参数与设计考量

在生产级 Forth 代码中使用数组时，以下参数和实践值得参考：

单元大小：使用 CELLS 而不是直接使用字节数，确保代码在不同架构（32 位 / 64 位）间可移植。1 CELLS 在 32 位系统上等于 4 字节，在 64 位系统上等于 8 字节。

内存对齐：CREATE 分配的参数域通常已按单元对齐，但若需要在数组中存储多精度数据，可能需要显式对齐处理。

字典增长方向：大多数 Forth 实现中字典向高地址增长，这意味着数组参数域地址大于词头地址，索引计算公式为 base + i * cell-size。

循环变量的生命周期：I、J、K 等循环变量只在循环体内有效，它们实际上是从返回栈上读取的当前循环状态，嵌套循环时需特别注意栈平衡。

性能权衡：Forth 数组访问的零边界检查特性是一把双刃剑 —— 它消除了运行时开销，但也意味着内存错误的风险完全由程序员承担。在安全关键的嵌入式场景中，建议在抽象层加入显式检查，而对性能敏感的实时系统，则可利用这种底层能力获得确定性的执行时间。

资料来源：Forth 标准组织文档、Stack Overflow 社区讨论、FORTH, Inc. 技术文档。