当前位置：首页 > 行业动态 > 正文

btree索引的存储结构

admin
行业动态
2025-04-10
4

在数据库系统中,B树索引（Balanced Tree Index）是高效管理数据检索的核心技术之一，它的存储结构设计巧妙，能够在海量数据中快速定位目标记录，以下从底层实现到应用场景展开说明，帮助读者深入理解其工作原理。

核心结构：平衡的多层分支

B树的每个节点由键值（Key）和指针（Pointer）组成，键值用于排序，指针指向子节点或实际数据，一个存储用户ID的B树节点可能包含键值[100, 300, 500]，将数据划分为<100、100-300、300-500和>500四个区间，每个区间对应一个子节点。

节点容量由阶数（Order）决定，假设阶数为m，则：

btree索引的存储结构第1张

根节点至少包含1个键值（除非树为空）；
非叶子节点最多有m-1个键值和m个子节点；
所有叶子节点位于同一层,保证树的平衡性。

数据存储的物理实现

磁盘页对齐
B树的节点大小通常与磁盘页（如4KB）匹配，减少I/O次数，MySQL的InnoDB引擎中，每个节点存储16KB的数据块，与SSD/HDD的读写单元对齐。
指针类型差异

非叶子节点：指针指向其他B树节点，形成层级导航。
叶子节点：指针直接指向数据行（聚簇索引）或聚簇索引键（非聚簇索引）。

顺序访问优化
叶子节点通过双向链表连接，支持高效的范围查询（如WHERE id BETWEEN 200 AND 400），这种设计在B+树中更为典型，但B树也可能根据实现变种调整。

关键优势与适用场景

平衡性保证效率
增删数据时，B树通过节点分裂（Split）与合并（Merge）自动维持高度平衡，确保查询复杂度稳定为O(log n)，10亿条数据仅需约30次磁盘访问（假设阶数500）。
适合随机读写
机械硬盘（HDD）的随机寻道时间较长，B树通过减少树的高度（与二叉树对比）显著降低访问次数，二叉树可能需要20层访问，而B树仅需3层。
应用局限性