Java-B树

时间：2023-07-09

B树可视演示

https://www.cs.usfca.edu/~galles/visualization/BTree.html

B树介绍

为啥要有b树,我们想想,我们之前学过或者使用过的二叉树红黑树…这些数据结构,发现一个问题就是在数据量很大的时候那么我们树的高度是非常高的,在我们日常生活中存储数据最常见的外存就是磁盘。
而磁盘是快设备，也就是说磁盘的读写单位是以块为单位，一般地块大小从0.5k到4k。
即使你只读取一个字节，磁盘也是将包含该字节的所有数据读取到硬盘中。而在磁盘读取过程中，最占用时间的是磁盘的寻道，也就是磁头在盘片上找到需要读取的块所在位置的时间，而在盘片上顺序读取数据的所花的时间是占比比较小的。而要减少外存上花的时间，就可以从减少读盘次数以及减少寻道时间着手,B树采取的方法就是，就充分的利用盘块的空间，在一个盘块中尽可能多的存储信息，或者在连续的盘块地址上存储尽可能多的信息。在数据结构上的变化就是每个节点存储多个key信息以及包含多个子节点。增加节点的分支树，就可以使得这棵树的高度降低

假设: 是5阶B树那么高度为3的B树可以存3^5-1=242 如果是11阶呢? 3^11-1=177146 以此类推…
那么对比二叉树呢? 我们拿满二叉树来举例,如果高度为3的满二叉树那么能存多少值呢?:2^3-1=7
总结: 在同样高度的情况下B树,是比二叉树存储数据多得多,这样就加快了磁盘寻道的速度了.

这里解释一下B-树就是B树

B树的原理

(x是节点, x.key表示节点的值 ,n表示阶或者长度)

x中key满足：x.key1 <= x.key2<= x.key3 <= ...、<= x.keyn。也就是x中的key以有序排列的

每个节点都包含指向x.n + 1个孩子节点的引用。

x的key将孩子节点区分开,计算公式如下

this.degree = degree; //计算分割下标 this.ceil = (int) Math.ceil((double) degree / 2) - 1; //然后根据这个位置的值,小的放左,大的放右......具体细节下面会讲

所有的叶子节点都是在同一层

每个节点拥有的key以及孩子的数量有约束，设: n> x>=2 2为最小,最大不能超过n阶

每个节点的孩子总是比key的个数多1(叶子节点除外)

如果x=4的B树称为2-3-4树，因为可以有最多4个孩子,最少2个key。(想了解的可以自行百度)

B树基本操作 B树节点的构建需要存储值的数组需要存储子节点的数组插入若是叶子节点，则在适当的位置插入需要插入的key若是在某个节点内部，需要检查该节点是否已满，若满则进行该子树的分裂，然后再将插入操作传递到适当的节点中(这会导致父-祖-…节点也满的情况需要使用递归来反向判断如果满了就向上继续分裂)。若是插入根节,而根节点满了那么,进行根节点分裂,然后则生成一个新的根节点

反正一句话,无论什么时候插入都是在叶子节点

删除

这个比插入还麻烦,但是只要把条件写好也能行,很多人都不愿意写删除操作,而使用删除标记代替也行,看个人

必须遵守的规则: 保证删除叶子节点key个数必须是大于等于Math.ceil(m/2)-1

删除步骤

如果是叶子节点那么直接删除就行如果是非叶子节点那么找当前节点的(前驱或者后继)叶子节点替换删除节点就行

前驱: 取叶子节点最大值
后驱: 取叶子节点最小值
选择一种就行,我使用的是前驱

反正一句话,无论什么时候删除都是在叶子节点

有人就会说删除后如果叶子节点key的个数小于Math.ceil(m/2)-1,那么不就不满足b树的最小key的个数吗?
我就默默的回答一句话,在叶子节点的话这个细节是可以忽略的,因为下次插入的时候会补上的因为只要满足key=阶级-1才会进行分裂

有人就又问了,能在删除过程解决这个小小的细节吗?
答案: 能,但是太复杂了, 需要设计到节点的重构,每个情况重构方法都不同,最差一直重构到root节点,就拿各种情况而言至少5种以上我就简单举例说明下:

删除节点的左节点大于Math.ceil(m/2)-1 那么借用左节点的key 进行右旋删除节点的右节点大于Math.ceil(m/2)-1 那么借用右节点的key 进行左旋删除节点的左右节点都不满足条件,那么看删除节点的父节点是否大于Math.ceil(m/2)-1,那么借用父节点的key,然后合并子节点的(左邻或者右舍)…在往上说就更复杂了需要跨大的节点去借查找

B树的查找和二叉树查找类似，首先在当前节点中查找，如果没有并且存在孩子节点，就递归的到可能存在该key的孩子节点中查找。
不同的是，B树节点有多个key，需要每个都比较，如果key的个数很多的话(key>1000),为了提高性能,可以使用二分法加速节点中的查找。

修改

在查询的基础上,修改内容就行,这是比较简单的

实例代码

package com.tree.btree;import com.tree.binarytree.Node;import org.springframework.util.Assert;import java.lang.reflect.Field;import java.util.*;public class BTree { private final int degree; private BTreeNode root; private final int ceil; //分割值 //初始化阶级 public BTree(int degree) { //阶不能小于2 if (degree < 2) { throw new IllegalArgumentException("degree mustn't < 2"); } this.degree = degree; this.ceil = (int) Math.ceil((double) degree / 2) - 1; //计算分割下标 } class BTreeNode { private int keySiez;//keys 从1开始计算 private Object[] keys; //存储key (这个key我们可以设计一个key,value形式的对象,利用反射) private int sonNodeSize;//nodeSize 从1开始计算 private BTreeNode[] sonbTreeNodes; //存储全部子节点 private BTreeNode parent; //存储父节点,这样便于操作 private String sign; //标记,用于特殊方面... public BTreeNode() { //设置最大key的长度(degree-1) ,要多预留一个用于交互(degree) this.keys = new Object[degree]; //设置子节点最大长度(degree) ,要多预留一个用于交互(degree+1) this.sonbTreeNodes = new BTreeNode[degree + 1]; } private int getKeyLength() { return keySiez; } //判断节点的key是否满了 private boolean getKeyFull() { return keySiez == degree; } private int getSonNodeSize() { return sonNodeSize; } private void setSonbTreeNodes(BTreeNode[] bTreeNode, Integer index) { if (index == null) { for (BTreeNode nBTreeNode : bTreeNode) { sonbTreeNodes[sonNodeSize] = nBTreeNode; sonNodeSize++; } return; } for (BTreeNode nBTreeNode : bTreeNode) { sonbTreeNodes[index] = nBTreeNode; index++; sonNodeSize++; } } private void setSonbTreeNode(BTreeNode bTreeNode) { sonbTreeNodes[sonNodeSize] = bTreeNode; sonNodeSize++; } private synchronized void setKey(n key) { //如果是空的那么直接插入 if (keys[0] == null) { keys[0] = key; keySiez++; return; } //进行从小到大插入值 //1.先获取插入的位置 Integer location = null; long newKeyId = getClassId(key); for (int i = 0; i < getKeyLength(); i++) { long OldKeyId = getClassId(keys[i]); //拿到插入的下标 if (OldKeyId > newKeyId) { location = i; break; } } if (location == null) { //表示已经查询到最后了也没有比他大的值了那么直接就插入到最后null位置 keys[getKeyLength()] = key; keySiez++; return; } //从下标以后的值往后移动 moveArrayKey(keys, getKeyLength(), location, 1); //将值插入到指定位置 keys[location] = key; //当前值的个数加一 keySiez++; } //分裂成2份返回中间值 private Map bTreeNodeSplit(BTreeNode parent) { Map map = new HashMap<>(); map.put("center", keys[ceil]); BTreeNode bTreeNode1 = new BTreeNode(); //值的分割,中间值不要 for (int i = 0; i < ceil; i++) { bTreeNode1.setKey((n) keys[i]); } BTreeNode bTreeNode2 = new BTreeNode(); for (int i = ceil + 1; i < getKeyLength(); i++) { bTreeNode2.setKey((n) keys[i]); } //将子节点的引用分配给分割后的节点,并且调整父节点引用 if (getSonNodeSize() > 0) { //满足分割条件,子节点>0 那么一定是 key+1的个数 for (int i = 0; i <= ceil; i++) { if (sonbTreeNodes[i] != null) { bTreeNode1.setSonbTreeNode(sonbTreeNodes[i]); sonbTreeNodes[i].parent = bTreeNode1; } } for (int i = ceil + 1; i < getSonNodeSize(); i++) { if (sonbTreeNodes[i] != null) { bTreeNode2.setSonbTreeNode(sonbTreeNodes[i]); sonbTreeNodes[i].parent = bTreeNode2; } } } BTreeNode[] sonbTreeNodes = new BTreeNode[2]; sonbTreeNodes[0] = bTreeNode1; sonbTreeNodes[1] = bTreeNode2; map.put("sonbTreeNodes", sonbTreeNodes); //添加新节点的父节点 bTreeNode1.parent = parent; bTreeNode2.parent = parent; //移动节点位置(一般分裂都是2),清除原来旧节点,然后空出需要插入节点的位置,返回新插入起始下标 Integer integer = moveNode(parent, this, 2); map.put("fromIdnex", integer); return map; } private Integer moveNode(BTreeNode parent, BTreeNode delNode, int size) { if (parent.getKeyLength() <= 0) { return null; } Integer index = null; int sonNodeSize = parent.getSonNodeSize(); for (int i = 0; i < sonNodeSize; i++) { //找到当前节点的下标 if (parent.sonbTreeNodes[i] == delNode) { index = i; } } //将下标后的所有值往后移动,移动size位 if (index == sonNodeSize - 1) { //如果是最后一位那么直接置空就行,然后返回起始位置 parent.sonbTreeNodes[parent.sonNodeSize - 1] = null; } else { parent.sonbTreeNodes[index] = null; moveArrayNode(parent.sonbTreeNodes, sonNodeSize, index, size); } //返回起始位置 parent.sonNodeSize--; return index; } @Override public String toString() { return "BTreeNode{" + "keySiez=" + keySiez + ", keys=" + Arrays.toString(keys) + ", nodeSize=" + sonNodeSize + ", sonbTreeNodes=" + Arrays.toString(sonbTreeNodes) + '}'; } } //插入逻辑 public void add(T data) throws Exception { //如果root为空那么创建新的节点 if (root == null) { BTreeNode newNode = new BTreeNode(); insert(newNode, data); root = newNode; return; } //root节点key,没有插入满,并且还没有子节点,那么继续插入 if (!root.getKeyFull() && root.getSonNodeSize() == 0) { insert(root, data); return; } //此刻root的key已经满了那么进行分裂节点 if (root.getSonNodeSize() == 0) { nodeSplit(root); } //如果root节点的子节点不为空那么,一直深入到叶子节点 //找到对应的叶子节点 BTreeNode tbTreeNode = selectLeaf(data); long newKey = getClassId(data); //拿到插值的索引 int keyLength = tbTreeNode.getKeyLength(); for (int i = 0; i < keyLength; i++) { long oldKey = getClassId(tbTreeNode.keys[i]);//节点对应的索引 //如果发现当前的值存在了,那么直接提示报错,不然这样会影响树的结构,(如果需要插入重复存在的数据,可以使用链表来关联起来) if (oldKey == newKey) { throw new Exception("repetition data , keyID: " + newKey); } } //将值插入找到的叶子节点 insert(tbTreeNode, data); } //删除逻辑 public boolean del(T data) { Map node1 = getNode(data); if (node1 == null) { return false; } BTreeNode node = (BTreeNode) node1.get("node"); //拿到叶子节点 int delIndex = (int) node1.get("index"); // 到这一步已经找到需要操作的节点,和要删除这个节点那个值的下标了 //如果删除的值是在叶子节点中 delLeaf(node, delIndex); //删除的值不是叶子节点,那么需要进行复杂的操作,进行前驱或者后驱到叶子节点取值覆盖删除的key delPrecursorOrSucceed(node, delIndex); return true; } private void delPrecursorOrSucceed(BTreeNode node, int delIndex) { if (node.getSonNodeSize() > 0) { //前驱,delIndex-1 节点下的最大子节点一直到叶子节点,然后取叶子节点的最大值 BTreeNode sonbTreeNode = node.sonbTreeNodes[delIndex]; while (sonbTreeNode.getSonNodeSize() > 0) { sonbTreeNode = sonbTreeNode.sonbTreeNodes[sonbTreeNode.getSonNodeSize() - 1]; } //拿到前驱最大叶子节点的最大key node.keys[delIndex] = sonbTreeNode.keys[sonbTreeNode.getKeyLength() - 1]; delArrayKey(sonbTreeNode, sonbTreeNode.getKeyLength() - 1); } } private void delLeaf(BTreeNode node, int delIndex) { //如果是叶子节点 if (node.getSonNodeSize() == 0) { delArrayKey(node, delIndex); } } //数组删除-后覆盖删除位置 private void delArrayKey(BTreeNode node, int delIndex) { int keyLength1 = node.getKeyLength(); if (keyLength1 < 1) { node.keys[delIndex] = null; } else { //将后面的值覆盖删除的值 for (int i = delIndex; i < keyLength1; i++) { node.keys[i] = node.keys[i + 1]; } } node.keySiez--; } private void moveArrayNode(BTreeNode[] array, int arrayLength, int moveindex, int size) { for (int i = arrayLength - 1; i >= moveindex; i--) { //把当前值放入,数组后i+size位置 array[i + size - 1] = array[i]; } } private void moveArrayKey(Object[] array, int arrayLength, int moveindex, int size) { //从下标以后的值往后移动(包括下标) for (int i = arrayLength - 1; i >= moveindex; i--) { array[i + size] = array[i]; } } //查询指定值 public T getData(T data) { Map node = getNode(data); if (node==null) { return null; } BTreeNode node1 = (BTreeNode) node.get("node"); Object o = node1.keys[(int) node.get("index")]; return ( T)o; } //修改指定值 public boolean getUpdate(T oldData,T newData) { Map node = getNode(oldData); if (node==null) { return false; } BTreeNode node1 = (BTreeNode) node.get("node"); node1.keys[(int) node.get("index")]=newData; return true; } private Map getNode(T data) { BTreeNode node = root; //拿到叶子节点 long newKey = getClassId(data); //拿到索引 while (node.getSonNodeSize() > 0) { int keyLength = node.getKeyLength(); //找比插入值大的下标,那么就是所对应的子节点下标,如果没找到那么就是最后一个子节点,然后继续深入 Integer max = null; int state = 0; for (int i = 0; i < keyLength; i++) { long oldKey = getClassId(node.keys[i]);//节点对应的索引 //找到值了,返回节点 if (oldKey == newKey) { state = 1; break; } if (oldKey > newKey) { max = i; break; } } //找到了 if (state == 1) { break; } //没找到那么取最后一个子节点 if (max == null) { max = node.getSonNodeSize() - 1; } node = node.sonbTreeNodes[max]; } //遍历找到的节点,或者叶子节点,找到对应的值的下标 Integer index = null; int keyLength = node.getKeyLength(); for (int i = 0; i < keyLength; i++) { long oldKey = getClassId(node.keys[i]);//节点对应的索引 //找到值了,返回节点 if (oldKey == newKey) { index = i; break; } } if (index == null) { return null; } Map map = new HashMap<>(); map.put("node", node); map.put("index", index); return map; } //查询叶子节点逻辑 private BTreeNode selectLeaf(T data) { BTreeNode node = root; //拿到叶子节点 long newKey = getClassId(data); //拿到索引 while (node.getSonNodeSize() > 0) { int keyLength = node.getKeyLength(); //找比插入值大的下标,那么就是所对应的子节点下标,如果没找到那么就是最后一个子节点,然后继续深入 Integer max = null; for (int i = 0; i < keyLength; i++) { long oldKey = getClassId(node.keys[i]);//节点对应的索引 if (oldKey > newKey) { max = i; break; } } //没找到那么取最后一个子节点 if (max == null) { max = node.getSonNodeSize() - 1; } node = node.sonbTreeNodes[max]; } return node; } private void insert(BTreeNode node, T data) { //先插入值,然后在进行判断key是否满了,如果满了那么进行分割 node.setKey(data); //插入不进去了满了 if (node.getKeyFull()) { //进行分割节点 nodeSplit(node); } } //节点分割 private void nodeSplit(BTreeNode bTreeNode) { //判断是否是root节点 if (bTreeNode == root) { //如果是root节点那么就创建新节点代替root节点然后将原来的root节点进行分割,之后进行关联父节点 BTreeNode newRootNode = new BTreeNode(); Map map = bTreeNode.bTreeNodeSplit(newRootNode); //添加节点值 newRootNode.setKey((T) map.get("center")); //添加分裂后的子节点 newRootNode.setSonbTreeNodes((BTreeNode[]) map.get("sonbTreeNodes"), (Integer) map.get("fromIdnex")); //将新节点代替原来的root节点 root = newRootNode; } else { BTreeNode oldNode = bTreeNode; //获取当前节点 //一直向上查找,直到key不满为止 while (oldNode.getKeyFull()) { if (oldNode == root) { //如果是root节点的话,就使用root节点的分割方式 nodeSplit(oldNode); break; } else { //子节点分割 Map map = oldNode.bTreeNodeSplit(oldNode.parent); //给父节点,添加节点值 oldNode.parent.setKey((T) map.get("center")); //添加分裂后的子节点,到父节点 oldNode.parent.setSonbTreeNodes((BTreeNode[]) map.get("sonbTreeNodes"), (Integer) map.get("fromIdnex")); //然后继续向上查找 oldNode = oldNode.parent; } } } } //通过反射拿到对象内的id值 ,(不允许字符串类型 ,只能是数值类型,或者对象类型里有id字段)// long OldKeyId = getClassId(o);// long newKeyId = getClassId(key); private long getClassId(Object o) { if (o instanceof Number) { Number data = (Number) (o); return data.longValue(); } long l = 0L; try { Class<?> aClass = o.getClass(); Field field = aClass.getDeclaredField("id"); field.setAccessible(true); l = (long) field.get(o); } catch (NoSuchFieldException | IllegalAccessException e) { e.printStackTrace(); } return l; } public void show() { //给节点打标 BTreeNode node = root; while (node.getSonNodeSize() > 0) { node.sonbTreeNodes[0].sign = "Front"; node = node.sonbTreeNodes[0]; } node = root; while (node.getSonNodeSize() > 0) { node.sonbTreeNodes[node.getSonNodeSize() - 1].sign = "Ent"; node = node.sonbTreeNodes[node.getSonNodeSize() - 1]; } //变量节点,以树形式展示 Queue> queue = new linkedList>(); queue.offer(root); while (!queue.isEmpty()) { BTreeNode tree = queue.poll(); if (tree == root) { System.out.print("front------------------------------------"); } //一层一层打印节点 if ("Front".equals(tree.sign)) { System.out.print("front------------------------------------"); } System.out.print("|t"); for (int i = 0; i < tree.getKeyLength(); i++) { long classId = getClassId(tree.keys[i]); System.out.print(classId + ","); } System.out.print("t|-"); if ("Ent".equals(tree.sign)) { System.out.println("------------------------------------Ent"); } if (tree == root) { System.out.println("------------------------------------Ent"); } for (int i = 0; i < tree.getSonNodeSize(); i++) { queue.offer(tree.sonbTreeNodes[i]); } } }}

点赞 -收藏-关注-便于以后复习和收到最新内容有其他问题在评论区讨论-或者私信我-收到会在第一时间回复如有侵权，请私信联系我感谢,配合,希望我的努力对你有帮助^_^

上一篇：dubbo容错策略

下一篇：Devtools与单元测试