算法 -- 树和二叉树简介

一、树

1、什么是树?

树状图是一种数据结构,它是由 n(n>=1)个有限节点组成一个具有层次关系的集合。把它叫做“树”是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。它具有以下的特点:

每个节点有零个或多个子节点;没有父节点的节点称为根节点;每一个非根节点有且只有一个父节点;除了根节点外,每个子节点可以分为多个不相交的子树;

算法 -- 树和二叉树简介

树(tree)是包含 n(n>0)个结点的有穷集,其中:

(1)每个元素称为结点(node);

(2)有一个特定的结点被称为根结点或树根(root)。

(3)除根结点之外的其余数据元素被分为 m(m≥0)个互不相交的集合 T1,T2,……Tm-1,其中每一个集合 Ti(1<=i<=m)本身也是一棵树,被称作原树的子树(subtree)。

 

2、相关术语

  • 节点的度:一个节点含有的子树的个数称为该节点的度;
  • 叶节点或终端节点:度为 0 的节点称为叶节点;
  • 非终端节点或分支节点:度不为 0 的节点;
  • 双亲节点或父节点:若一个节点含有子节点,则这个节点称为其子节点的父节点;
  • 孩子节点或子节点:一个节点含有的子树的根节点称为该节点的子节点;
  • 兄弟节点:具有相同父节点的节点互称为兄弟节点;
  • 树的度:一棵树中,最大的节点的度称为树的度;
  • 节点的层次:从根开始定义起,根为第 1 层,根的子节点为第 2 层,以此类推;
  • 树的高度或深度:树中节点的最大层次;
  • 堂兄弟节点:双亲在同一层的节点互为堂兄弟;
  • 节点的祖先:从根到该节点所经分支上的所有节点;
  • 子孙:以某节点为根的子树中任一节点都称为该节点的子孙。
  • 森林:由 m(m>=0)棵互不相交的树的集合称为森林;

二、二叉树

1、什么是二叉树?

二叉树,就是度不差过 2 的树(节点最多有两个叉)

算法 -- 树和二叉树简介

三、两种特殊的二叉树

1、满二叉树

一个二叉树,如果每一个层的结点数都达到最大值,则这个二叉树就是满二叉树。

2、完全二叉树

叶节点只能出现在最下层和次下层,并且最下面一层的结点都集中在该层最左边的若干位置的二叉树

算法 -- 树和二叉树简介

满二叉树一定是完全二叉树,但是完全二叉树不一定是满二叉树

三、二叉树的存储方式

1、链式存储方式

a、二叉树的链式存储:将二叉树的节点定义为一个对象,节点之间通过类似链表的链接方式来连接。

b、节点定义

class BiTreeNode:
    def __init__(self,data):  #data就是传进去的节点的值
        self.data = data
        self.lchild = None
        self.rchild = None
		

c、二叉树的遍历:

I 、先(前)序遍历:访问根结点的操作发生在遍历其左右子树之前

   具体操作:若二叉树非空,则依次执行如下操作:

  • ⑴ 访问根结点;
  • ⑵ 遍历左子树;
  • ⑶ 遍历右子树。

II、中序遍历:访问根结点的操作发生在遍历其左右子树之中(间)。

     具体操作: 若二叉树非空,则依次执行如下操作:

  • ⑴遍历左子树;
  • ⑵访问根结点;
  • ⑶遍历右子树。

III、后序遍历:访问根结点的操作发生在遍历其左右子树之后。

      若二叉树非空,则依次执行如下操作:

  • ⑴遍历左子树;
  • ⑵遍历右子树;
  • ⑶访问根结点。

IV、层次遍历

用一个队列保存被访问的当前节点的左右孩子以实现层序遍历。

二叉树的遍历代码如下

from collections import deque   #双向队列
from queue import Queue    #单向队列

# import queue
# q = queue.Queue()
# q.put('ggg')
# q.get()
class BiTreeNode:
    def __init__(self,data):
        self.data = data
        self.lchild = None
        self.rchild = None

    @classmethod
    def pre_order(self,root):
        '''前序遍历(根左右)'''
        if root: #如果有根节点
            print(root.data,end='')
            self.pre_order(root.lchild)
            self.pre_order(root.rchild)

    @classmethod
    def in_order(self,root):
        '''中序遍历(左根右)'''
        if root:
            self.in_order(root.lchild)
            print(root.data,end='')
            self.in_order(root.rchild)

    @classmethod
    def out_order(self, root):
        '''后序遍历(左右根)'''
        if root:
            self.out_order(root.lchild)
            self.out_order(root.rchild)
            print(root.data, end='')

    @classmethod
    def level_order(self,root):
        '''层次遍历(第一层,第二层,第三层...借助队列来实现)'''
        queue = deque()
        queue.append(root)
        while len(queue) > 0:
            node = queue.popleft()
            print(node.data,end='')
            if node.lchild:
                queue.append(node.lchild)
            if node.rchild:
                queue.append(node.rchild)



#创建二叉树
a = BiTreeNode("A")
b = BiTreeNode("B")
c = BiTreeNode("C")
d = BiTreeNode("D")
e = BiTreeNode("E")
f = BiTreeNode("F")
g = BiTreeNode("G")
e.lchild = a
e.rchild = g
a.rchild = c
c.lchild = b
c.rchild = d
g.rchild = f
root = e

#查看前序遍历的结果
BiTreeNode.pre_order(root)   #EACBDGF
print('')
BiTreeNode.in_order(root)    #ABCDEGF
print('')
BiTreeNode.out_order(root)  #BDCAFGE
print('')
BiTreeNode.level_order(root)  #EAGCFBD

2、顺序存储方式

算法 -- 树和二叉树简介

如上图二叉树标出了元素所对应的索引,那么可以有一下结论

1、父节点和左孩子节点的编号下标有什么关系?

如果已知父亲节点为 i,那么他的左孩子节点为 2i+1

算法 -- 树和二叉树简介

2、父节点和右孩子节点的编号下标有什么关系?

算法 -- 树和二叉树简介

3、反过来知道孩子找父亲

(n-1)/2=i  # 左孩子求父节点
(n-2)/2=i  # 右孩子求父节点

四、二叉搜索树

1、定义

二叉搜索树是一棵二叉树且满足性质:设 X 是二叉树的一个节点。如果 Y 是 X 左子树的一个节点,那么 Y.key <=X.key;

如果 Y 是 X 右子树的一个节点,那么 Y.key>= X.key  (X.key 代表 X 节点对应的值)

通俗的说也就是 若它的左子树不空,则左子树上所有结点的值均小于它的根结点的值; 若它的右子树不空,则右子树上所有结点的值均大于它的根结点的值; 它的左、右子树也分别为二叉搜索树。

算法 -- 树和二叉树简介

2、原理

二叉排序树的查找过程和次优二叉树类似,通常采取二叉链表作为二叉排序树存储结构中序遍历二叉排序树可得到一个关键字的有序序列,一个无序序列可以通过构造一棵二叉排序树变成一个有序序列,构造树的过程即为对无序序列进行排序的过程。每次插入的新的结点都是二叉排序树上新的叶子结点,在进行插入操作时,不必移动其它结点,只需改动某个结点的指针,由空变为非空即可。搜索, 插入, 删除的复杂度等于树高,O(log(n)).

3、二叉搜索树的创建

可参考链接:https://visualgo.net/en/bst

4、二叉搜索树的遍历

5、二叉搜索树的查询、插入、删除

插入:

算法 -- 树和二叉树简介

删除

算法 -- 树和二叉树简介

比如要删除 65

算法 -- 树和二叉树简介

比如要删除 66

算法 -- 树和二叉树简介

代码实现:

 待续….

6、二叉搜索树存在的问题

存在的问题:当插入的是有序的时候,假如插入的数据特别多,找是能找到,但是是很花费时间的。

可以有以下解决办法:

  1、随机化的二叉搜索树(打乱顺序插入)

   2、AVL 树

查找方法有:二分查找、二叉搜索树、哈希查找、顺序查找、斐波那契查找

五、AVL 树—–扩展(了解)

1、AVL 树:AVL 树是一棵自平衡的二叉搜索树

2、AVL 树具有以下性质:  

  • 根的左右子树的高度只差的绝对值不能超过 1
  • 根的左右子树都是平衡二叉树

3、AVL 的实现方式:旋转

算法 -- 树和二叉树简介

 

六、B 树

1、B 树:B 树是一棵自平衡的多路搜索树。常用于数据库的索引
算法 -- 树和二叉树简介

七、其他

算法 -- 树和二叉树简介