正在载入交互式动画窗口请稍等

哈夫曼树-顺序存储 可视化交互式动画版

图码-数据结构可视化动画版

哈夫曼(霍夫曼)编码是一种无损数据压缩算法。 这个想法是为输入字符分配可变长度代码,所分配代码的长度基于相应字符的频率。 
分配给输入字符的可变长度代码是 前缀代码 ,意味着代码(位序列)的分配方式使得分配给一个字符的代码不是分配给任何其他字符的代码的前缀。 这就是哈夫曼(霍夫曼)编码如何确保在解码生成的比特流时不存在歧义。 
让我们通过一个反例来理解前缀码。 假设有四个字符a、b、c和d,它们对应的可变长度代码是00、01、0和1。这种编码会导致歧义,因为分配给c的代码是分配给a和b的代码的前缀。 如果压缩比特流是0001,则解压缩输出可以是“cccd”或“ccb”或“acd”或“ab”。 有关哈夫曼(霍夫曼)编码的应用, 
请参阅 此内容。
哈夫曼(霍夫曼)编码主要有两大部分

  1. 从输入字符构建哈夫曼(霍夫曼)树。
  2. 遍历哈夫曼树并为字符分配代码。

算法:

用于构造最优前缀码的方法称为 哈夫曼(霍夫曼)编码

 该算法以自下而上的方式构建一棵树。 我们可以用 T来表示这棵树

让|c| 是叶子的数量

|c| -1 是合并节点所需的操作数。 Q是构建二叉堆时可以使用的优先级队列。

哈夫曼(霍夫曼)算法(三)
{
n=|c|

Q = c
对于 i<-1 到 n-1

{

temp <- 获取节点 ()

左 (temp) Get_min (Q) 右 [temp] 获取 Min (Q)

a = 左 [templ b = 右 [temp]

F [温度]<- f[a] + [b]

插入(Q,温度)

}

返回 Get_min(0)
}

构建哈夫曼(霍夫曼)树的步骤
输入是一组唯一字符及其出现频率,输出是哈夫曼(霍夫曼)树。 

  1. 为每个唯一字符创建一个叶子节点,并构建所有叶子节点的最小堆(最小堆用作优先级队列。频率字段的值用于比较最小堆中的两个节点。最初,最不频繁的字符位于根)
  2. 从最小堆中提取频率最小的两个节点。
     
  3. 创建一个新的内部节点,其频率等于两个节点频率之和。 将第一个提取的节点作为其左子节点,将另一个提取的节点作为其右子节点。 将此节点添加到最小堆中。
  4. 重复步骤#2 和#3,直到堆仅包含一个节点。 剩下的节点就是根节点,树就完整了。
    让我们通过一个例子来理解该算法:
字符频率
5
乙9
丙12
d 13
电子16
f 45

步骤 1. 构建一个包含 6 个节点的最小堆,其中每个节点代表具有单个节点的树的根。
步骤2 从最小堆中提取两个最小频率节点。 添加频率为 5 + 9 = 14 的新内部节点。 
 

现在最小堆包含 5 个节点,其中 4 个节点是具有单个元素的树的根,一个堆节点是具有 3 个元素的树的根

字符频率
丙12
d 13
内部节点 14
电子16
f 45

步骤3: 从堆中提取两个最小频率节点。 添加频率为 12 + 13 = 25 的新内部节点
 

步骤3图示

步骤3图示

现在最小堆包含 4 个节点,其中 2 个节点是具有单个元素的树的根,两个堆节点是具有多个节点的树的根

字符频率
内部节点 14
电子16
内部节点25
f 45

步骤4: 提取两个最小频率节点。 添加频率为 14 + 16 = 30 的新内部节点
 

步骤4图示

步骤4图示

现在最小堆包含 3 个节点。

字符频率
内部节点25
内部节点30
f 45

步骤5: 提取两个最小频率节点。 添加频率为 25 + 30 = 55 的新内部节点
 

步骤5图示

步骤5图示

现在最小堆包含 2 个节点。

字符频率
f 45
内部节点 55

步骤6: 提取两个最小频率节点。 添加频率为 45 + 55 = 100 的新内部节点
 

第6步图示

第6步图示

现在最小堆只包含一个节点。

字符频率
内部节点100

由于堆只包含一个节点,因此算法到此为止。

从哈夫曼树打印代码的步骤:
从根开始遍历形成的树。 维持一个辅助阵。 移动到左孩子时,将 0 写入数组。 移动到右子节点时,将 1 写入数组。 当遇到叶节点时打印数组。
 

从 HuffmanTree 打印代码的步骤

从 HuffmanTree 打印代码的步骤

代码如下:

字符码字
f 0
约100
d 101
1100
乙1101
电子111

下面是上述方法的实现: 

C

// C program for Huffman Coding
#include <stdio.h>
#include <stdlib.h>
  
// This constant can be avoided by explicitly
// calculating height of Huffman Tree
#define MAX_TREE_HT 100
  
// A Huffman tree node
struct MinHeapNode {
  
    // One of the input characters
    char data;
  
    // Frequency of the character
    unsigned freq;
  
    // Left and right child of this node
    struct MinHeapNode *left, *right;
};
  
// A Min Heap:  Collection of
// min-heap (or Huffman tree) nodes
struct MinHeap {
  
    // Current size of min heap
    unsigned size;
  
    // capacity of min heap
    unsigned capacity;
  
    // Array of minheap node pointers
    struct MinHeapNode** array;
};
  
// A utility function allocate a new
// min heap node with given character
// and frequency of the character
struct MinHeapNode* newNode(char data, unsigned freq)
{
    struct MinHeapNode* temp = (struct MinHeapNode*)malloc(
        sizeof(struct MinHeapNode));
  
    temp->left = temp->right = NULL;
    temp->data = data;
    temp->freq = freq;
  
    return temp;
}
  
// A utility function to create
// a min heap of given capacity
struct MinHeap* createMinHeap(unsigned capacity)
  
{
  
    struct MinHeap* minHeap
        = (struct MinHeap*)malloc(sizeof(struct MinHeap));
  
    // current size is 0
    minHeap->size = 0;
  
    minHeap->capacity = capacity;
  
    minHeap->array = (struct MinHeapNode**)malloc(
        minHeap->capacity * sizeof(struct MinHeapNode*));
    return minHeap;
}
  
// A utility function to
// swap two min heap nodes
void swapMinHeapNode(struct MinHeapNode** a,
                     struct MinHeapNode** b)
  
{
  
    struct MinHeapNode* t = *a;
    *a = *b;
    *b = t;
}
  
// The standard minHeapify function.
void minHeapify(struct MinHeap* minHeap, int idx)
  
{
  
    int smallest = idx;
    int left = 2 * idx + 1;
    int right = 2 * idx + 2;
  
    if (left < minHeap->size
        && minHeap->array[left]->freq
               < minHeap->array[smallest]->freq)
        smallest = left;
  
    if (right < minHeap->size
        && minHeap->array[right]->freq
               < minHeap->array[smallest]->freq)
        smallest = right;
  
    if (smallest != idx) {
        swapMinHeapNode(&minHeap->array[smallest],
                        &minHeap->array[idx]);
        minHeapify(minHeap, smallest);
    }
}
  
// A utility function to check
// if size of heap is 1 or not
int isSizeOne(struct MinHeap* minHeap)
{
  
    return (minHeap->size == 1);
}
  
// A standard function to extract
// minimum value node from heap
struct MinHeapNode* extractMin(struct MinHeap* minHeap)
  
{
  
    struct MinHeapNode* temp = minHeap->array[0];
    minHeap->array[0] = minHeap->array[minHeap->size - 1];
  
    --minHeap->size;
    minHeapify(minHeap, 0);
  
    return temp;
}
  
// A utility function to insert
// a new node to Min Heap
void insertMinHeap(struct MinHeap* minHeap,
                   struct MinHeapNode* minHeapNode)
  
{
  
    ++minHeap->size;
    int i = minHeap->size - 1;
  
    while (i
           && minHeapNode->freq
                  < minHeap->array[(i - 1) / 2]->freq) {
  
        minHeap->array[i] = minHeap->array[(i - 1) / 2];
        i = (i - 1) / 2;
    }
  
    minHeap->array[i] = minHeapNode;
}
  
// A standard function to build min heap
void buildMinHeap(struct MinHeap* minHeap)
  
{
  
    int n = minHeap->size - 1;
    int i;
  
    for (i = (n - 1) / 2; i >= 0; --i)
        minHeapify(minHeap, i);
}
  
// A utility function to print an array of size n
void printArr(int arr[], int n)
{
    int i;
    for (i = 0; i < n; ++i)
        printf("%d", arr[i]);
  
    printf("\n");
}
  
// Utility function to check if this node is leaf
int isLeaf(struct MinHeapNode* root)
  
{
  
    return !(root->left) && !(root->right);
}
  
// Creates a min heap of capacity
// equal to size and inserts all character of
// data[] in min heap. Initially size of
// min heap is equal to capacity
struct MinHeap* createAndBuildMinHeap(char data[],
                                      int freq[], int size)
  
{
  
    struct MinHeap* minHeap = createMinHeap(size);
  
    for (int i = 0; i < size; ++i)
        minHeap->array[i] = newNode(data[i], freq[i]);
  
    minHeap->size = size;
    buildMinHeap(minHeap);
  
    return minHeap;
}
  
// The main function that builds Huffman tree
struct MinHeapNode* buildHuffmanTree(char data[],
                                     int freq[], int size)
  
{
    struct MinHeapNode *left, *right, *top;
  
    // Step 1: Create a min heap of capacity
    // equal to size.  Initially, there are
    // modes equal to size.
    struct MinHeap* minHeap
        = createAndBuildMinHeap(data, freq, size);
  
    // Iterate while size of heap doesn't become 1
    while (!isSizeOne(minHeap)) {
  
        // Step 2: Extract the two minimum
        // freq items from min heap
        left = extractMin(minHeap);
        right = extractMin(minHeap);
  
        // Step 3:  Create a new internal
        // node with frequency equal to the
        // sum of the two nodes frequencies.
        // Make the two extracted node as
        // left and right children of this new node.
        // Add this node to the min heap
        // '$' is a special value for internal nodes, not
        // used
        top = newNode('$', left->freq + right->freq);
  
        top->left = left;
        top->right = right;
  
        insertMinHeap(minHeap, top);
    }
  
    // Step 4: The remaining node is the
    // root node and the tree is complete.
    return extractMin(minHeap);
}
  
// Prints huffman codes from the root of Huffman Tree.
// It uses arr[] to store codes
void printCodes(struct MinHeapNode* root, int arr[],
                int top)
  
{
  
    // Assign 0 to left edge and recur
    if (root->left) {
  
        arr[top] = 0;
        printCodes(root->left, arr, top + 1);
    }
  
    // Assign 1 to right edge and recur
    if (root->right) {
  
        arr[top] = 1;
        printCodes(root->right, arr, top + 1);
    }
  
    // If this is a leaf node, then
    // it contains one of the input
    // characters, print the character
    // and its code from arr[]
    if (isLeaf(root)) {
  
        printf("%c: ", root->data);
        printArr(arr, top);
    }
}
  
// The main function that builds a
// Huffman Tree and print codes by traversing
// the built Huffman Tree
void HuffmanCodes(char data[], int freq[], int size)
  
{
    // Construct Huffman Tree
    struct MinHeapNode* root
        = buildHuffmanTree(data, freq, size);
  
    // Print Huffman codes using
    // the Huffman tree built above
    int arr[MAX_TREE_HT], top = 0;
  
    printCodes(root, arr, top);
}
  
// Driver code
int main()
{
  
    char arr[] = { 'a', 'b', 'c', 'd', 'e', 'f' };
    int freq[] = { 5, 9, 12, 13, 16, 45 };
  
    int size = sizeof(arr) / sizeof(arr[0]);
  
    HuffmanCodes(arr, freq, size);
  
    return 0;
}


            

C++

C++

Java

Python3

Javascript

C#

输出

频率:0
丙:100
日:101
答:1100
乙:1101
电子:111

时间复杂度: O(nlogn),其中 n 是唯一字符的数量。 如果有 n 个节点,则 extractMin() 被调用 2*(n – 1) 次。 extractMin() 在调用 minHeapify() 时需要 O(logn) 时间。 因此,总体复杂度为 O(nlogn)。
如果输入数组已排序,则存在线性时间算法。 我们很快就会在下一篇文章中讨论这个问题。

空间复杂度:- O(N)

哈夫曼(霍夫曼)编码的应用:

  1. 它们用于传输传真和文本。
  2. 它们被 PKZIP、GZIP 等传统压缩格式使用。
  3. JPEG、PNG 和 MP3 等多媒体编解码器使用哈夫曼(霍夫曼)编码(更准确地说是前缀代码)。

 它在存在一系列频繁出现的字符的情况下非常有用。

参考:
http: //en.wikipedia.org/wiki/Huffman_coding
本文由 Aashish Barnwal 编译,并由 图码 团队审核。 如果您发现任何不正确的内容,或者您​​想分享有关上述主题的更多信息,请发表评论。 


无论你的目标是考试成功、职业发展,还是纯粹的兴趣,这个数据结构和算法可视化的网站都会是一个无价的资源。

前往这个网站,开始你的学习之旅吧!

这些是常见的:【C语言描述】《数据结构和算法》数据结构JAVA实现 数据结构与算法基础(青岛大学-王卓)数据结构与算法王道数据结构c语言实现 速成数据结构期末考前救急 数据结构视频C语言版教程 数据结构严蔚敏 数据结构郝斌 数据结构考研 JAVA数据结构算法与基础 数据结构王道 2022数据结构学习 数据结构小甲鱼 王卓 学习数据结构 数据结构浙江大学 数据结构复习 数据结构马士兵 数据结构零基础教程 数据结构和算法 数据结构入门 考研数据结构习题讲解 数据结构期末复习 计算机二级