首页 > 编程语言 > 详细

求赫夫曼编码的算法

时间:2015-03-31 22:21:03      阅读:312      评论:0      收藏:0      [点我收藏+]

求赫夫曼编码的算法

参考清华大学出版社出版的《数据结构(c语言版)》一书,在java下实现

//数据结构
class HuffmanNode{
    public int weight;//权重
    public int parent,lchild,rchild;//父节点、孩子节点在数组中的下标位置

    public HuffmanNode(int weight,int parent,int lchild,int rchild){
        this.weight = weight;
        this.parent = parent;
        this.lchild = lchild;
        this.rchild = rchild;
    }
}

    /**
     * @param str_weight_arr 存放字符权值的数组
     * @param n 字符的数量
     * @return 计算好的赫夫曼编码
     * */
    public String huffmanCoding(int[] str_weight_arr,int n){

        if(n<1 || str_weight_arr.length <n)
            return null;
        //要构造的赫夫曼树的结点数量为叶子结点数量的二倍减1
        int node_num = n*2-1;
        //创建赫夫曼树结点数组,数组大小为node_num+1,我们从下标1开始使用
        HuffmanNode[] huffmanTree = new HuffmanNode[node_num+1];
        //将str_weight_arr中的值放入前n个结点中,这前n个元素就是赫夫曼树的叶子结点
        //而剩下的元素则是属于非叶子结点的位置,也就是我们下面需要动态添加的
        for(int i=1;i<=n;i++)
            huffmanTree[i] = new HuffmanNode(str_weight_arr[i], 0, 0, 0);
        //初始化剩下的元素
        for(int i=n+1;i<=node_num;i++)
            huffmanTree[i] = new HuffmanNode(0, 0, 0, 0);

        //建立赫夫曼树,从下标为n+1的元素开始,逐个建立子树。i的孩子结点是从1到i-1之间权重最小的
        //两个结点,当遍历结束后,下标为node_num的元素就是赫夫曼树的根结点
        for(int i=n+1;i<=node_num;i++){
            //在huffmanTree中下标为1到i-1之间寻找权重最小并且没有父节点的两个元素的下标
            int[] child_arr = selectMinTwo(huffmanTree,1,i-1);
            //判断下child_arr非空
            if(child_arr == null)
                return null;

            //构造新的子树,根结点的下标为i,左右子树的位置为child_arr[0],child_arr[1]
            huffmanTree[i].lchild = child_arr[0];
            huffmanTree[i].rchild = child_arr[1];
            huffmanTree[i].weight = huffmanTree[child_arr[0]].weight
                    +huffmanTree[child_arr[1]].weight;
            huffmanTree[child_arr[0]].parent = i;
            huffmanTree[child_arr[1]].parent = i;
        }//end for

        //此时,从下标为n+1到node_num的位置上,这些非叶子结点的权重在逐渐增大。

        //接下来要生成赫夫曼编码了
        String[] huffmanCode = new String[n+1];
        //code_temp数组中的全部元素就是一个字母的赫夫曼编码
        char[] code_temp = new char[n];
        //将huffmanCode塞满,下标从1开始
        for(int i=1;i<=n;i++){
            int start = n-1;
            //我们要求的是给定的字符串的赫夫曼编码,方法传入的是和字符串中字符一一对应的权重数组
            //所以,要按照顺序,从每个结点开始,向上找,直到找到跟结点为止,用0和1记录期间的路径
            //从叶子到根逆向求编码 f==0时说明已经找到了根结点
            for(int c=1,f=huffmanTree[i].parent;f!=0;c=f,f=huffmanTree[f].parent){
                //c位置的结点不是f位置结点的左子树就是f位置结点的右子树,没得跑
                if(huffmanTree[f].lchild == c)
                    code_temp[--start] = ‘0‘;
                else
                    code_temp[--start] = ‘1‘;
            }
            //第i个字符的赫夫曼码找出来了,将code_temp数组的第start位置到最后的字符截断
            //赋值给huffmanCode[i]
            huffmanCode[i] = String.copyValueOf(code_temp, start, code_temp.length-start);
        }

        String result = "";
        for(String s:huffmanCode)
            result+=s;

        return result;

    }

    private int[] selectMinTwo(HuffmanNode[] huffmanTree,int begin,int end){
        if(begin<1 || end >huffmanTree.length)
            return null;

        int max1 = begin;
        int max2 = begin;
        int max_weight = huffmanTree[begin].weight;
        //寻找最小的权重的元素所在下标
        for(int i=begin;i<=end;i++){
            if(huffmanTree[i].weight<max_weight && huffmanTree[i].parent == 0)
                max1 = i;
        }
        //寻找第二小的权重的元素所在下标
        for(int i=begin;i<=end;i++){
            if(huffmanTree[i].weight<max_weight && huffmanTree[i].parent == 0
                    && max1 != max2)
                max2 = i;
        }

        return new int[]{max1,max2};

    }

}

求赫夫曼编码的算法

原文:http://blog.csdn.net/u012123160/article/details/44785507

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!