算术编码（Arithmetic coding）的实现

时间：2019-11-02 23:39:08 阅读：196 评论：0 收藏：0 [点我收藏+]

算术编码例题：

假设信源信号有{A, B, C, D}四个，他们的概率分别为{0.1， 0.4， 0.2， 0.3}，如果我们要对CADACDB这个信号进行编码，那么应该怎样进行呢？

技术分享图片

准备工作完成之后，我们便可以开始进行编码了。
那么我们首先读入信号：C——因为C在最初始的间隔中是[0.5, 0.7)，所以读入C之后我们的编码间隔就变成[0.5, 0.7)了；
紧接着，我们读入的是A，A在初始区间内是占整个区间的前10%，因此对应这个上来也是需要占这个编码间隔的前10%，因此编码区间变为：[0.5, 0.52)了；
再然后是D，因为D占整个区间的70% ~ 100%，所以也是占用这个编码区间的70% ~ 100%，操作后的编码区间为[0.514, 0.52)
……
直到最后将信号量全部读出。

最后，我们将这个操作过程绘制成为一张表：
技术分享图片

解码例题：

假设信源信号有{A, B, C, D}四个，他们的概率分别为{0.1， 0.4， 0.2， 0.3}，当我们得到的编码是0.5143876的时候，问原始的信号串（7位）是怎样的？

技术分享图片

准备工作完成之后，我们现在开始解码：
我们发现，待解码的数据0.5143876在[0.5, 0.7)内，因此，我们解出的第一个码值为C
同理，我们继续计算0.5143876处于[0.5, 0.7)的第一个10%内因此解出的第二个码值为A
……
这个过程持续直到执行七次全部执行完为止。

那么以上的过程我们同样可以列表表示：
技术分享图片

作业：对任一概率序列，实现算术编码，码长不少于16位，不能固定概率，语言自选。

基于Python实现：

from collections import Counter  #统计列表出现次数最多的元素
import numpy as np

print("Enter a Sequence\n")
inputstr = input()
print  (inputstr + "\n")

res = Counter(inputstr) #统计输入的每个字符的个数,res是一个字典类型
print (str(res))
# print(res)
#sortlist = sorted(res.iteritems(), lambda x, y : cmp(x[1], y[1]), reverse = True)
#print sortlist

M = len(res)
#print (M)
N = 5
A = np.zeros((M,5),dtype=object)  #生成M行5列全0矩阵

#A = [[0 for i in range(N)] for j in range(M)]

reskeys = list(res.keys())      #取字典res的键
resvalue = list(res.values())   #取字典res的值
totalsum = sum(resvalue)        #输入一共有几个字符

# Creating Table

A[M-1][3] = 0
for i in range(M):
   A[i][0] = reskeys[i]      #第一列是res的键
   A[i][1] = resvalue[i]     #第二列是res的值
   A[i][2] = ((resvalue[i]*1.0)/totalsum)    #第三列是每个字符出现的概率
i=0
A[M-1][4] = A[M-1][2]
while i < M-1:                    #第五列是累积概率
   A[M-i-2][4] = A[M-i-1][4] + A[M-i-2][2]
   A[M-i-2][3] = A[M-i-1][4]
   i+=1
print (A)

# Encoding

print("\n------- ENCODING -------\n" )
strlist = list(inputstr)
LEnco = []
UEnco = []
LEnco.append(0)
UEnco.append(1)

for i in range(len(strlist)):
    result = np.where(A == reskeys[reskeys.index(strlist[i])])
    addtollist = (LEnco[i] + (UEnco[i] - LEnco[i])*float(A[result[0],3]))
    addtoulist = (LEnco[i] + (UEnco[i] - LEnco[i])*float(A[result[0],4]))

    LEnco.append(addtollist)
    UEnco.append(addtoulist)

    tag = (LEnco[-1] + UEnco[-1])/2.0

LEnco.insert(0, " Lower Range")
UEnco.insert(0, "Upper Range")
print(np.transpose(np.array(([LEnco],[UEnco]),dtype=object)))
print("\nThe Tag is \n ")
print(tag)

# Decoding

print("\n------- DECODING -------\n" )
ltag = 0
utag = 1
decodedSeq = []
for i in range(len(inputstr)):
    numDeco = ((tag - ltag)*1.0)/(utag - ltag)
    for i in range(M):
        if (float(A[i,3]) < numDeco < float(A[i,4])):

            decodedSeq.append(str(A[i,0]))
            ltag = float(A[i,3])
            utag = float(A[i,4])
            tag = numDeco

print("The decoded Sequence is \n ")
print("".join(decodedSeq))

arithmetic_coding Code

参考：

例题https://blog.csdn.net/qq_36752072/article/details/77986159

代码https://github.com/nishanpoojary/Arithmetic-Coding

算术编码（Arithmetic coding）的实现

原文：https://www.cnblogs.com/HuangYJ/p/11779608.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)