哥伦布编码

简介: 哥伦布编码解码UINT GetUeValue(BYTE *pBuff, UINT nLen, UINT &nStartBit){    //计算0bit的个数    UINT nZeroNum = 0;    while (nStartB...
哥伦布编码解码
UINT GetUeValue(BYTE *pBuff, UINT nLen, UINT &nStartBit)
{
    //计算0bit的个数
    UINT nZeroNum = 0;
    while (nStartBit < nLen * 8)
    {
        if (pBuff[nStartBit / 8] & (0x80 >> (nStartBit % 8)))
        {
            break;
        }
        nZeroNum++;
        nStartBit++;
    }
    nStartBit ++;


    //计算结果
    DWORD dwRet = 0;
    for (UINT i=0; i<nZeroNum; i++)
    {
        dwRet <<= 1;
        if (pBuff[nStartBit / 8] & (0x80 >> (nStartBit % 8)))
        {
            dwRet += 1;
        }
        nStartBit++;
    }
    return (1 << nZeroNum) - 1 + dwRet;
}






1. H.264/AVC标准规定了一系列编码方法,用于把符号编码成二进制比特流。这些方法包括:
FLC (定长码)
ExpG (指数哥伦布码)
CAVLC
CABAC


位于Slice data级别之上的符号,使用FLC或ExpG编码。


2. ExpG依据变字长编码理论。在变字长编码中,编码器的编码输出码字是长度不等的码字。大概率出现的信息符号,赋以短字长的码字;小概率出现的信息符号,赋以长字长的码字。


ExpG码字的二进制结构如下:
[前导零][1][INFO]
码字包含M个前导零(M>=0),
        bit 1,
        M-bit信息域INFO。


根据输入的参数code_num,ExpG码的编码过程是:
M = floor(log2(code_num + 1))
INFO = code_num + 1 - 2^M


相应的,解码过程是:
(1) 读取一系列连续的bit 0直到bit 1,记录bit 0的个数(M),
(2) 读取bit 1
(3) 读取M-bit = INFO
(4) code_num = 2^M + INFO - 1


由此,ExpG的码字长度是2M+1比特。


3. 映射
H.264的语法参数k通过4种方式映射为code_num,然后对code_num使用ExpG编码,生成二进制码字。
4种映射方式:
ue 无符号直接映射,code_num = k
te 截断映射
se 有符号映射,code_num = 2|k| (k<=0)
               code_num = 2|k| - 1 (k>0)
me 根据标准中指定的表


4. ExpG解码的实现与优化
以FFMpeg中的get_ue_golomb()函数为例,ExpG的解码算法的优化既考虑运算量又考虑存储空间。
(1) 根据当前二进制ExpG码的比特地址index,读取n-bit的二进制数据到32-bit buf。
buf = swap32(*(uint32_t *)((uint8_t *)bit_stream + (index>>3))) << (index&0x07)
swap32()的作用是在按32位读取bit stream时,处理大尾数、小尾数的转换。


--------------------------
| index%8 | buf的有效位n |
--------------------------
| 0       | 32-bit       |
--------------------------
| 1       | 31-bit       |
--------------------------
| 2       | 30-bit       |
--------------------------
| 3       | 29-bit       |
--------------------------
| 4       | 28-bit       |
--------------------------
| 5       | 27-bit       |
--------------------------
| 6       | 26-bit       |
--------------------------
| 7       | 25-bit       |
--------------------------


例如,当index%8=7时,buf的[31,6]位是有效的。


(2) 通过查表与计算相结合的方法,确定ExpG的码长,再进行解码。
(2.1) FFMpeg的实现方法是对码长不超过9-bit的ExpG码字制作查找表,如下:
当(buf >= 1<<27),取buf的最高9位,
ExpG码 00001xxxx,码长9-bit,解码结果为[15,30];
ExpG码 0001xxxnn,码长7-bit,解码结果为[7,14],n表示不属于该ExpG码的bit;
ExpG码 001xxnnnn,码长5-bit,解码结果为[3,6],n表示不属于该ExpG码的bit;
ExpG码 01xnnnnnn,码长3-bit,解码结果为[1,2],n表示不属于该ExpG码的bit;
ExpG码 1nnnnnnnn,码长1-bit,解码结果为0,n表示不属于该ExpG码的bit。


查找表为
index = [16,31]   ~ codeword_length = 9 ~ code_num = [15,30]
index = [32,63]   ~ codeword_length = 7 ~ code_num = [7,14]
index = [64,127]  ~ codeword_length = 5 ~ code_num = [3,6]
index = [128,255] ~ codeword_length = 3 ~ code_num = [1,2]
index = [256,511] ~ codeword_length = 1 ~ code_num = 0


(2.2) 对于码长大于9-bit的ExpG码,
(a) 算出bit 1的位置x
(b) ExpG码长 = 2*(31-x) + 1
(c) ExpG码 = buf >> 32 - (2*(31-x)+1) = buf >> (2*x - 31)
(d) code_num = ExpG码 - 1


当读入buf的有效位是25-bit时,FFMpeg的ExpG解码优化算法能表示的最大值为8190。
相关文章
|
7月前
|
JavaScript 数据安全/隐私保护
41 # 编码的问题
41 # 编码的问题
33 0
|
6月前
|
存储 数据库
编码集的作用是什么?常见的编码集有什么?为什么常用utf-8?
编码集的作用是什么?常见的编码集有什么?为什么常用utf-8?
35 0
|
17天前
|
机器学习/深度学习 人工智能 自然语言处理
编码和解码的未来之路
编码和解码的未来之路
|
10月前
|
存储 Java 数据安全/隐私保护
什么是编码和解码
什么是编码和解码
206 0
|
JavaScript
编码
编码
68 0
数制与编码
十进制整数转换为二进制数 可以将十进制数逐次用2除,取余数,一直到商为0.然后把全部余数按相反的次序排列起来。(除二取余)
256 0
数制与编码
|
存储 算法 Java
【字符编码】字符编码 && Base64编码算法
  在前面的解决乱码的一文中,只找到了解决办法,但是没有为什么,说白了,就是对编码还是不是太熟悉,编码问题是一个很简单的问题,计算机从业人员应该也必须弄清楚,基于编码的应用有Base64加密算法,然后,这个问题一直放着,想找个机会解决。于是乎,终于逮到机会,开始下手。
178 0
【字符编码】字符编码 && Base64编码算法
|
机器学习/深度学习 算法 索引
关于Onehot编码的总结
关于Onehot编码的总结
536 0
关于Onehot编码的总结