redis源码分析之集群之的槽的分配算法crc16原理分析

crc系列的算法,哈希算法

Posted by chensong on 2020-09-27 22::22::24

=====================================================

redis源码学习系列文章:

redis源码分析之sha1算法分析

redis源码分析之字典源码分析

redis源码分析之内存编码分析intset, ziplist编码分析

redis源码分析之跳跃表

redis源码分析之内存淘汰策略的原理分析

redis源码分析之对象系统源码分析string, list链表,hash哈希,set集合,zset有序集合

redis源码分析之异步进程保存数据rdb文件和aof文件源码分析

redis源码之sentinel高可用架构分析

redis源码分析之集群之一的槽的分配算法crc16原理分析

=====================================================

在我的github上会持续更新Redis代码的中文分析,地址送出https://github.com/chensongpoixs/credis_source,共同学习进步

前言

redis中为什么单线程效率怎么高呢, 其中很大一部分是redis使用哈希算法查询的效率都O(1), 今天我们来分析我们redis中集群使用crc16这种哈希算法呢,而不使用正常redis使用siphash,MurmurHash64A这个两个哈希算法呢

正文

一, 聊一聊 哈希算法

哈希算法有分为大致的两种一种是不开破解的,另外一种就可破解

不可破解也不是绝对的相对一些简单是可以破解的

不可破解: md5, sha1等等

可以破解:siphash, MurmurHash64A,crc 的系列等等

正常md5,sha1是用来加密使用, 一个因为他们是很难被破解的,还有他们每次计算都对CPU的消化非常比siphash和MurmurHash64A的时间长,

想siphash和MurmurHash64A哈希算法是用来作为线性分布的一个是线性分布非常均匀性,满射性,确定性, 快速性

而我们本文章主要分析是crc16算法, 也是线性分布的一个是线性分布非常均匀性,满射性,确定性, 而且哈希碰撞比siphash和MurmurHash64A还要小很多, 就是有一个缺点是和md5,sha1算法一样对CPU占用的时间非常长,这就redis为什么集群使用这个crc16算法。

二, crc系列的算法

crc是正常用于网络层差错检测使用的

这就有crc8,crc16,crc32,crc64一些标准

CRC编码的基本思想是:将二进制位串的操作被解释为多项式算法运算。

二进制数据可以看作是一个k-1 次多项式的系数列表,该多项式共有k项,从x^(k-1)到x^0。这样的多项式被认为是k-1阶多项式。高次(左边)位是x^(k-1)项的系数,接下来的位是x(k-2)项的系数,以此类推。例如: 100101有6位,因此代表了一个有6项的多项式,其系数分别是1、0、0、1、0和1, 即1x^5 + 0x^4 + 0x^3 + 1x^2 + 0x^1 + 1x^0 == x^5 + x^2 + 1。

CRC-8 x8+x5+x4+1 0x31(0x131)

CRC-8 x8+x2+x1+1 0x07(0x107)

CRC-8 x8+x6+x4+x3+x2+x1 0x5E(0x15E)

三, crc16的表的生成

crc16

 * Name                       : "XMODEM", also known as "ZMODEM", "CRC-16/ACORN"
 * Width                      : 16 bit
 * Poly                       : 1021 (That is actually x^16 + x^12 + x^5 + 1)  ==>Poly_src 1 0001 0000 0010 0001 
 * Initialization             : 0000
 * Reflect Input byte         : False
 * Reflect Output CRC         : False
 * Xor constant to output CRC : 0000
 * Output for "123456789"     : 31C3

对应poly = 1 0001 0000 0010 0001

举例编码串是 0001, 多项式是 1 0001 0000 0010 0001

0001向左16位-> crc1-> 0001 0000 0000 0000 0000 0000

计算

先和编码串crc1 前16位进行或操作

   1 0000 0000 0000 0000 0000
^  1 0001 0000 0010 0001
   0 0001 0000 0010 0001 

得到 1 0000 0010 0001 -> 把后面4个bit添加得到crc2 -> 1 0000 0010 0001 0000

crc2就是对应表中1下标0x1021的值

现在由于crc2bit小于16就结束了如果不小于16就接着前16位进行或操作

下面是生成 crc16的表的生成的程序


static const uint16_t crc16tab[256]= {
    0x0000,0x1021 /*0001 0000 0010 0001*/,0x2042 /*0010 0000 0100 0010*/,0x3063 /*0011 0000 0110 0011*/,0x4084 /*100000010000100*/,0x50a5/*101000010100101*/,0x60c6 /*110000011000110*/,0x70e7/*111000011100111*/,
    0x8108,0x9129,0xa14a,0xb16b,0xc18c,0xd1ad,0xe1ce,0xf1ef,
    0x1231,0x0210,0x3273,0x2252,0x52b5,0x4294,0x72f7,0x62d6,
    0x9339,0x8318,0xb37b,0xa35a,0xd3bd /*1101001110111101*/,0xc39c,0xf3ff,0xe3de,
    0x2462,0x3443,0x0420,0x1401,0x64e6,0x74c7,0x44a4,0x5485,
    0xa56a,0xb54b,0x8528,0x9509,0xe5ee,0xf5cf,0xc5ac,0xd58d,
    0x3653,0x2672,0x1611,0x0630,0x76d7,0x66f6,0x5695,0x46b4,
    0xb75b,0xa77a,0x9719,0x8738,0xf7df,0xe7fe,0xd79d,0xc7bc,
    0x48c4,0x58e5,0x6886,0x78a7,0x0840,0x1861,0x2802,0x3823,
    0xc9cc,0xd9ed,0xe98e,0xf9af,0x8948,0x9969,0xa90a,0xb92b,
    0x5af5,0x4ad4,0x7ab7,0x6a96,0x1a71,0x0a50,0x3a33,0x2a12,
    0xdbfd,0xcbdc,0xfbbf,0xeb9e,0x9b79,0x8b58,0xbb3b,0xab1a,
    0x6ca6,0x7c87,0x4ce4,0x5cc5,0x2c22,0x3c03,0x0c60,0x1c41,
    0xedae,0xfd8f,0xcdec,0xddcd,0xad2a,0xbd0b,0x8d68,0x9d49,
    0x7e97,0x6eb6,0x5ed5,0x4ef4,0x3e13,0x2e32,0x1e51,0x0e70,
    0xff9f,0xefbe,0xdfdd,0xcffc,0xbf1b,0xaf3a,0x9f59,0x8f78,
    0x9188,0x81a9,0xb1ca,0xa1eb,0xd10c,0xc12d,0xf14e,0xe16f,
    0x1080,0x00a1,0x30c2,0x20e3,0x5004,0x4025,0x7046,0x6067,
    0x83b9,0x9398,0xa3fb,0xb3da,0xc33d,0xd31c,0xe37f,0xf35e,
    0x02b1,0x1290,0x22f3,0x32d2,0x4235,0x5214,0x6277,0x7256,
    0xb5ea,0xa5cb,0x95a8,0x8589,0xf56e,0xe54f,0xd52c,0xc50d,
    0x34e2,0x24c3,0x14a0,0x0481,0x7466,0x6447,0x5424,0x4405,
    0xa7db,0xb7fa,0x8799,0x97b8,0xe75f,0xf77e,0xc71d,0xd73c,
    0x26d3,0x36f2,0x0691,0x16b0,0x6657,0x7676,0x4615,0x5634,
    0xd94c,0xc96d,0xf90e,0xe92f,0x99c8,0x89e9,0xb98a,0xa9ab,
    0x5844,0x4865,0x7806,0x6827,0x18c0,0x08e1,0x3882,0x28a3,
    0xcb7d,0xdb5c,0xeb3f,0xfb1e,0x8bf9,0x9bd8,0xabbb,0xbb9a,
    0x4a75,0x5a54,0x6a37,0x7a16,0x0af1,0x1ad0,0x2ab3,0x3a92,
    0xfd2e,0xed0f,0xdd6c,0xcd4d,0xbdaa,0xad8b,0x9de8,0x8dc9,
    0x7c26,0x6c07,0x5c64,0x4c45,0x3ca2,0x2c83,0x1ce0,0x0cc1,
    0xef1f,0xff3e,0xcf5d,0xdf7c,0xaf9b,0xbfba,0x8fd9,0x9ff8,
    0x6e17,0x7e36,0x4e55,0x5e74,0x2e93,0x3eb2,0x0ed1 /*1110 1101 0001*/,0x1ef0 /*1 1110 1111 0000*/
};
/**
 *获取value二进制的位数
 */
int byte_size(unsigned int value)
{
	int byte = 0;
	if (value == 0)
	{
		return byte;
	}
	
	while (value >>= 1)
	{
		++byte;
	}
	return byte;
}
void show_crc16_table()
{

    int i = 0;
	
	int poly = 0X11021;//
	

	//start of calculating the CRC8 table
	for (i = 0;i < 256; ++i) 
    {
		table[i] = i;
	}
	FILE * fp = NULL;
	fp = fopen("crc16_table.txt", "w+");
	if (!fp)
	{
        printf("not open file !!!\n");
		return -1;
	}
	
	for (i = 0;i < 256; ++i) 
	{
		
		// 把下标的数向左移动16位
		unsigned int table1 = table[i] << 16;
		int byte = byte_size(table1);
		while (byte > 15)
		{
			byte = byte_size(table1);
			//fprintf(fp, "table1 = %u, byte = %u\n", table1, byte);
			if (byte > 15)
			{  //进行差错计算 [x^16 + x^12 + x^5 + 1]
				table1 = ((((table1 >> (byte - 16)) ) ^ poly) &0XFFFF)<< (byte - 16);
			}
			byte = byte_size(table1);
		}
		table[i] = table1 ;
		
	}

	for (i = 0; i < 256; ++i) // 256
	{
        if (i % 10)
        {
            fprintf(fp, "table[%u]=0x%.2x\n", i, table[i]);
            printf( "table[%u]=0x%.2x\n", i, table[i]);
	
        }
        else 
        {
           fprintf(fp, "table[%u]=0x%.2x\n", i, table[i]);
            printf( "table[%u]=0x%.2x\n", i, table[i]); 
        }
    }	
	if (fp)
    {
        fclose(fp);
        fp = NULL;
    }
}
int main(int argc, char **argv)
{
   show_crc16_table();
    return 0;
}

四,crc系列

几种CRC16计算公式、初始值、标志位等参数汇总

一、CRC16/IBM 或 CRC16/ARC 或 CRC16/LHA:

公式:x16+x15+x2+1

宽度:16

Poly值:0x8005

初始值:0x0000

基准输入:true

基准输出:true

标志位:0x0000

二、CRC16/MAXIM:

公式:x16+x15+x2+1

宽度:16

Poly值:0x8005

初始值:0x0000

基准输入:true

基准输出:true

标志位:0xFFFF

三、CRC16/USB:

公式:x16+x15+x2+1

宽度:16

Poly值:0x8005

初始值:0xFFFF

基准输入:true

基准输出:true

标志位:0xFFFF

四、CRC16/MODBUS(最常见):

公式:x16+x15+x2+1

宽度:16

Poly值:0x8005

初始值:0x0000

基准输入:true

基准输出:true

标志位:0x0000

五、CRC16/CCITT 或 CRC-CCITT 或CRC16/CCITT-TRUE或 CRC16/KERMIT:

公式:x16+x15+x5+1

宽度:16

Poly值:0x1021

初始值:0x0000

基准输入:true

基准输出:true

标志位:0x0000

六、 CRC16/CCITT-FALSE:

公式:x16+x15+x5+1

宽度:16

Poly值:0x1021

初始值:0xFFFF

基准输入:false

基准输出:false

标志位:0x0000

七、CRC16/X25:

公式:x16+x15+x5+1

宽度:16

Poly值:0x1021

初始值:0x0000

基准输入:true

基准输出:true

标志位:0xFFFF

八、CRC16/XMODEM 或 CRC16/ZMODEM 或 CRC16/ACORN:

公式:x16+x15+x5+1

宽度:16

Poly值:0x1021

初始值:0x0000

基准输入:false

基准输出:false

标志位:0x0000

九、CRC16/DNP:

公式:x16+x13+x12+x11+x10+x8+x6+x5+x2+1

宽度:16

Poly值:0x3D65

初始值:0x0000

基准输入:true

基准输出:true

标志位:0xFFFF

使用:M-Bus, ect

附加其它:

一、CRC4/ITU:

公式:x4+x+1

宽度:4

Poly值:0x03

初始值:0x00

基准输入:true

基准输出:true

标志位:0x00

二、CRC5/EPC:

公式:x5+x3+1

宽度:5

Poly值:0x09

初始值:0x09

基准输入:false

基准输出:false

标志位:0x00

三、CRC5/ITU:

公式:x5+x4+x2+1

宽度:5

Poly值:0x15

初始值:0x00

基准输入:true

基准输出:true

标志位:0x00

四、CRC5/USB:

公式:x5+x2+1

宽度:5

Poly值:0x05

初始值:0x1F

基准输入:true

基准输出:true

标志位:0x1F

四、CRC6/ITU:

公式:x6+x+1

宽度:6

Poly值:0x03

初始值:0x00

基准输入:true

基准输出:true

标志位:0x00

五、CRC6/MMC:

公式:x7+x3+1

宽度:7

Poly值:0x09

初始值:0x00

基准输入:false

基准输出:false

标志位:0x00

使用:MutiMediaCard,SD卡, ect

六、CRC-8:

公式:x8+x2+x+1

宽度:8

Poly值:0x07

初始值:0x00

基准输入:false

基准输出:false

标志位:0x00

七、CRC8/ITU:

公式:x8+x2+x+1

宽度:8

Poly值:0x07

初始值:0x00

基准输入:false

基准输出:false

标志位:0x55

八、CRC-8:

公式:x8+x2+x+1

宽度:8

Poly值:0x07

初始值:0x00

基准输入:false

基准输出:false

标志位:0x00

九、CRC8/ROHC:

公式:x8+x2+x+1

宽度:8

Poly值:0x07

初始值:0xFF

基准输入:true

基准输出:true

标志位:0x00

九、CRC8/ROHC 或 DOW-CRC:

公式:x8+x5+x4+1
   
宽度:8

Poly值:0x31

初始值:0x00

基准输入:true

基准输出:true

标志位:0x00

源码地址

结语