基礎(chǔ)
1byte = 8bit (1字節(jié)等于8比特)

MySQL數(shù)據(jù)庫(kù)整數(shù)類(lèi)型介紹
前言
前兩天寫(xiě)了一篇文章,是介紹如何將32-byte的MD5轉(zhuǎn)為整型來(lái)保存,最后使用了兩個(gè)ubiging和一個(gè)uint來(lái)保存,共使用20個(gè)字節(jié),有興趣的可以翻翻我的文章。在評(píng)論區(qū)里有各路大神提出建議和思路,令我豁然開(kāi)朗,或許還有更簡(jiǎn)便的方法,使用更少字節(jié)來(lái)保存32-byte的MD5。
在這篇文章里我將講解一下思路,最后可以將32-byte的MD5轉(zhuǎn)為兩個(gè)ubigint來(lái)保存,共16個(gè)字節(jié)。對(duì)文字沒(méi)有興趣的同學(xué)可以直接看github的demo,點(diǎn)擊文章最下方的“了解更多”可跳轉(zhuǎn)到我的github頁(yè)面,用golang實(shí)現(xiàn)的。
再識(shí)MD5
這里并不打算長(zhǎng)篇大論地討論MD5的由來(lái),只是簡(jiǎn)單梳理一下。
MD5是一個(gè)128bit的大整數(shù),而每8bit為1個(gè)字節(jié),每個(gè)字節(jié)所能表示的最大范圍為[0,2^9-1=511]。
這超出了ascii碼所能表示的范圍,無(wú)法將MD5打印出來(lái)。因此將每個(gè)字節(jié)的高低位拆分一個(gè)字節(jié),這樣每個(gè)字節(jié)所能表示的最大范圍為[0,2^5-1=31]。這樣一來(lái),原本16個(gè)字節(jié)(128/8=16)的MD5就變成了32個(gè)字節(jié)(128/4=32)。
思路
認(rèn)清了MD5的原貌,再來(lái)對(duì)他下手吧。
將32字節(jié)的MD5拆分為兩個(gè)16字節(jié),再不斷地將兩個(gè)字節(jié)合并成一個(gè)字節(jié),最后得到兩個(gè)大整型的數(shù)字。
詳細(xì)步驟
- 由于MySQL最大的整數(shù)類(lèi)型為bigint,要考慮到轉(zhuǎn)換后的數(shù)字是否會(huì)溢出。將兩個(gè)字節(jié)合并為一個(gè)字節(jié)的過(guò)程是:先將上一步操作得到的結(jié)果左移8位,然后將下一個(gè)字節(jié)左移4位,作為高位,再下一個(gè)字節(jié)不變,作為低位,三個(gè)數(shù)相加得到結(jié)果,以此循環(huán)直到將32字節(jié)的MD5遍歷結(jié)束。因此最后得到的結(jié)果為(32/2)*8=128bit=16byte。而bigint占用8byte,因此需要用兩個(gè)bigint來(lái)存放。
- 合并的過(guò)程中,單個(gè)字符的處理為:將單個(gè)字符看成是一個(gè)十六進(jìn)制數(shù),再進(jìn)行移位和合并。例如“AE43”用ascii的十進(jìn)制表示為65,69,52,51。這里不使用ascii對(duì)應(yīng)的數(shù)字進(jìn)行運(yùn)算,因?yàn)镸D5是由數(shù)字和字母組成,使用65,69這樣大的數(shù)字,最后造成溢出。
圖解
由于我表達(dá)能力有限,可能無(wú)法表達(dá)出中心思想,最后給大家上一幅稿圖,也許思路能更清晰一點(diǎn)。

每?jī)蓚€(gè)字符作為高低位合并
如果你有興趣,可以點(diǎn)擊下方的了解更多,可以到我的github查看demo和源碼。當(dāng)然了,如果你的項(xiàng)目是用golang寫(xiě)的,也可以直接獲取使用。