基礎
1byte = 8bit (1字節(jié)等于8比特)

MySQL數(shù)據(jù)庫整數(shù)類型介紹
前言
前兩天寫了一篇文章,是介紹如何將32-byte的MD5轉(zhuǎn)為整型來保存,最后使用了兩個ubiging和一個uint來保存,共使用20個字節(jié),有興趣的可以翻翻我的文章。在評論區(qū)里有各路大神提出建議和思路,令我豁然開朗,或許還有更簡便的方法,使用更少字節(jié)來保存32-byte的MD5。
在這篇文章里我將講解一下思路,最后可以將32-byte的MD5轉(zhuǎn)為兩個ubigint來保存,共16個字節(jié)。對文字沒有興趣的同學可以直接看github的demo,點擊文章最下方的“了解更多”可跳轉(zhuǎn)到我的github頁面,用golang實現(xiàn)的。
再識MD5
這里并不打算長篇大論地討論MD5的由來,只是簡單梳理一下。
MD5是一個128bit的大整數(shù),而每8bit為1個字節(jié),每個字節(jié)所能表示的最大范圍為[0,2^9-1=511]。
這超出了ascii碼所能表示的范圍,無法將MD5打印出來。因此將每個字節(jié)的高低位拆分一個字節(jié),這樣每個字節(jié)所能表示的最大范圍為[0,2^5-1=31]。這樣一來,原本16個字節(jié)(128/8=16)的MD5就變成了32個字節(jié)(128/4=32)。
思路
認清了MD5的原貌,再來對他下手吧。
將32字節(jié)的MD5拆分為兩個16字節(jié),再不斷地將兩個字節(jié)合并成一個字節(jié),最后得到兩個大整型的數(shù)字。
詳細步驟
- 由于MySQL最大的整數(shù)類型為bigint,要考慮到轉(zhuǎn)換后的數(shù)字是否會溢出。將兩個字節(jié)合并為一個字節(jié)的過程是:先將上一步操作得到的結(jié)果左移8位,然后將下一個字節(jié)左移4位,作為高位,再下一個字節(jié)不變,作為低位,三個數(shù)相加得到結(jié)果,以此循環(huán)直到將32字節(jié)的MD5遍歷結(jié)束。因此最后得到的結(jié)果為(32/2)*8=128bit=16byte。而bigint占用8byte,因此需要用兩個bigint來存放。
- 合并的過程中,單個字符的處理為:將單個字符看成是一個十六進制數(shù),再進行移位和合并。例如“AE43”用ascii的十進制表示為65,69,52,51。這里不使用ascii對應的數(shù)字進行運算,因為MD5是由數(shù)字和字母組成,使用65,69這樣大的數(shù)字,最后造成溢出。
圖解
由于我表達能力有限,可能無法表達出中心思想,最后給大家上一幅稿圖,也許思路能更清晰一點。

每兩個字符作為高低位合并
如果你有興趣,可以點擊下方的了解更多,可以到我的github查看demo和源碼。當然了,如果你的項目是用golang寫的,也可以直接獲取使用。