據華為宣布,2 月 16 日,第二屆全球數據壓縮大賽(GDCC2021)頒獎儀式舉行,此次比賽共設置 5 個方向 13 個類別,吸引來自全球 40 多個國家的 1 萬多名存儲研究人員關注,200 多名參賽者報名,提交了 79 種算法,22 人獲獎。所有獲獎算法的性能都優于業界已知的同類型壓縮算法。部分算法的壓縮比超過業界基準算法 30% 以上,進一步逼近數據壓縮極限。

華為也公布了 2021 年第二屆全球數據壓縮大賽亮點:
增加更多非結構化數據類型,提升賽題難度
第二屆的賽題對比第一屆難度明顯提高。智能世界的數據類型多種多樣,多以非結構化數據為主,壓縮算法能適配的數據類型越多,適配的應用場景越廣。為此,主辦方增加更多非結構化數據類型,如面向 AI 分析的圖片類數據、面向 HPC 的科學計算類數據、面向多樣化算力的 ARM 平臺產生的數據等。
增設獎項,培養壓縮領域的新生力量
本次大賽在獎項設置方面,在原本的一、二、三等獎的基礎上增設 1 個特等獎和 12 個領先獎。其中特等獎專為獎勵在塊壓縮領域有突出貢獻的參賽者,推動數據壓縮技術快速走向商業化而設置。大賽邀請全球頂尖算法高手挑戰算法極限的同時,也注重激勵并培養壓縮領域的新生力量,增設了面向高校學生的編碼算法優化類別,并相應增設了 10 個學生參與獎。
大賽高手云集,選手 Marcio Pais 提交了多個算法,在全部 13 個研究方向中獲得 6 個第一名,成為本場最大贏家。其設計的 delta、beta (1-2)、zeta (1-2) 算法在圖片浮點數場景,壓縮率顯著領先于業界通用算法 ZSTD,為壓縮算法優化提供了更佳的方向。選手 Peter Thamm 在塊壓縮賽題中,縮減率提升 24% 前提下,評分超越 ZSTD 25.4%,獲得大賽專設特等獎。來自中國的參賽者表現也十分亮眼,Xu Xiali(注冊名)提交的 fc、flz 兩個算法,分別獲得相應方向的第二、第三名。
壓縮算法是提高存儲能力的核心技術之一,也是一直以來存儲技術中的重磅難題。華為表示,希望新的全球數據壓縮大賽能繼續吸引更多的世界各地參與者。同時也歡迎數據縮減技術專家、無損數據壓縮迷、數據結構和算法開發人員和研究人員、年輕的天才們能夠一起進行深入的交流合作,希望共同在數據管理和處理領域帶來新的突破性發明。