機(jī)器之心報(bào)道
作者:澤南
高度模塊化和可擴(kuò)展的設(shè)計(jì)是 FaceX-Zoo 的優(yōu)勢。
近年來,基于深度學(xué)習(xí)的人臉識別技術(shù)取得了重要進(jìn)展。但是人臉識別模型的實(shí)際部署和深入研究都需要相應(yīng)的公眾支持。例如生產(chǎn)級人臉表示網(wǎng)絡(luò)需要模塊化的訓(xùn)練機(jī)制,以配合不同 SOTA 骨干網(wǎng)絡(luò)、訓(xùn)練監(jiān)督主題再到現(xiàn)實(shí)世界人臉識別需求。至于性能分析和比較,基于多個(gè)基準(zhǔn)的大量模型也需要一個(gè)標(biāo)準(zhǔn)和自動(dòng)化的評估工具。此外,人們希望能夠出現(xiàn)一種以整體流水線形式部署的人臉識別公共基礎(chǔ)。
最近還出現(xiàn)了一系列新的挑戰(zhàn),例如疫情期間出現(xiàn)的戴口罩人臉識別需求,這在實(shí)際應(yīng)用中引來了人們的關(guān)注。一個(gè)可行的解決方式是建立起一套易用的統(tǒng)一框架來解決這些問題。
今年 1 月,來自京東的研究人員面向人臉識別技術(shù)開發(fā)社區(qū)提出了全新的開源框架 FaceX-Zoo。依靠高度模塊化和可擴(kuò)展的設(shè)計(jì),F(xiàn)aceX-Zoo 提供具備多種多種 supervisory head 和骨干網(wǎng)絡(luò)的訓(xùn)練模塊,以實(shí)現(xiàn)效果最優(yōu)的人臉識別。此外,它還具備標(biāo)準(zhǔn)化評估模塊,以便在大多數(shù)情況下測試模型效果。
在這個(gè)工具中,人們只需改動(dòng)簡單的配置就可以在大多數(shù)流行基準(zhǔn)上進(jìn)行模型測試。此外,它還有一個(gè)簡單但功能齊全的人臉 SDK 用于驗(yàn)證訓(xùn)練后的模型,并進(jìn)行初步應(yīng)用。該工具并不包含大量現(xiàn)有技術(shù),但也因此易于拓展升級。
最近,這一工具已被開源。
GitHub 鏈接:https://github.com/JDAI-CV/FaceX-Zoo
該工具的環(huán)境需求如下:
Python >= 3.7.1
pytorch >= 1.1.0
torchvision >= 0.3.0
FaceX-Zoo 提供了 MobileFaceNet、ResNet、 SE-ResNet、HRNet、EfficientNet 等較為流行的骨干網(wǎng)絡(luò)以方便提取面部特征。如果這還無法滿足你的需要,只要修改配置文件、添加架構(gòu)定義文件,在 PyTorch 的支持下你就可以輕松自定義任何其他選擇。
使用 FaceX-Zoo 中 FMA-3D 工具為照片中的人物戴上口罩,填充蒙面人臉數(shù)據(jù)集。
不同骨干網(wǎng)絡(luò)的性能評估。
不同 supervisory head 的性能評估。
京東的開發(fā)者們表示,在未來研究人員還計(jì)劃進(jìn)一步增加 FaceX-Zoo 的模塊數(shù)量,如面部分析和 face lightning,補(bǔ)充骨干網(wǎng)絡(luò)架構(gòu)和 supervisory head 數(shù)量,并嘗試通過分布式數(shù)據(jù)并行技術(shù)和混合精度訓(xùn)練來提升模型訓(xùn)練的效率。
相關(guān)論文:https://arxiv.org/abs/2101.04407