傳音將技術創(chuàng)新作為公司核心戰(zhàn)略之一,不斷加大產品研發(fā)投入,在影像研發(fā)領域頻頻取得創(chuàng)新性技術突破。近日,公司旗下影像研發(fā)團隊再取佳績,在2022歐洲計算機視覺會議(European Conference on Computer Vision,簡稱ECCV)移動智能攝影與影像競賽(MIPI Workshop)的“Quad-Bayer Re-mosaic”分賽道上奪得第二名。同時,影像研發(fā)團隊參與撰寫的論文“BlumNet: Graph Component Detection for Object Skeleton Extraction”被多媒體領域國際頂級會議2022 ACM Multimedia成功錄用。
2022 ECCV MIPI Workshop分賽道第二名
傳音參與撰寫的論文被2022 ACM Multimedia成功錄用
2022 ECCV MIPI Workshop
兩年一屆的歐洲計算機視覺國際會議ECCV(European Conference on Computer Vision)是全球計算機視覺三大頂級會議之一。隨著移動平臺上計算攝影和成像需求的增加,在相機系統(tǒng)中開發(fā)和集成先進的圖像傳感器與新穎的算法越來越普及。基于此,新加坡南洋理工大學S-Lab、商湯科技、上海人工智能實驗室聯(lián)合ECCV 2022舉辦題為“移動智能攝影與影像”(MIPI)的Workshop,從產業(yè)界與學術界的視角討論移動智能攝影與影像的發(fā)展。
Quad-Bayer Sensor是一種目前廣泛應用在智能手機相機上的攝像頭感光芯片,“Quad-Bayer Re-mosaic”分賽道旨在將Quad Sensor捕獲的RAW數據通過先進的Remosaic算法轉換為傳統(tǒng)的Bayer格式,并且獲得更好的拍攝圖像效果。此次競賽提供了一個具有210對分辨率為(1200, 1800)的訓練數據集。類似地,驗證集和測試集各包含45組數據。參賽者需要設計Remosaic算法把Quad陣列轉換為傳統(tǒng)Bayer陣列。
傳音影像研發(fā)團隊在競賽中發(fā)表的論文“Learning Rich Information for Quad Bayer Remosaicing and Denoising”,創(chuàng)造性地提出了一種基于DNNs的聯(lián)合解決方案,對相機RAW數據進行算法優(yōu)化,幫助提升圖像畫質,為移動智能攝影領域的瓶頸問題提供了解題新思路。
2022 ACM Multimedia
ACM Multimedia是計算機圖形學與多媒體領域的國際頂級會議,由計算機領域權威學術組織國際計算機協(xié)會(Association for Computing Machinery, ACM)發(fā)起。2022 ACM Multimedia 會議于10月14日在葡萄牙里斯本召開,共收到投稿2473篇,收錄690篇,接收率僅為27.9%。
此次傳音影像研發(fā)團隊參與撰寫的論文“BlumNet: Graph Component Detection for Object Skeleton Extraction”聚焦通用骨架監(jiān)測,闡述了一種新的骨架提取思想,以圖論方法抽象建模任意物體的通用骨架,以微分的思路把不規(guī)則的骨架分支切分成等長的線段或者曲線,基于DeformableDETR發(fā)展出一套既能監(jiān)測Junction/End Points,又能檢測線段或者曲線的深度學習網絡模型。通用骨架檢測是圖形理解、物體表達識別、場景理解的技術基礎,有著廣泛的應用場景。這一技術進步,將為圖像理解的難點痛點問題提供新的解決辦法。
隨著影像功能成為智能手機用戶的“第一剛需”,在手機外觀和硬件趨同的背景下,影像技術已經成為了下一代產品差異化競爭力的新突破口。傳音在影像研發(fā)領域開展前瞻性布局,取得了突破性成就。此前傳音已經先后獲得CVPR 2020 LIP國際競賽深膚色人像分割賽道冠軍、吳文俊人工智能科技進步獎(企業(yè)技術創(chuàng)新工程項目)等獎項;主導多項移動終端計算攝影系統(tǒng)國際標準獲ITU-T正式立項。
目前,包括智能場景感知、深膚色拍照算法在內的多款影像技術成果已經廣泛應用于傳音旗下系列手機產品,為新興市場本土消費者帶來更優(yōu)越的移動終端攝像體驗。傳音將繼續(xù)加碼研發(fā)投入,布局前沿技術,推動技術研發(fā)成果的應用轉化,擴大在新興市場本地化科技創(chuàng)新方面的競爭優(yōu)勢,不斷提升用戶價值與體驗。