8月24日消息,近期,2022中國(guó)圖象圖形大會(huì)(CCIG 2022)在成都落幕,本次大會(huì)由中國(guó)科學(xué)技術(shù)協(xié)會(huì)指導(dǎo),中國(guó)圖象圖形學(xué)學(xué)會(huì)主辦,四川大學(xué)承辦,電子科技大學(xué)協(xié)辦,匯聚了百余位國(guó)內(nèi)知名學(xué)者,以及來(lái)自百度、華為、OPPO、合合信息等企業(yè)的技術(shù)專家,共話圖像圖形學(xué)術(shù)研究與技術(shù)創(chuàng)新趨勢(shì),共謀行業(yè)新發(fā)展。
合合信息自然語(yǔ)言算法研發(fā)總監(jiān)丁凱博士認(rèn)為,盡管OCR技術(shù)已走過(guò)一個(gè)世紀(jì)的發(fā)展,現(xiàn)今仍存在文檔圖像質(zhì)量退化嚴(yán)重、文字檢測(cè)及版面分析困難、非限定條件文字識(shí)別率低、結(jié)構(gòu)化智能理解能力差等亟待解決的問(wèn)題。OCR技術(shù)的進(jìn)階之路上,文檔圖像質(zhì)量的增強(qiáng)是重要的研究方向,需克服頁(yè)面彎曲、陰影遮擋、摩爾紋、圖片模糊等現(xiàn)代文本圖像處理中常見(jiàn)的干擾狀況。通過(guò)引入AI(人工智能)技術(shù),合合信息智能文字識(shí)別及圖像處理技術(shù)能夠幫助各應(yīng)用領(lǐng)域簡(jiǎn)化下游文檔處理任務(wù),提升文字識(shí)別效率與準(zhǔn)確性。
以彎曲矯正為例,丁凱博士介紹了基于文本行線擬合和坐標(biāo)變換、基于文本行線優(yōu)化矯正的方法原理和優(yōu)缺點(diǎn),并提到合合信息采用的基于位移場(chǎng)網(wǎng)絡(luò)學(xué)習(xí)的方法的系統(tǒng)架構(gòu),可有效解決多種彎曲文檔圖像的矯正問(wèn)題。除此之外,在教育領(lǐng)域,合合信息“字跡擦除”技術(shù)融合了內(nèi)容切分、手寫(xiě)字跡分離網(wǎng)絡(luò)、文檔質(zhì)量增強(qiáng)技術(shù),對(duì)復(fù)雜場(chǎng)景進(jìn)行準(zhǔn)確處理,實(shí)現(xiàn)作業(yè)及試卷筆記“一鍵擦除”。

另外一方面,文檔數(shù)字化流程的建立是加速企業(yè)數(shù)字化轉(zhuǎn)型的關(guān)鍵,也是技術(shù)落地中的痛點(diǎn)。為了更好地解決不同業(yè)務(wù)中存在的文檔版式繁雜、訓(xùn)練樣本匱乏、模型定制化調(diào)優(yōu)周期長(zhǎng)且效率低的問(wèn)題,合合信息推出了TextIn Studio智能文字識(shí)別訓(xùn)練平臺(tái),可將底層資源、數(shù)據(jù)、模型訓(xùn)練、集成部署和服務(wù)管理應(yīng)用多個(gè)模塊整合在一起,針對(duì)性解決各項(xiàng)問(wèn)題的同時(shí),建立業(yè)務(wù)流程之間的閉環(huán),實(shí)現(xiàn)模型自動(dòng)化訓(xùn)練和部署。
大會(huì)還舉行了第三屆CSIG圖像圖形挑戰(zhàn)賽總決賽頒獎(jiǎng)儀式。CSIG圖像圖形挑戰(zhàn)賽旨在促進(jìn)我國(guó)圖像圖形技術(shù)及相關(guān)產(chǎn)業(yè)的發(fā)展和應(yīng)用,解決企業(yè)面臨的技術(shù)難題,幫助企業(yè)引入更多的優(yōu)秀人才。本次大賽吸引了來(lái)自高校、科研機(jī)構(gòu)、企業(yè)的上百支參賽隊(duì)伍參與。憑借在視覺(jué)關(guān)鍵信息理解層面的算法優(yōu)勢(shì)與多語(yǔ)言票據(jù)識(shí)別場(chǎng)景的實(shí)踐沉淀,合合信息與高校及企業(yè)生態(tài)伙伴組成的參賽隊(duì)伍繼獲得“中英文購(gòu)物小票信息理解賽道”單項(xiàng)冠軍后,通過(guò)終輪現(xiàn)場(chǎng)比拼,獲得CSIG圖像圖形技術(shù)挑戰(zhàn)賽總冠軍。