8月24日消息,近期,2022中國圖象圖形大會(CCIG 2022)在成都落幕,本次大會由中國科學(xué)技術(shù)協(xié)會指導(dǎo),中國圖象圖形學(xué)學(xué)會主辦,四川大學(xué)承辦,電子科技大學(xué)協(xié)辦,匯聚了百余位國內(nèi)知名學(xué)者,以及來自百度、華為、OPPO、合合信息等企業(yè)的技術(shù)專家,共話圖像圖形學(xué)術(shù)研究與技術(shù)創(chuàng)新趨勢,共謀行業(yè)新發(fā)展。
合合信息自然語言算法研發(fā)總監(jiān)丁凱博士認為,盡管OCR技術(shù)已走過一個世紀的發(fā)展,現(xiàn)今仍存在文檔圖像質(zhì)量退化嚴重、文字檢測及版面分析困難、非限定條件文字識別率低、結(jié)構(gòu)化智能理解能力差等亟待解決的問題。OCR技術(shù)的進階之路上,文檔圖像質(zhì)量的增強是重要的研究方向,需克服頁面彎曲、陰影遮擋、摩爾紋、圖片模糊等現(xiàn)代文本圖像處理中常見的干擾狀況。通過引入AI(人工智能)技術(shù),合合信息智能文字識別及圖像處理技術(shù)能夠幫助各應(yīng)用領(lǐng)域簡化下游文檔處理任務(wù),提升文字識別效率與準確性。
以彎曲矯正為例,丁凱博士介紹了基于文本行線擬合和坐標變換、基于文本行線優(yōu)化矯正的方法原理和優(yōu)缺點,并提到合合信息采用的基于位移場網(wǎng)絡(luò)學(xué)習(xí)的方法的系統(tǒng)架構(gòu),可有效解決多種彎曲文檔圖像的矯正問題。除此之外,在教育領(lǐng)域,合合信息“字跡擦除”技術(shù)融合了內(nèi)容切分、手寫字跡分離網(wǎng)絡(luò)、文檔質(zhì)量增強技術(shù),對復(fù)雜場景進行準確處理,實現(xiàn)作業(yè)及試卷筆記“一鍵擦除”。

另外一方面,文檔數(shù)字化流程的建立是加速企業(yè)數(shù)字化轉(zhuǎn)型的關(guān)鍵,也是技術(shù)落地中的痛點。為了更好地解決不同業(yè)務(wù)中存在的文檔版式繁雜、訓(xùn)練樣本匱乏、模型定制化調(diào)優(yōu)周期長且效率低的問題,合合信息推出了TextIn Studio智能文字識別訓(xùn)練平臺,可將底層資源、數(shù)據(jù)、模型訓(xùn)練、集成部署和服務(wù)管理應(yīng)用多個模塊整合在一起,針對性解決各項問題的同時,建立業(yè)務(wù)流程之間的閉環(huán),實現(xiàn)模型自動化訓(xùn)練和部署。
大會還舉行了第三屆CSIG圖像圖形挑戰(zhàn)賽總決賽頒獎儀式。CSIG圖像圖形挑戰(zhàn)賽旨在促進我國圖像圖形技術(shù)及相關(guān)產(chǎn)業(yè)的發(fā)展和應(yīng)用,解決企業(yè)面臨的技術(shù)難題,幫助企業(yè)引入更多的優(yōu)秀人才。本次大賽吸引了來自高校、科研機構(gòu)、企業(yè)的上百支參賽隊伍參與。憑借在視覺關(guān)鍵信息理解層面的算法優(yōu)勢與多語言票據(jù)識別場景的實踐沉淀,合合信息與高校及企業(yè)生態(tài)伙伴組成的參賽隊伍繼獲得“中英文購物小票信息理解賽道”單項冠軍后,通過終輪現(xiàn)場比拼,獲得CSIG圖像圖形技術(shù)挑戰(zhàn)賽總冠軍。