8月24日,在夸克舉辦的“Meet AI”開放日中,夸克掃描王展示了離線掃描、魔法擦除以及公式提取等場景中的技術能力,夸克自研的AI視覺技術已經開始應用到每個人的日常生活中,幫助他們解決實際問題。
手機上網已經成為人們日常生活的一部分,但是在高鐵、圖書館等網絡信號不穩定時,很多掃描產品的體驗并不好,因為手機硬件的算力和服務端的算力相差百倍,這也是很多手機掃描產品面臨的技術難點。
為了不讓網絡環境影響掃描體驗,夸克開發了獨有的離線掃描模式,用戶無需網絡就能完成高質量掃描。為了實現該功能,夸克進行了很多技術創新,也是第一個將掃描AI算法上端的產品。從結果來看,通過模型量化和壓縮等技術,模型的size縮小了100倍,結合傳統算法后掃描效果保持95%,計算耗時僅為2秒。
數據顯示,目前夸克用戶中25歲以下的占比超過一半,他們很多人都是在校大學生,對掃描書本、提取文字和公式有著強烈需求。
其中,提取公式需要在OCR領域進行更有突破性的技術創新,夸克首次將多模算法引入文字識別領域,讓公式識別、手寫識別的效果得到了大幅度提升,在夸克用戶的高頻場景上,印刷文字識別精度99.99%,手寫文字識別精度 98.5%+。
夸克掃描王在提取公式、表格還原、掃描手寫體等方面已經達到行業領先水平,可以很好地滿足大學生群體在學習場景中的需求。
在日常生活中,很多年輕人都喜歡編輯照片。夸克掃描王依托強大的算法能力,不僅能修復圖片中的缺陷,還能給用戶提供更具創意的想象空間。
例如,為了讓擦除的效果更好,機器就要有能力識別出擦除后的圖片背景并進行還原,它的難點在于不能夠提前預判背景樣式,也沒有清晰的數據標注。在這個過程中,夸克使用判別器進行識別,模擬“學生”給“老師”交作業的情景,通過反復的訓練,不斷精進學生的作品以及老師的審美水平,最終呈現出一張效果優質的圖片。
在這個過程中,夸克使用了數千萬張的高質量智能圖像,同時使用上百個GPU,持續訓練一周。而用戶只需要簡單地涂抹便可完成照片美化。
夸克視覺技術負責人黃銳華表示,夸克掃描王會不斷完善技術能力,加強在學習、工作、生活等場景中的創新體驗。面向未來我們也有信心給用戶提供不同類型的產品,讓他們享受更有效率的數字生活。