日前,第17屆IEEE ISI會議在深圳落幕。本次會議開啟前,IEEE特別發起了國際大數據分析競賽(IEEE ISI World Cup 2019),來自來自中國、美國、巴基斯坦、英國、德國等7個國家的企業、高校共363支隊伍,1001名選手參戰,金山AI Lab團隊以大比分優勢在Mission 2比賽中奪得冠軍,應邀參加了如期舉行的國際會議。
IEEE ISI是安全信息學領域的旗艦會議,于2003年首次在美國亞利桑那州圖森市召開,該會議旨在促進人工智能賦能的解析學技術(AI-Enabled Analytics)的產業落地,并為全球學術界和產業界同行提供一個學術交流與技術探討的平臺。
基于3500家上市公司全量信息,ISI World Cup 2019國際大數據分析競賽將這些上市公司在財務、法務、股權、經營狀況、輿論等方面的文本信息作為訓練數據,參賽選手需要合理運用現有數據集材料,篩選出對競賽有價值的信息進行特征構建和模型訓練。該賽事由兩大任務(Mission)組成,分別進行競賽和評比,M1是企業投資價值評估,M2是法律訴訟類型預測。
金山AI Lab派出兩支團隊分別參加兩個任務,一支隊伍在M2中以44分奪得冠軍,分數比其他隊伍高了接近一倍,達到了參賽隊伍中的領先水平,可以在生產環境中直接應用,解決企業痛點。在M2上面,金山AI Lab使用了遞進優化的策略,對數據進行多層次的分類,避免了數據分布因極度不均衡而帶來的訓練失效問題。另一支隊伍在M1中取得第五名。此次金山AI Lab的兩支參賽隊伍雙雙獲獎,展示了其在大數據分析方面的團隊實力與創新潛能。
在互聯網飛速發展的當下,大數據正深刻改變著人們的思維方式、生產方式和生活方式,已成為推動人類社會加速步入智能化時代的關鍵資源。毋庸置疑,大數據將掀起新一輪的產業和技術革命。隨著大數據興起的數據挖掘、機器學習和人工智能等相關技術,或將改變數據世界里的很多算法和基礎理論,實現科學技術上的突破,給各行業的產業鏈帶來難以想象的巨大變化,創造出意想不到的商業價值。
目前,大數據已成為各大企業發展的重點,金山AI Lab就是在這一背景下成立的。目前,金山AI Lab以NLP為核心,涵蓋圖像、文本、語音三大方向,主要研究內容分為知識圖譜、機器翻譯、內容推薦和智能校對等。研究項目主要分為兩類,一類是專注于落地的項目,如機器翻譯、智能校對等;另一類是專注于基礎服務的項目,例如知識圖譜,可以對這些直接落地的項目提供長期的輔助研究。
與人工智能技術看重場景落地一樣,金山AI Lab在大數據領域也看重實際可用性,且水平也已在業界處于領先水平,這就保證了金山大數據相關技術能夠產生極大的經濟效益。