招股說明書動(dòng)輒三四百頁,關(guān)鍵的發(fā)行人信息、財(cái)務(wù)信息、股權(quán)結(jié)構(gòu)圖,如何快速查找?券商研究報(bào)告,幾十頁上百頁,核心圖表、數(shù)字、觀點(diǎn)如何有效獲取?合同中,關(guān)鍵條款如何快速定位?
信息過載時(shí)代,達(dá)觀智能文檔審閱(IDP)系統(tǒng)不僅能從幾百頁的長(zhǎng)文檔中智能提取實(shí)體、關(guān)系級(jí)別信息,也能提取關(guān)鍵圖表、段落、章節(jié)等文檔要素級(jí)別信息,百倍提升原有閱讀效率。
達(dá)觀的智能文檔審閱(IDP)系統(tǒng)如何做到支持全內(nèi)容提取:
一、 強(qiáng)大的自研文檔標(biāo)注功能,智能解讀各類業(yè)務(wù)文件
可配置多種字段特征,滿足各類文檔標(biāo)注需求,在復(fù)雜場(chǎng)景中完成可自定義的關(guān)鍵信息提取。
(1)支持文字劃選、框選、表格內(nèi)容一鍵標(biāo)注;
(2) 支持圖片、表格框選;
(3) 支持表格增刪線條、合并/拆分單元格等多種操作;
(4) 支持字段組合標(biāo)注.
組合標(biāo)注示例
二、獨(dú)家版面還原技術(shù),內(nèi)容解析更準(zhǔn)確
應(yīng)用獨(dú)家版面分析技術(shù),復(fù)雜版式文件信息提取更準(zhǔn)確,提高數(shù)據(jù)處理效率。
(1) 可還原文件的頁眉頁腳、圖、表、標(biāo)題、段落、目錄等版面信息;
(2) 支持對(duì)還原結(jié)果進(jìn)行編輯,包括修改文字和表格結(jié)果;
(3) 支持直接導(dǎo)出文字內(nèi)容、圖片、表格結(jié)果;
(4) 支持API對(duì)接輸入,為后續(xù)信息提取提供底層技術(shù)能力。
版面還原示例
三、一站式模型訓(xùn)練平臺(tái),AI自動(dòng)提取
基于NLP和深度學(xué)習(xí)技術(shù),達(dá)觀面向開發(fā)者、終端業(yè)務(wù)使用者提供低成本、高精度、可視化的模型訓(xùn)練平臺(tái),自定義AI能力,靈活擴(kuò)展場(chǎng)景。
(1)系統(tǒng)中內(nèi)置多種算法,可針對(duì)不同的抽取關(guān)鍵字選擇不同的算法,模型參數(shù)可動(dòng)態(tài)調(diào)整;
(2)元素抽取算法可以支持抽取如段落,圖片,表格等內(nèi)容;
(3)同時(shí)支持模型導(dǎo)入導(dǎo)出,可在不同場(chǎng)景下進(jìn)行模型的遷移。支持現(xiàn)有模型增量訓(xùn)練,大幅提升訓(xùn)練效率。
招股說明書抽取模型示例
私募基金合同抽取模型示例
自2017年開始推向市場(chǎng),達(dá)觀IDP智能文檔審閱系統(tǒng)沉淀多年行業(yè)落地經(jīng)驗(yàn),已形成招股說明書提取、研究報(bào)告審核、私募基金合同提取等多個(gè)開箱即用模型。由達(dá)觀研發(fā)的業(yè)內(nèi)首家全內(nèi)容關(guān)鍵信息提取產(chǎn)品已在某交易所、多個(gè)頭部券商研究所、頭部券商托管部門部署應(yīng)用。
達(dá)觀數(shù)據(jù)是一家為企業(yè)提供各類場(chǎng)景智能文本機(jī)器人的國(guó)家高新技術(shù)企業(yè)。技術(shù)服務(wù)團(tuán)隊(duì)遍及全國(guó),靈活地為客戶提供原廠一站式服務(wù)。達(dá)觀產(chǎn)品與服務(wù)現(xiàn)已遍及金融、制造、地產(chǎn)、能源、通信、傳媒、醫(yī)藥、政務(wù)等領(lǐng)域,累積上千家知名政企客戶,是中國(guó)文本智能與超自動(dòng)化領(lǐng)域市場(chǎng)占有率最高的科技公司之一。
基于全棧自研的自然語言處理(NLP)、光學(xué)字符識(shí)別(OCR)、機(jī)器人流程自動(dòng)化(RPA)、知識(shí)圖譜等技術(shù),達(dá)觀數(shù)據(jù)推出辦公流程自動(dòng)化、IDP文檔智能審閱、文字識(shí)別、企業(yè)級(jí)垂直搜索、智能推薦等智能文本機(jī)器人產(chǎn)品和整體解決方案,讓計(jì)算機(jī)協(xié)助人工完成業(yè)務(wù)流程自動(dòng)化,大幅度提高企業(yè)效率與智能化水平。