2020 年是不平凡的一年,突如其來的疫情,雖然改變了人們的生活方式,但卻為人工智能的發(fā)展按下了加速鍵,語音的「非接觸」交互優(yōu)勢(shì)被充分的挖掘和放大,語音 AI 也迎來了行業(yè)紅利期。
在經(jīng)歷了上半年的「沉寂」后,語音 AI 企業(yè)在下半年集體「蓄勢(shì)待發(fā)」了。
語音 AI 的「多事」之秋
8 月,思必馳完成數(shù)億元 Pre-IPO 輪融資,距離上一輪 4.1 億人民幣融資僅五個(gè)月。思必馳旗下芯片設(shè)計(jì)公司深聰半導(dǎo)體,則于 12 月獲得數(shù)千萬元人民幣的 Pre-A 輪融資,或?qū)⑼瞥鱿乱淮Z音 AI 芯片。
9 月,百度宣布小度科技獨(dú)立融資,百度依然保持了對(duì)小度科技的絕對(duì)控制權(quán),投后估值達(dá)約 200 億元。繼智能音箱取得多項(xiàng)全國(guó)第一后,小度發(fā)布首款「破圈」產(chǎn)品小度真無線智能耳機(jī)。
10 月,聲智完成 B+ 輪融資,加速遠(yuǎn)場(chǎng)語音交互和人工智能操作系統(tǒng)的應(yīng)用場(chǎng)景落地,同時(shí)面向 C 端發(fā)布首款支持免喚醒智能語音交互的耳機(jī)。
10 月,杭州國(guó)芯科技完成數(shù)億元 C 輪融資,三個(gè)月前,杭州國(guó)芯發(fā)布了首款超低功耗的應(yīng)用在可穿戴領(lǐng)域的 AI 芯片,開啟了全新的基于「人-車-家」全場(chǎng)景的落地之路。
11 月,云知聲獲得科創(chuàng)板上市受理,招股書顯示,司最近三年?duì)I業(yè)收入復(fù)合增長(zhǎng)率為 89.37%、超過 20%。
12 月,傳聞稱 Rokid 已完成新一輪融資(未被披露),正擬拆 VIE 架構(gòu),準(zhǔn)備登陸科創(chuàng)板。
語音 AI 作為人機(jī)交互的新希望,激勵(lì)了眾多隨風(fēng)起舞的獨(dú)角獸,政策、資本的利好,讓這些快速成長(zhǎng)的企業(yè)直指一個(gè)目標(biāo)——科創(chuàng)板上市。
闖關(guān)科創(chuàng)板
12 月 7 日,科創(chuàng)板迎來了自 2019 年 7 月 22 日開市以來,第 200 家上市公司。
據(jù)統(tǒng)計(jì),這 200 家上市公司所處的行業(yè)高度集中在高新技術(shù)產(chǎn)業(yè)和戰(zhàn)略新興產(chǎn)業(yè)。其中,新一代信息技術(shù)領(lǐng)域的企業(yè)有 65 家。雖然其中聚焦 AI 的企業(yè)并不多,但每一家都受到了廣泛的關(guān)注。
而作為科創(chuàng)板首個(gè)遞交招股書的語音 AI 企業(yè),云知聲能否成為繼 2008 年科大訊飛深交所上市后,第二家上市的語音 AI 企業(yè),一時(shí)間也成為人們關(guān)注的焦點(diǎn)。
云知聲定義為一家為企業(yè)和用戶提供智能語音技術(shù)和綜合解決方案的人工智能企業(yè),主營(yíng)業(yè)務(wù)包括提供智能語音交互產(chǎn)品、智慧物聯(lián)解決方案、以及人工智能技術(shù)服務(wù)。

人工智能行業(yè)正處于高速發(fā)展階段,而公司作為行業(yè)內(nèi)極具競(jìng)爭(zhēng)力的廠商,云知聲經(jīng)營(yíng)規(guī)模和資產(chǎn)規(guī)模不斷擴(kuò)大,主營(yíng)業(yè)務(wù)收入呈逐年增長(zhǎng)的趨勢(shì),從 2017 年的 6114.07 萬元,增長(zhǎng)至 2019 年的 2.19 億元,年均復(fù)合增長(zhǎng)率達(dá) 89.14%。主營(yíng)業(yè)務(wù)占總營(yíng)收 99.87%,主營(yíng)業(yè)務(wù)毛利率為 31.66%。

從盈利能力和經(jīng)營(yíng)風(fēng)險(xiǎn)的角度來看,云知聲的核心技術(shù)的商業(yè)化探索仍在持續(xù)進(jìn)行,營(yíng)業(yè)收入規(guī)模較小。與此同時(shí),為持續(xù)構(gòu)建核心技術(shù)和產(chǎn)品體系、保持競(jìng)爭(zhēng)力,公司持續(xù)加大研發(fā)投入。公司目前仍在不斷探索新的業(yè)務(wù)方向并相應(yīng)適當(dāng)調(diào)整經(jīng)營(yíng)策略,預(yù)計(jì)公司在短期內(nèi)仍無法實(shí)現(xiàn)盈利。
基于此,云知聲選擇適用《上海證券交易所科創(chuàng)板股票上市規(guī)則》第 2.1.2 條第一款第二項(xiàng)的上市標(biāo)準(zhǔn):預(yù)計(jì)市值不低于人民幣 15 億元,最近一年?duì)I業(yè)收入不低于人民幣 2 億元,且最近三年累計(jì)研發(fā)投入占最近三年累計(jì)營(yíng)業(yè)收入的比例不低于 15%。
目前在已上市的 200 家上市公司中,有 10 家企業(yè)選擇第二套上市標(biāo)準(zhǔn)。
這是語音 AI 企業(yè)遞交科創(chuàng)板的首份招股書,它映射了云知聲和很多其他語音 AI 企業(yè)在主營(yíng)業(yè)務(wù)上的商業(yè)化探索。
商業(yè)化探索之路
云知聲創(chuàng)立于 2012 年,從創(chuàng)立之初就圍繞智能語音市場(chǎng)需求,為企業(yè)和用戶提供智能語音技術(shù)和綜合解決方案。
2012 年仍是語音 AI 商業(yè)化的萌芽階段。在此之前的 2011 年,蘋果 Siri 隨 iPhone 4s 初次亮相;隨后的 2012 年,Google Now 出現(xiàn)在安卓 4.1 和 Nexus 手機(jī)上;2013 年,微軟 Cortana 語音助手在年度 Build 開發(fā)者大會(huì)上首次亮相;直到 2014 年 11 月,亞馬遜 Alexa 語音助手和 Echo 智能音箱在黑五促銷季亮相,從而引爆整個(gè)語音 AI 產(chǎn)業(yè)。
這一期間,海外的語音 AI 的商業(yè)化之路仍在探索,國(guó)內(nèi)的語音 AI 幾乎還是一片空白。

云知聲較早的發(fā)現(xiàn)商機(jī)并持續(xù)圍繞著「算力+算法+數(shù)據(jù)」構(gòu)建基礎(chǔ)架構(gòu),完善技術(shù)體系,打造獨(dú)特的「云-端-芯」產(chǎn)品中臺(tái),對(duì)核心技術(shù)進(jìn)行了模塊化梳理和整合,從而具備面向市場(chǎng)需求的快速產(chǎn)品化能力,支撐公司以豐富的產(chǎn)品組合為眾多知名企業(yè)提供服務(wù)。
2012 年,云知聲率先將深度神經(jīng)網(wǎng)絡(luò)(DNN)應(yīng)用于商業(yè)語音識(shí)別系統(tǒng),例如,后來涌現(xiàn)的卷積神經(jīng)網(wǎng)絡(luò)(CNN)、回歸神經(jīng)網(wǎng)絡(luò)(RNN)、端到端序列建模、生成對(duì)抗網(wǎng)絡(luò)(GAN)等主流技術(shù)方法,云知聲都是業(yè)界最早的產(chǎn)業(yè)實(shí)踐者之一,這也讓云知聲在算法方面有了堅(jiān)實(shí)的根基,并在后來始終保持高效的演進(jìn)速度。
2012 年 9 月份,云知聲率先推出免費(fèi)的語音云平臺(tái),允許各類應(yīng)用開發(fā)者免費(fèi)在線實(shí)時(shí)調(diào)用公司基礎(chǔ)智能語音服務(wù)。

2014 年初,云知聲亦是行業(yè)率先,提出了面向物聯(lián)網(wǎng)的「云-端-芯」核心戰(zhàn)略,將三個(gè)模塊不斷整合,形成了面向市場(chǎng)需求的快速產(chǎn)品化能力。
從 2015 年開始,云知聲啟動(dòng)了造芯計(jì)劃。通過設(shè)計(jì)專用的 AI 加速器并重組芯片架構(gòu)來支持密集的邊緣計(jì)算任務(wù),打造語音 AI 核心 IP,讓各項(xiàng)人工智能核心技術(shù)具備運(yùn)算密集型的特性,對(duì)硬件算力有剛性需求。
也是從 2015 年開始,云知聲的智能語音交互產(chǎn)品也日漸豐富起來,包括以軟硬一體形式為主進(jìn)行交付的物聯(lián)網(wǎng)語音交互產(chǎn)品,和以軟件形式為主進(jìn)行交付的智能語音工具產(chǎn)品兩類。

與此同時(shí),以家居、醫(yī)療場(chǎng)景為突破口,率先完成智能語音解決方案的商業(yè)化落地。
在家電領(lǐng)域,云知聲的智能語音交互方案已被格力等家電龍頭采用;在酒店、商業(yè)地產(chǎn)和住宅領(lǐng)域,世茂集團(tuán)與云知聲成立合資公司,落地整屋和全場(chǎng)景的智能化;在醫(yī)療領(lǐng)域,公司相關(guān)產(chǎn)品得到北京協(xié)和醫(yī)院等近百家醫(yī)院的高度認(rèn)可,此外,公司與平安好醫(yī)生成立合資公司,試水醫(yī)療領(lǐng)域智能硬件產(chǎn)品的開發(fā);在汽車領(lǐng)域,公司與億咖通成立合資公司,為戴姆勒奔馳等整車廠提供車載語音解決方案,并攜手探索基于自研車規(guī)級(jí)人工智能語音芯片「雪豹」的車載語音解決方案的應(yīng)用。

云知聲的主要盈利模式包括三類:
1、向客戶銷售標(biāo)準(zhǔn)化程度較高的智能語音交互產(chǎn)品,以軟硬一體、軟件或云服務(wù)形式交付為主;
2、為客戶提供具有一定定制化成分的場(chǎng)景智能化解決方案,交付內(nèi)容通常包含硬件、軟件和服務(wù);
3、面向部分細(xì)分行業(yè)龍頭客戶所提供的定制化人工智能技術(shù)服務(wù)。
為持續(xù)提升技術(shù)領(lǐng)先性和加速技術(shù)產(chǎn)業(yè)化,云知聲計(jì)劃將募集資金投資于下列項(xiàng)目:人工智能技術(shù)中臺(tái)建設(shè)項(xiàng)目;面向物聯(lián)網(wǎng)邊緣計(jì)算的人工智能芯片研發(fā)平臺(tái)建設(shè)項(xiàng)目;基于人工智能技術(shù)的智慧醫(yī)院解決方案建設(shè)項(xiàng)目。
在技術(shù)層面,將夯實(shí)硬核技術(shù)實(shí)力和全棧技術(shù)體系。
在產(chǎn)品層面,將進(jìn)一步完善及提升「云-端-芯」產(chǎn)品中臺(tái)能力,以完備的產(chǎn)品技術(shù)組合、統(tǒng)一的解決方案、開放的平臺(tái)能力,夯實(shí)支持「萬物智聯(lián)」的落地能力。

在商業(yè)層面,將持續(xù)打造「U(云知聲)+X(場(chǎng)景)」智慧商業(yè)生態(tài),形成科技驅(qū)動(dòng)的運(yùn)營(yíng)服務(wù)和產(chǎn)品增長(zhǎng)的良性閉環(huán)。
語音 AI 的希望
語言,是人類最自然、最便捷、使用頻率最高的溝通方式,也是未來人機(jī)交互最重要的方式。
在人工智能發(fā)展的 60 余年中,智能語音是發(fā)展最早、最重要、發(fā)展最成熟的技術(shù)方向之一。同時(shí),因?yàn)檎Z言天然附帶的思維屬性和應(yīng)用復(fù)雜性,也是人工智能的技術(shù)制高點(diǎn),行業(yè)成熟度高、市場(chǎng)潛力巨大。
伴隨智能音箱和語音助手在家庭、出行等領(lǐng)域的不斷滲透,語音 AI 在離大眾最近的消費(fèi)級(jí) IoT 領(lǐng)域,正在成為各種終端設(shè)備至關(guān)重要的入口。尤其是在 5G 推動(dòng)萬物互聯(lián)的關(guān)鍵時(shí)刻,語音 AI 在物聯(lián)網(wǎng)場(chǎng)景中將極大受益。人機(jī)交互模式也進(jìn)入了語音交互、鍵盤輸入、屏幕觸摸等多模態(tài)融合的萬物互聯(lián)新時(shí)代。

據(jù)市場(chǎng)調(diào)研機(jī)構(gòu) Juniper Research 預(yù)測(cè),到 2023 年,全球語音助手的使用量將達(dá)到 80 億,而智能音箱和智能可穿戴設(shè)備端的語音助手使用量將有超過 40% 的增長(zhǎng)。
與此同時(shí),語音 AI 的相關(guān)技術(shù)正處于爆發(fā)期:深度學(xué)習(xí)利用深層模型替換聲學(xué)模型中的混合高斯模型,顛覆語音領(lǐng)域的算法設(shè)計(jì)思路,使得語音識(shí)別領(lǐng)域?qū)崿F(xiàn)了有效突破,性能得到快速提升;而海量真實(shí)語音數(shù)據(jù)又為深度學(xué)習(xí)算法提供基礎(chǔ)原材料,成為深度學(xué)習(xí)突破聲紋識(shí)別的關(guān)鍵因素,有效降低識(shí)別錯(cuò)誤率;云計(jì)算與高性能計(jì)算機(jī)則為深度學(xué)習(xí)提供強(qiáng)大的運(yùn)算能力和服務(wù)能力。
盡管具備語音交互能力的設(shè)備量正在井噴,但用戶對(duì)于交互效率的期待一直很高。據(jù)調(diào)查,對(duì)于語音和語義識(shí)別準(zhǔn)確度的關(guān)注比例高達(dá) 84.2%。可以預(yù)見,在三大技術(shù)的助力下,語音識(shí)別準(zhǔn)確率將逐步上升,用戶滿意度也將不斷提高,從而為智能語音行業(yè)的發(fā)展打下堅(jiān)實(shí)的技術(shù)基礎(chǔ)。
在商用場(chǎng)景,隨著各垂直行業(yè)的信息化建設(shè)基本完成,智能化建設(shè)方興未艾。
以醫(yī)療場(chǎng)景為例,在 21 世紀(jì)的前 20 年基本完成了醫(yī)療信息化的初步改造,如辦公自動(dòng)化、數(shù)據(jù)數(shù)字化等智能化改造的前置條件基本完成,為進(jìn)一步的人工智能場(chǎng)景化應(yīng)用,如就診流程智能化、診治手段智能化、空間場(chǎng)景智能化等提供了巨大的行業(yè)發(fā)展機(jī)會(huì)。其他垂直領(lǐng)域如金融、交通、生產(chǎn)制造、行政管理等也存在類似的信息化建設(shè)基礎(chǔ) 和智能化建設(shè)機(jī)會(huì),人工智能技術(shù)的場(chǎng)景化應(yīng)用將成為大勢(shì)所趨。

據(jù) Meticulous Research 發(fā)布的報(bào)告,預(yù)計(jì)到 2025 年,全球語音和語音識(shí)別市場(chǎng)的規(guī)模將達(dá)到 268 億美元。
云知聲只是行業(yè)的一個(gè)縮影。放眼全球,Nuance、Cerence、科大訊飛、思必馳、出門問問等各家在語音 AI 領(lǐng)域耕耘的智能語音技術(shù)公司,以及 Google、蘋果、亞馬遜、百度、小米等國(guó)內(nèi)外互聯(lián)網(wǎng)科技巨頭,正在競(jìng)爭(zhēng)與合作、以及不斷的跨界和破圈中,推動(dòng)著語音 AI 在更廣闊的商業(yè)化應(yīng)用場(chǎng)景,落地、生根、發(fā)芽。
微信號(hào):shenzhenware
主筆:周森 / 深圳灣
編輯:陳述 / 深圳灣
插圖制作:達(dá)達(dá) / 深圳灣
題圖說明:電影《人工智能》,2001 年上映。