日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網(wǎng)為廣大站長提供免費(fèi)收錄網(wǎng)站服務(wù),提交前請做好本站友鏈:【 網(wǎng)站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(wù)(50元/站),

點(diǎn)擊這里在線咨詢客服
新站提交
  • 網(wǎng)站:52011
  • 待審:79
  • 小程序:12
  • 文章:1184964
  • 會員:801

在人工智能(AI)的快速發(fā)展浪潮中,數(shù)據(jù)標(biāo)注行業(yè)作為AI產(chǎn)業(yè)鏈的關(guān)鍵一環(huán),正經(jīng)歷著前所未有的變革。特別是隨著大型語言模型的興起,數(shù)據(jù)標(biāo)注行業(yè)迎來了爆發(fā)式增長,但其勞動密集型的特性也使其面臨市場的重新評估。

以美股市場知名數(shù)據(jù)標(biāo)注公司Innodata為例,其股價在過去一年中飆升了432%,成為市場關(guān)注的焦點(diǎn)。最新財報顯示,Innodata在2024年的營收同比增長了96.44%,且其八大主要客戶中,有五家來自美股科技巨頭。這一強(qiáng)勁表現(xiàn)無疑彰顯了數(shù)據(jù)標(biāo)注行業(yè)在當(dāng)前AI時代的重要地位。

然而,市場的預(yù)期并非一成不變。隨著DeepSeek等技術(shù)的發(fā)布,市場對用于訓(xùn)練大模型的公開數(shù)據(jù)需求產(chǎn)生了新的質(zhì)疑。這直接導(dǎo)致了Innodata股價的波動,尤其是在三月,股價跌幅超過了30%。對于Innodata的未來,市場聲音出現(xiàn)了明顯的分歧。

一方面,看空者指出,在過去十年中,Innodata僅實(shí)現(xiàn)了兩次盈利,因此其股價的飆升似乎缺乏合理的支撐。而另一方面,看多者則認(rèn)為,隨著大模型時代的來臨,Innodata已經(jīng)成功轉(zhuǎn)型,專注于大模型的數(shù)據(jù)清理業(yè)務(wù),因此其增長潛力巨大。

回顧數(shù)據(jù)標(biāo)注行業(yè)的發(fā)展歷程,自動駕駛的興起曾為其帶來了第一次高光時刻。在大型語言模型出現(xiàn)之前,自動駕駛領(lǐng)域的標(biāo)注需求占據(jù)了AI下游應(yīng)用的相當(dāng)大比例。然而,大型語言模型的出現(xiàn)將數(shù)據(jù)標(biāo)注的需求提升到了一個全新的高度。有投資者表示,如果沒有大型語言模型的興起,即便是自動駕駛領(lǐng)域的數(shù)據(jù)標(biāo)注龍頭Scale AI,在2023年之前的年收入也僅為1億至2億美元。而到了2024年,Scale AI的全年ARR預(yù)計將達(dá)到12-14億美元,實(shí)現(xiàn)了數(shù)倍的增長。

Innodata作為業(yè)務(wù)集中在數(shù)據(jù)工程領(lǐng)域的公司,充分享受到了大型語言模型帶來的紅利。最新財報顯示,其最大客戶授予了價值約2400萬美元的額外合同,使得來自該客戶的總年化運(yùn)營收入達(dá)到了約1.35億美元。來自其他七家大型科技公司客戶的收入也在第四季度實(shí)現(xiàn)了環(huán)比159%的增長。

然而,隨著大型語言模型行業(yè)的擴(kuò)張期逐漸過去,數(shù)據(jù)標(biāo)注行業(yè)也開始面臨新的挑戰(zhàn)。Epoch AI的研究估計,自2020年以來,用于訓(xùn)練大語言模型的數(shù)據(jù)增長了100倍,且AI訓(xùn)練數(shù)據(jù)集的規(guī)模每年都在翻倍。然而,互聯(lián)網(wǎng)可用內(nèi)容的年增長率卻不足10%。這意味著,到2028年,AI訓(xùn)練數(shù)據(jù)很可能面臨耗盡的風(fēng)險。

事實(shí)上,數(shù)據(jù)不足所導(dǎo)致的發(fā)展瓶頸已經(jīng)成為行業(yè)中的普遍現(xiàn)象。去年11月,有報道稱OpenAI下一代旗艦?zāi)P蚈rion的改進(jìn)速度大幅放緩,其中一個主要原因就是高質(zhì)量訓(xùn)練數(shù)據(jù)的短缺。行業(yè)共識是,目前通用數(shù)據(jù)的供給已經(jīng)接近飽和,垂類數(shù)據(jù)將成為未來AI模型差異化的關(guān)鍵。

盡管Innodata在數(shù)據(jù)標(biāo)注領(lǐng)域取得了顯著成績,但其“AI含量”卻一直飽受質(zhì)疑。早在2019年,Innodata就宣稱自己開始實(shí)施人工智能和機(jī)器學(xué)習(xí)流程,并將其劃為一家人工智能公司。然而,去年的一份報告卻指出,Innodata的核心業(yè)務(wù)仍然是依靠海外廉價勞動力進(jìn)行基礎(chǔ)數(shù)據(jù)標(biāo)注,而非自主研發(fā)的AI技術(shù)。報告還引用前員工的說法,稱公司為硅谷客戶提供的服務(wù)本質(zhì)上是“鍵盤勞動”。

盡管如此,Innodata的財報數(shù)據(jù)卻顯示出了強(qiáng)勁的增長勢頭。僅在2024年第二季度,公司就花費(fèi)了360萬美元的招聘代理費(fèi),這表明其仍然非常依賴人力。業(yè)內(nèi)人士指出,這主要是由于數(shù)據(jù)標(biāo)注的復(fù)雜性和多樣性,以及不同領(lǐng)域的數(shù)據(jù)標(biāo)注要求不同。自動化標(biāo)注技術(shù)在現(xiàn)階段還存在一定的局限性。

然而,DeepSeek等技術(shù)的出現(xiàn)卻在一定程度上改寫了數(shù)據(jù)需求的邏輯。DeepSeek采用的強(qiáng)化學(xué)習(xí)技術(shù)使得大模型能夠利用模型內(nèi)已存在的數(shù)據(jù)進(jìn)行自我訓(xùn)練,從而降低了對數(shù)據(jù)量的需求。這一變化無疑對數(shù)據(jù)標(biāo)注行業(yè)產(chǎn)生了沖擊。

關(guān)于DeepSeek對數(shù)據(jù)標(biāo)注行業(yè)的沖擊,Innodata管理層在財報電話會上表示,他們相信預(yù)訓(xùn)練數(shù)據(jù)和微調(diào)數(shù)據(jù)對于通用人工智能(AGI)的發(fā)展而言是無法替代的。在他們看來,DeepSeek依賴以現(xiàn)有模型數(shù)據(jù)訓(xùn)練新模型的方式會極大地壓縮數(shù)據(jù),最終導(dǎo)致模型崩潰。

盡管市場存在質(zhì)疑,但仍有投資者認(rèn)為DeepSeek的出現(xiàn)對Innodata來說并非利空。他們指出,隨著DeepSeek帶來的模型部署和運(yùn)行成本的大幅降低,將有更多應(yīng)用層的公司部署自己的大模型,這將帶來額外的數(shù)據(jù)標(biāo)注需求。

然而,對于數(shù)據(jù)標(biāo)注工作的自動化程度問題,市場仍然存在爭議。當(dāng)投資者質(zhì)疑Innodata的“AI含量”低時,一個不可忽視的事實(shí)是,數(shù)據(jù)標(biāo)注工作的AI化可能會首先革掉數(shù)據(jù)標(biāo)注公司自己的命。這一悖論使得Innodata等公司的可持續(xù)增長面臨不確定性。

盡管如此,隨著AI技術(shù)的不斷發(fā)展,數(shù)據(jù)標(biāo)注行業(yè)仍然具有廣闊的發(fā)展前景。特別是在垂類數(shù)據(jù)領(lǐng)域,人工標(biāo)注仍然具有不可替代性。因此,對于Innodata等公司而言,如何在保持業(yè)務(wù)增長的同時,不斷提升自身的技術(shù)含量和自動化水平,將是其未來面臨的重要挑戰(zhàn)。

分享到:
標(biāo)簽:乘風(fēng)破浪 變局 標(biāo)注 模型 時代
用戶無頭像

網(wǎng)友整理

注冊時間:

網(wǎng)站:5 個   小程序:0 個  文章:12 篇

  • 52011

    網(wǎng)站

  • 12

    小程序

  • 1184964

    文章

  • 801

    會員

趕快注冊賬號,推廣您的網(wǎng)站吧!
最新入駐小程序

數(shù)獨(dú)大挑戰(zhàn)2018-06-03

數(shù)獨(dú)一種數(shù)學(xué)游戲,玩家需要根據(jù)9

答題星2018-06-03

您可以通過答題星輕松地創(chuàng)建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學(xué)四六

運(yùn)動步數(shù)有氧達(dá)人2018-06-03

記錄運(yùn)動步數(shù),積累氧氣值。還可偷

每日養(yǎng)生app2018-06-03

每日養(yǎng)生,天天健康

體育訓(xùn)練成績評定2018-06-03

通用課目體育訓(xùn)練成績評定