日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網(wǎng)為廣大站長(zhǎng)提供免費(fèi)收錄網(wǎng)站服務(wù),提交前請(qǐng)做好本站友鏈:【 網(wǎng)站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(wù)(50元/站),

點(diǎn)擊這里在線咨詢客服
新站提交
  • 網(wǎng)站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會(huì)員:747

近期,第29屆國(guó)際知識(shí)發(fā)現(xiàn)與數(shù)據(jù)挖掘大會(huì)(ACM SIGKDD Conference on Knowledge Discovery and Data Mining,以下簡(jiǎn)稱KDD)在美國(guó)加州長(zhǎng)灘舉辦。由火山引擎數(shù)智平臺(tái),北京大學(xué)計(jì)算機(jī)學(xué)院和蒙特利爾學(xué)習(xí)算法研究所等單位合作的論文 《Rover: An online Spark SQL tuning service via generalized transfer learning 》(以下簡(jiǎn)稱Rover)成功被大會(huì)收錄。Rover由北京大學(xué)的沈彧和火山引擎數(shù)智平臺(tái)的任鑫宇楊擔(dān)任共同第一作者,北京大學(xué)的崔斌教授擔(dān)任通訊作者。

圖片1.png

圖:論文題目和作者信息

KDD會(huì)議始于1989年,是數(shù)據(jù)挖掘領(lǐng)域歷史最悠久、影響最大的頂級(jí)學(xué)術(shù)年會(huì)。KDD廣泛的交叉學(xué)科性和應(yīng)用性吸引了來(lái)自統(tǒng)計(jì)、機(jī)器學(xué)習(xí)、數(shù)據(jù)庫(kù)、萬(wàn)維網(wǎng)、生物信息學(xué)、多媒體、自然語(yǔ)言處理、人機(jī)交互、社會(huì)網(wǎng)絡(luò)計(jì)算、高性能計(jì)算及大數(shù)據(jù)挖掘等眾多領(lǐng)域的研究者,為來(lái)自學(xué)術(shù)界、企業(yè)界和政府部門的相關(guān)人員提供了一個(gè)學(xué)術(shù)交流和成果展示的理想場(chǎng)所。

Apache Spark作為主流的分布式計(jì)算框架,在工業(yè)界得到了廣泛的應(yīng)用,字節(jié)跳動(dòng)內(nèi)部龐大的例行計(jì)算任務(wù)每天消費(fèi)數(shù)百萬(wàn)core CPU及數(shù)十PB RAM規(guī)模的計(jì)算資源。每個(gè)Spark任務(wù)通過(guò)200余個(gè)相互關(guān)聯(lián)的配置參數(shù)啟動(dòng),但是,由于平臺(tái)默認(rèn)配置缺乏彈性,任務(wù)環(huán)境多樣,終端用戶經(jīng)驗(yàn)不足等問(wèn)題,相當(dāng)數(shù)量的計(jì)算資源常因不合理的配置而被浪費(fèi)。傳統(tǒng)上,有經(jīng)驗(yàn)的大數(shù)據(jù)工程師可以依據(jù)每個(gè)任務(wù)的運(yùn)行情況,對(duì)其配置進(jìn)行人工分析和調(diào)整。然而,這種人工調(diào)優(yōu)方式在面臨在高維參數(shù)組合時(shí)往往有天花板,并伴有運(yùn)維迭代成本高昂等問(wèn)題,使得其難以被規(guī)?;?。

為了解決此問(wèn)題,火山引擎的工程師和北京大學(xué)的研究者一起設(shè)計(jì)了一種結(jié)合機(jī)器學(xué)習(xí)方法與人類專家知識(shí)的基礎(chǔ)設(shè)施成本優(yōu)化框架(如圖1所示),該框架以貝葉斯優(yōu)化算法為基礎(chǔ),使用高斯過(guò)程作為代理模型學(xué)習(xí)配置參數(shù)集與任務(wù)成本/運(yùn)行時(shí)長(zhǎng)的關(guān)系,并通過(guò)可信賴的遷移學(xué)習(xí)機(jī)制,從人類專家知識(shí)編碼中獲得安全性和可解釋性(如圖1中Expert-assisted Optimization部分所示),并從相似的歷史任務(wù)中獲得額外的收斂加速特性(如圖1中Controlled History Transfer部分所示)。

圖片2.png

圖:Rover優(yōu)化器的整體架構(gòu)

該方案能自動(dòng)化識(shí)別和調(diào)整例行計(jì)算任務(wù)的配置參數(shù)集,在不破壞任務(wù)服務(wù)等級(jí)的前提下壓縮資源浪費(fèi),有效節(jié)省運(yùn)行成本。經(jīng)驗(yàn)證,Rover在公開(kāi)任務(wù)集及字節(jié)跳動(dòng)內(nèi)部的實(shí)際部署中,對(duì)比當(dāng)前市面領(lǐng)先的解決方案,在極限收益,收斂速度和安全性方面均有進(jìn)一步提升。

圖片3.png

圖:Rover對(duì)比4家市面上領(lǐng)先解決方案在內(nèi)存降低率上的Benchmark

Rover是基于火山引擎DataTester在字節(jié)跳動(dòng)內(nèi)部應(yīng)用的自動(dòng)調(diào)參系統(tǒng)優(yōu)化器內(nèi)核、增加遷移學(xué)習(xí)機(jī)制演化而來(lái),并通過(guò)自動(dòng)調(diào)參平臺(tái)的配套服務(wù)來(lái)實(shí)施和運(yùn)行的,目前該項(xiàng)研究已經(jīng)在字節(jié)跳動(dòng)上萬(wàn)個(gè)Spark數(shù)據(jù)開(kāi)發(fā)任務(wù)上得到應(yīng)用,已幫助公司節(jié)約700萬(wàn)元/年的資源成本。未來(lái),這項(xiàng)技術(shù)將在字節(jié)跳動(dòng)內(nèi)部的大數(shù)據(jù)計(jì)算基礎(chǔ)設(shè)施上大規(guī)模部署,預(yù)計(jì)每年將會(huì)節(jié)約近十億元,還將通過(guò)火山引擎數(shù)智平臺(tái)為外部企業(yè)提供通用優(yōu)化器服務(wù),可應(yīng)用于基礎(chǔ)設(shè)施成本優(yōu)化,線上算法超參數(shù)優(yōu)化等多種場(chǎng)景。

據(jù)了解,火山引擎數(shù)智平臺(tái)(VeDI)是新一代企業(yè)數(shù)據(jù)智能服務(wù)平臺(tái),旗下的A/B測(cè)試產(chǎn)品DataTester經(jīng)歷了字節(jié)跳動(dòng)的10年打磨,目前服務(wù)于字節(jié)跳動(dòng)內(nèi)部500余個(gè)業(yè)務(wù)線,也服務(wù)了包括美的、得到、凱叔講故事等在內(nèi)的上百家外部企業(yè),為企業(yè)業(yè)務(wù)的用戶增長(zhǎng)、轉(zhuǎn)化、產(chǎn)品迭代、運(yùn)營(yíng)活動(dòng)等各個(gè)環(huán)節(jié)提供科學(xué)的決策依據(jù),將成熟的“數(shù)據(jù)驅(qū)動(dòng)增長(zhǎng)”經(jīng)驗(yàn)賦能給各行業(yè)。

附錄論文地址:https://dl.acm.org/doi/10.1145/3580305.3599953

(作者:韓圣瀚)

分享到:
標(biāo)簽:基于遷移學(xué)習(xí)的基礎(chǔ)設(shè)施成本優(yōu)化框架 火山引擎數(shù)智平臺(tái)與北京大學(xué)聯(lián)合論文被KDD收錄 熱點(diǎn)資訊
用戶無(wú)頭像

網(wǎng)友整理

注冊(cè)時(shí)間:

網(wǎng)站:5 個(gè)   小程序:0 個(gè)  文章:12 篇

  • 51998

    網(wǎng)站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會(huì)員

趕快注冊(cè)賬號(hào),推廣您的網(wǎng)站吧!
最新入駐小程序

數(shù)獨(dú)大挑戰(zhàn)2018-06-03

數(shù)獨(dú)一種數(shù)學(xué)游戲,玩家需要根據(jù)9

答題星2018-06-03

您可以通過(guò)答題星輕松地創(chuàng)建試卷

全階人生考試2018-06-03

各種考試題,題庫(kù),初中,高中,大學(xué)四六

運(yùn)動(dòng)步數(shù)有氧達(dá)人2018-06-03

記錄運(yùn)動(dòng)步數(shù),積累氧氣值。還可偷

每日養(yǎng)生app2018-06-03

每日養(yǎng)生,天天健康

體育訓(xùn)練成績(jī)?cè)u(píng)定2018-06-03

通用課目體育訓(xùn)練成績(jī)?cè)u(píng)定