歡迎來(lái)到的[每周AI大事件],這里記錄了過(guò)去一周值得關(guān)注的AI領(lǐng)域熱點(diǎn)內(nèi)容,幫助大家更好地了解人工智能領(lǐng)域的動(dòng)態(tài)和發(fā)展風(fēng)向。
PART 1 動(dòng)態(tài)
[國(guó)內(nèi)要聞]
1.美圖設(shè)計(jì)室 AI Logo 設(shè)計(jì)功能上線(xiàn)
美圖公司旗下美圖設(shè)計(jì)室推出了 AI Logo 設(shè)計(jì)功能,用戶(hù)只需輸入一句想法,即可生成多個(gè)不同風(fēng)格的 Logo。AI Logo 設(shè)計(jì)功能基于美圖 AI 技術(shù),智能識(shí)別用戶(hù)創(chuàng)意想法,進(jìn)行 Logo 的定制化設(shè)計(jì),用戶(hù)只需輸入品牌名和一句話(huà)描述,AI 即可幾秒快速生成多款不同風(fēng)格及排版樣式的優(yōu)質(zhì)創(chuàng)意 Logo。
2.聯(lián)發(fā)科:新旗艦芯片將支持由 Llama2模型開(kāi)發(fā)的 AI 應(yīng)用
聯(lián)發(fā)科技將利用 Meta 的新一代開(kāi)源大語(yǔ)言模型 Llama2以及其先進(jìn)的 AI 處理器和完整的 AI 開(kāi)發(fā)平臺(tái),建立終端側(cè) AI 計(jì)算生態(tài),加速智能手機(jī)、物聯(lián)網(wǎng)、汽車(chē)、智能家居等邊緣設(shè)備的 AI 應(yīng)用開(kāi)發(fā)。預(yù)計(jì)年底將采用 MediaTek 新一代天璣旗艦移動(dòng)芯片的智能手機(jī)支持由 Llama2模型開(kāi)發(fā)的生成式 AI 應(yīng)用。
3.阿里巴巴國(guó)際站發(fā)布全鏈路外貿(mào) AI 產(chǎn)品 包括生意助手、OKKI AI
文章核心內(nèi)容總結(jié):阿里巴巴國(guó)際站推出了全鏈路外貿(mào) AI 產(chǎn)品,擁有多項(xiàng)功能,包括智能商品發(fā)布與管理、市場(chǎng)分析、客戶(hù)接待、實(shí)時(shí)翻譯和企業(yè)管理等,覆蓋了外貿(mào)生意的各個(gè)環(huán)節(jié)。該產(chǎn)品包含生意助手和 OKKI AI,阿里國(guó)際站商家可以使用 AI “生意助手”,而 OKKI AI 則面向全行業(yè)所有商家開(kāi)放。
4.知網(wǎng)與華為成立人工智能聯(lián)合創(chuàng)新實(shí)驗(yàn)室 共創(chuàng) “華知” 大模型
同方知網(wǎng)與華為公司合作成立人工智能聯(lián)合創(chuàng)新實(shí)驗(yàn)室,共同開(kāi)展聯(lián)合創(chuàng)新和技術(shù)攻關(guān)。他們將共同研究大模型在知識(shí)服務(wù)領(lǐng)域的應(yīng)用,并合作開(kāi)發(fā)各類(lèi)行業(yè)大模型和場(chǎng)景大模型。
5.好未來(lái)數(shù)學(xué)大模型 MathGPT 正式上線(xiàn) 并開(kāi)放公測(cè)
好未來(lái)自研的數(shù)學(xué)領(lǐng)域千億級(jí)大模型 MathGPT 正式上線(xiàn)并開(kāi)啟公測(cè)。用戶(hù)可通過(guò)官網(wǎng)申請(qǐng)注冊(cè)賬號(hào)免費(fèi)試用體驗(yàn)。MathGPT 是面向全球數(shù)學(xué)愛(ài)好者和科研機(jī)構(gòu)的大模型,可以解答數(shù)學(xué)題并提供解題反饋。
6.網(wǎng)易 AI 創(chuàng)意工坊:無(wú)需部署、無(wú)需安裝即可體驗(yàn) Stable Diffusion
網(wǎng)易 AI 創(chuàng)意工坊是一款優(yōu)秀的人工智能繪畫(huà)工具,用戶(hù)無(wú)需部署、無(wú)需安裝即可體驗(yàn) Stable Diffusion。只需要通過(guò)文字描述,就可以生成風(fēng)格多樣的圖像,實(shí)現(xiàn)人人 “創(chuàng)作自由”、“繪畫(huà)自由”。該工坊為設(shè)計(jì)師提供了靈感和設(shè)計(jì)流程相關(guān)工具,提升了生產(chǎn)效率。工坊提供了免費(fèi)的入門(mén)教程和應(yīng)用案例,幫助用戶(hù)快速掌握人工智能繪畫(huà)知識(shí)。
7.昆侖萬(wàn)維推出 AI 搜索產(chǎn)品 “天工 AI 搜索” 并開(kāi)啟內(nèi)測(cè)申請(qǐng)
昆侖萬(wàn)維推出了國(guó)內(nèi)第一款 AI 搜索產(chǎn)品,名為 “天工 AI 搜索”。該搜索引擎采用大語(yǔ)言模型技術(shù),能夠通過(guò)對(duì)話(huà)式交互理解用戶(hù)意圖,并提供精準(zhǔn)、個(gè)性化的答案。與傳統(tǒng)搜索引擎相比,天工 AI 搜索具備更好的信息提取能力、知識(shí)生成能力和意圖識(shí)別能力。
8.百度預(yù)計(jì)將在年底推出文心大模型4.0視文心一言為新流量渠道
百度發(fā)布了2023年第二季度財(cái)報(bào),營(yíng)收為341億元,凈利潤(rùn)為52億元。百度管理層表示,公司將視文心一言為新的流量渠道,通過(guò)優(yōu)化搜索功能和推動(dòng)移動(dòng)互聯(lián)網(wǎng)生態(tài)獲得更多流量。此外,百度正在開(kāi)發(fā)文心大模型4.0版本,預(yù)計(jì)在年底推出。
9.釘釘推出數(shù)字員工功能 可用 AI 替身開(kāi)會(huì)
釘釘在2023年生態(tài)大會(huì)上推出了數(shù)字員工功能,可以代替用戶(hù)參與會(huì)議,并通過(guò)對(duì)話(huà)了解會(huì)議信息。
10.視覺(jué)中國(guó):會(huì)基于開(kāi)源大模型打造自己的垂直模型
視覺(jué)中國(guó)在投資者關(guān)系活動(dòng)記錄表中表示,公司擁有豐富的數(shù)字內(nèi)容版權(quán)交易場(chǎng)景,并計(jì)劃基于開(kāi)源的大模型,結(jié)合核心數(shù)據(jù)和業(yè)務(wù)場(chǎng)景,打造自己的垂直模型。
11.百度:在未來(lái)幾個(gè)季度加大對(duì)大語(yǔ)言模型和生成式 AI 的投入
百度 CEO 李彥宏表示,生成式 AI 和大語(yǔ)言模型具有巨大的變革能力,為百度提供了重大的市場(chǎng)機(jī)會(huì)。百度將加大對(duì)大語(yǔ)言模型和生成式 AI 的投入,不斷升級(jí)模型以保持行業(yè)領(lǐng)先地位。
12.百度:將在10月17日發(fā)布多款 AI 原生應(yīng)用
百度宣布將于10月17日舉辦 Baidu World2023,主題為 “生成未來(lái)(PROMPT THE WORLD)”。屆時(shí),百度將發(fā)布多款 AI 原生應(yīng)用,并介紹大模型的最新進(jìn)展。
13.快手自研大模型 “快意” KwaiYii 亮相
快手自主研發(fā)的大模型 “快意” 在多個(gè)大模型榜單上表現(xiàn)出色。新版本的 KwaiYii-13B 在 CMMLU 中文向排名第一。KwaiYii-13B-Chat 對(duì)話(huà)模型具備出色的語(yǔ)言理解和生成能力,支持內(nèi)容創(chuàng)作、信息咨詢(xún)、數(shù)學(xué)邏輯、代碼編寫(xiě)、多輪對(duì)話(huà)等廣泛任務(wù)。
14.星火認(rèn)知大模型男性用戶(hù)占比約達(dá)82%
科大訊飛公布了訊飛星火認(rèn)知大模型上線(xiàn)100多天的數(shù)據(jù)。根據(jù)數(shù)據(jù),男性用戶(hù)在該模型中的使用比例明顯高于女性用戶(hù),男女比例為82% 比18%。此外,中青年用戶(hù)是該模型的主要使用者,一線(xiàn)城市和新一線(xiàn)城市的用戶(hù)占比超過(guò)52%,其中廣東占比最高。星火大模型的用戶(hù)主要來(lái)自互聯(lián)網(wǎng)、科研、教育、市場(chǎng)媒體等行業(yè),其中30% 以上的用戶(hù)是 IT 互聯(lián)網(wǎng)工作者。
15.百度發(fā)布文心一言面向開(kāi)發(fā)者三大舉措 推出 AI Studio 星河大模型社區(qū)
百度推出自研大語(yǔ)言模型 “文心一言” 的三大舉措面向開(kāi)發(fā)者,包括推出 AI Studio 星河大模型社區(qū)、插件機(jī)制以及文心大模型 “星河” 共創(chuàng)生態(tài)計(jì)劃。AI Studio 星河大模型社區(qū)為開(kāi)發(fā)者提供一體化大模型開(kāi)發(fā)體驗(yàn),已積累超300個(gè)大模型創(chuàng)意應(yīng)用。插件機(jī)制為開(kāi)發(fā)者提供低門(mén)檻的插件開(kāi)發(fā)工具集,支持多類(lèi)型的插件開(kāi)發(fā)。
16.快手 AI 對(duì)話(huà)功能已在安卓版 APP 開(kāi)放內(nèi)測(cè)
快手宣布基于自研大語(yǔ)言模型應(yīng)用的 “快手 AI 對(duì)話(huà)” 功能已在安卓版本開(kāi)放內(nèi)測(cè)。該功能可以通過(guò)與用戶(hù)的對(duì)話(huà),幫助用戶(hù)快速查找短視頻、達(dá)人、百科等內(nèi)容,提供全新的信息獲取形態(tài)。此舉打破了站內(nèi)內(nèi)容的生態(tài)壁壘,為用戶(hù)提供了全網(wǎng)檢索服務(wù)和全新的信息獲取方式。。
[國(guó)際要聞]
1.IBM 向開(kāi)源 Hugging Face 投資2.35億美元
IBM 與開(kāi)源 AI 平臺(tái) Hugging Face 合作,通過(guò) IBM 的生成式 AI 平臺(tái) Watson X 幫助企業(yè)構(gòu)建、部署和定制跨多個(gè)領(lǐng)域的基礎(chǔ)模型。AI 構(gòu)建者可以在 Watson X 上利用 IBM 和 Hugging Face 社區(qū)的預(yù)訓(xùn)練模型來(lái)支持自然語(yǔ)言處理任務(wù)。Hugging Face 獲得2.35億美元的融資,將繼續(xù)推動(dòng) AI 研究的創(chuàng)新并通過(guò)開(kāi)源技術(shù)普及 AI。IBM 的投資表明其致力于推進(jìn) AI 研究的發(fā)展,并加速推出企業(yè)級(jí) AI 解決方案。合作的目標(biāo)是幫助各種組織構(gòu)建負(fù)責(zé)任和有目的的 AI 應(yīng)用程序。
2.英偉達(dá)股價(jià)飆升至歷史新高 AI芯片需求推動(dòng)本季度銷(xiāo)售額將增長(zhǎng)170%
英偉達(dá)公司在第二季度財(cái)報(bào)中公布了亮眼的業(yè)績(jī),并對(duì)當(dāng)前季度的銷(xiāo)售額做出了樂(lè)觀(guān)預(yù)測(cè)。公司預(yù)計(jì)本財(cái)季的銷(xiāo)售額將增長(zhǎng)170%,超過(guò)去年同期。這主要得益于人工智能芯片的需求推動(dòng),尤其是英偉達(dá)的 A100和 H100AI 芯片在生成型人工智能中的重要作用。
3.Upwork 公布2023年十大生成式 AI 相關(guān)技能和招聘情況
根據(jù) Upwork 的調(diào)查顯示,由于生成式人工智能的普及,49% 的招聘經(jīng)理計(jì)劃雇傭更多的獨(dú)立人才和全職員工來(lái)滿(mǎn)足需求。2023年上半年,生成式 AI 是 Upwork 平臺(tái)上增長(zhǎng)最快的領(lǐng)域,崗位發(fā)布量增加了1000% 以上,相關(guān)搜索增長(zhǎng)了1500%。該平臺(tái)公布了2023年上半年十大生成式 AI 相關(guān)技能和招聘項(xiàng)目。
4.德國(guó)未來(lái)幾年將在人工智能領(lǐng)域投資超過(guò)16億歐元
德國(guó)政府計(jì)劃在未來(lái)兩年內(nèi)將人工智能公共研究投資增加一倍,從5億歐元增加到近10億歐元,使總投資達(dá)到16億歐元。這筆資金將用于建立150個(gè)新的大學(xué)人工智能研究實(shí)驗(yàn)室、擴(kuò)充數(shù)據(jù)中心和提供人工智能訓(xùn)練數(shù)據(jù)集。
5.微軟 Edge 集成 AI 設(shè)計(jì)工具 Designer 從側(cè)邊欄即可訪(fǎng)問(wèn)
微軟將免費(fèi)的人工智能設(shè)計(jì)工具 Microsoft Designer 集成到 Edge 瀏覽器的側(cè)邊欄中,用戶(hù)可以在 Edge 中創(chuàng)建各種設(shè)計(jì)作品,如社交媒體帖子、傳單等,無(wú)需打開(kāi)其他頁(yè)面。
6.重磅!GPT-3.5Turbo 推出微調(diào)功能,可以打造專(zhuān)屬 ChatGPT 啦!
OpenAI 推出了 GPT-3.5Turbo 微調(diào)功能,并更新了 API,使企業(yè)和開(kāi)發(fā)人員能夠使用自己的數(shù)據(jù)構(gòu)建專(zhuān)屬的 ChatGPT。微調(diào)功能可以提升模型在特定任務(wù)上的性能,甚至超越 GPT-4的基本功能。微調(diào)的基本思想是在預(yù)訓(xùn)練模型的基礎(chǔ)上,對(duì)特定任務(wù)進(jìn)行深度訓(xùn)練,使模型在特定業(yè)務(wù)場(chǎng)景上的性能更好。開(kāi)發(fā)人員可以通過(guò)準(zhǔn)備數(shù)據(jù)、上傳文件、創(chuàng)建微調(diào)作業(yè)等步驟進(jìn)行微調(diào)。
7. AI 訓(xùn)練數(shù)據(jù)集 “Books3” 遭下架
反盜版組織成功要求在線(xiàn)盜版書(shū)籍資源庫(kù) TheEye 下線(xiàn) AI 訓(xùn)練數(shù)據(jù)集 "Books3",該數(shù)據(jù)集包含37GB 的文本,用于訓(xùn)練人工智能模型。反盜版組織表示 AI 對(duì)版權(quán)產(chǎn)生了新的挑戰(zhàn),計(jì)劃繼續(xù)打擊其他存有該數(shù)據(jù)集的網(wǎng)站。此外,Meta 等公司也使用了 "Books3" 數(shù)據(jù)集來(lái)訓(xùn)練 AI 模型。
8.Google DeepMind 提供免費(fèi)高質(zhì)量 AI 圖像 瀏覽量超1億
Google DeepMind 推出 VisualisingAI 項(xiàng)目,提供多樣化且高質(zhì)量的 AI 圖像,旨在擺脫 AI 圖像的刻板印象。與藝術(shù)家合作創(chuàng)作的這些圖像已被100多個(gè)國(guó)家使用,瀏覽量超過(guò)1億次,下載超過(guò)80萬(wàn)次。
9.《紐約時(shí)報(bào)》屏蔽了 OpenAI 的網(wǎng)絡(luò)爬蟲(chóng) GPTBot
《紐約時(shí)報(bào)》屏蔽了 OpenAI 的網(wǎng)絡(luò)爬蟲(chóng),這意味著 OpenAI 無(wú)法使用該出版物的內(nèi)容來(lái)訓(xùn)練其人工智能模型。《紐約時(shí)報(bào)》在更新服務(wù)條款后,明確禁止使用其內(nèi)容進(jìn)行人工智能訓(xùn)練。此舉可能對(duì) OpenAI 的研究和發(fā)展產(chǎn)生影響,并引發(fā)有關(guān)知識(shí)產(chǎn)權(quán)和數(shù)據(jù)使用權(quán)的討論。
10.美國(guó)法院裁定人工智能生成的藝術(shù)不受版權(quán)保護(hù)
美國(guó)聯(lián)邦地區(qū)法院法官 Beryl Howell 支持美國(guó)版權(quán)局的裁決,認(rèn)為人工智能系統(tǒng)創(chuàng)造的藝術(shù)作品沒(méi)有符合版權(quán)保護(hù)的資格,因?yàn)槿狈θ祟?lèi)的作者參與。這個(gè)裁決可能會(huì)對(duì)好萊塢產(chǎn)生影響,以及他們?cè)敢獠捎糜扇斯ぶ悄苌傻膬?nèi)容。
PART 2 熱門(mén)產(chǎn)品
1.可商業(yè)化,最強(qiáng)開(kāi)源文本生成代碼模型!Code Llama 重磅發(fā)布
Code Llama 是基于 Meta 發(fā)布的 Llama2大語(yǔ)言模型開(kāi)發(fā)的文本生成代碼模型,提供基礎(chǔ)代碼和針對(duì) Python 開(kāi)發(fā)和自然語(yǔ)言指令微調(diào)的三種參數(shù)模型。該模型支持多種主流編程語(yǔ)言,能夠直接根據(jù)自然文本或代碼生成代碼。Meta 表示,Code Llama 在代碼任務(wù)上的表現(xiàn)優(yōu)于目前所有開(kāi)源代碼模型,并在性能評(píng)測(cè)中表現(xiàn)出色。
2.鴨嘴獸 -70B 登頂 HuggingFace 開(kāi)源大模型排行榜
鴨嘴獸 -70B 模型在 HuggingFace 的開(kāi)源大模型排行榜上獲得第一名。該模型使用優(yōu)化過(guò)的數(shù)據(jù)集 Open-Platypus 進(jìn)行訓(xùn)練,刪除相似和重復(fù)問(wèn)題。研究人員使用 LoRA 和 PEFT 對(duì)模型進(jìn)行微調(diào),重點(diǎn)優(yōu)化非注意力模塊。
3.AI2發(fā)布大語(yǔ)言模型開(kāi)源數(shù)據(jù)集 Dolma 包含3萬(wàn)億個(gè) token
美國(guó)艾倫人工智能研究所最近發(fā)布了一個(gè)名為 Dolma 的開(kāi)源數(shù)據(jù)集,其包含了3萬(wàn)億個(gè) token,這些詞匯來(lái)自包括網(wǎng)絡(luò)內(nèi)容、學(xué)術(shù)出版物、代碼和書(shū)籍等廣泛的來(lái)源。Dolma 是目前公開(kāi)可用的同類(lèi)數(shù)據(jù)集中最大的一個(gè)。Dolma 的數(shù)據(jù)將為 AI2正在開(kāi)發(fā)中的開(kāi)放語(yǔ)言模型 OLMo 提供基礎(chǔ)。
4.Elevenlabs 推新版本:支持28種語(yǔ)言 擁有100萬(wàn)用戶(hù)
Elevenlabs 推出了新模型 “ElevenMultilingualv2”,該模型可以自動(dòng)識(shí)別28種語(yǔ)言,并將文本轉(zhuǎn)換為語(yǔ)音。新模型實(shí)現(xiàn)了更高的語(yǔ)音真實(shí)性,通過(guò)保留所有語(yǔ)言中的語(yǔ)音特征,使一個(gè)聲音可以用于所有語(yǔ)言。Elevenlabs 的技術(shù)已經(jīng)擁有超過(guò)100萬(wàn)用戶(hù),并計(jì)劃推出一個(gè)新功能,允許用戶(hù)在平臺(tái)上共享語(yǔ)音。
5.Claude 與 ChatGPT 哪家強(qiáng)?Claude 可以做,ChatGPT 卻做不到的4件事
該文章對(duì)比了人工智能聊天機(jī)器人 Claude 和 ChatGPT 在四個(gè)方面的優(yōu)勢(shì)。首先,Claude 可以讀取、分析和總結(jié)上傳的文件,而 ChatGPT 不能。其次,Claude 可以處理更多的單詞,具有更大的上下文能力。第三,Claude 使用了比 ChatGPT 更新的數(shù)據(jù),了解2021年之后的信息。最后,Claude 可以訪(fǎng)問(wèn)網(wǎng)頁(yè)鏈接并嘗試總結(jié)其內(nèi)容,但存在生成虛假內(nèi)容的風(fēng)險(xiǎn),而 ChatGPT 完全無(wú)法處理網(wǎng)頁(yè)鏈接。
6.1300億參數(shù),國(guó)內(nèi)首個(gè)數(shù)學(xué)大模型 MathGPT 上線(xiàn)!多項(xiàng)基準(zhǔn)趕超 GPT-4
國(guó)內(nèi)首個(gè)專(zhuān)為數(shù)學(xué)打造的千億級(jí)大模型 MathGPT 正式上線(xiàn),并在多項(xiàng)基準(zhǔn)測(cè)試中超過(guò)了 GPT-4,刷新了 SOTA。MathGPT 能夠通過(guò)上傳數(shù)學(xué)題目的文字或圖片,提供對(duì)話(huà)式的解答反饋,還支持隨機(jī)生成數(shù)學(xué)題目并給出解答。該模型在解題準(zhǔn)確率、穩(wěn)定性和用戶(hù)體驗(yàn)方面有明顯優(yōu)勢(shì),通過(guò)海量名師解題過(guò)程的數(shù)據(jù)進(jìn)行訓(xùn)練,能夠提供清晰、詳細(xì)的解題步驟和講解。
7.Meta多語(yǔ)言語(yǔ)音翻譯模型 SeamlessM4T:可翻譯多達(dá)100種語(yǔ)言、語(yǔ)音或文本
Meta 宣布推出 SeamlessM4T,一種多模態(tài)人工智能模型,可用于語(yǔ)音和文本翻譯。該模型支持文本到語(yǔ)音、語(yǔ)音到文本、語(yǔ)音到語(yǔ)音和文本到文本的翻譯,可以翻譯多達(dá)100種語(yǔ)言。Meta 的目標(biāo)是幫助不同語(yǔ)言的人更有效地交流。他們還發(fā)布了 SeamlessAlign,這是一個(gè)開(kāi)放的多模式翻譯數(shù)據(jù)集,可用于訓(xùn)練翻譯人工智能模型。
8.Hugging Face 推開(kāi)源多模態(tài) AI 模型 IDEFICS 支持圖像、文本輸入
Hugging Face 最近推出了一個(gè)名為 IDEFICS 的開(kāi)源多模態(tài) AI 模型,該模型可以接受圖像和文本作為輸入,并生成連貫的文本輸出。IDEFICS 是一個(gè)強(qiáng)大的視覺(jué)語(yǔ)言模型,具有800億個(gè)參數(shù),并支持根據(jù)圖像生成描述、回答相關(guān)問(wèn)題以及根據(jù)多個(gè)圖像生成敘述等功能。
9.Midjourney局部重繪功能來(lái)了 (官方教程)
StableDiffusion危矣!昨晚,Midjourney發(fā)布了一個(gè)強(qiáng)大的局部重繪功能Vary(Region),該功能可以對(duì)圖像指定區(qū)域進(jìn)行重新生成,實(shí)現(xiàn)對(duì)圖像的微調(diào)和大幅度編輯。
10.用 ChatGPT 方式開(kāi)發(fā)游戲:文本直接生成小游戲,StoryGames.AI 來(lái)了!
知名無(wú)代碼游戲開(kāi)發(fā)平臺(tái) buildbox 正式發(fā)布了集成生成式 AI 的游戲開(kāi)發(fā)平臺(tái) StoryGames.AI。該平臺(tái)通過(guò)將 buildbox 游戲開(kāi)發(fā)引擎與生成式 AI 相結(jié)合,用戶(hù)只需提供文本提示,就能在5分鐘左右生成一個(gè)10章節(jié)的視頻小游戲。雖然目前生成的游戲質(zhì)量還無(wú)法與專(zhuān)業(yè)開(kāi)發(fā)端媲美,但展示了用 ChatGPT 的方式開(kāi)發(fā)游戲是可行的,使沒(méi)有編程經(jīng)驗(yàn)的普通人也能創(chuàng)建游戲。
11.AI 代碼神器火了,復(fù)雜操作秒變 easy
AI 代碼編輯器 Cursor 通過(guò)接入 GPT-3.5/GPT-4,實(shí)現(xiàn)了跨文件提問(wèn)和執(zhí)行操作的功能,備受關(guān)注。它可以幫助程序員解決復(fù)雜的操作,如代碼執(zhí)行失敗時(shí)的自動(dòng)調(diào)試和錯(cuò)誤解決。網(wǎng)友稱(chēng)其為最佳 AI 代碼編輯器,表示要拋棄 VS Code 并轉(zhuǎn)向 Cursor。Cursor 可以輕松導(dǎo)入 VS Code 的主題、插件和設(shè)置,使用起來(lái)非常簡(jiǎn)單。此外,Cursor 還具有代碼生成、問(wèn)題提問(wèn)和錯(cuò)誤修改等功能,大大提高了編碼效率和生產(chǎn)力。
12.midjourney 畫(huà)質(zhì)一秒變清晰!Tracejourney 可將 Midjourney 圖片轉(zhuǎn)為矢量圖
Tracejourney 是一個(gè)免費(fèi)的 Discord 機(jī)器人,旨在為任何插圖創(chuàng)建矢量文件。它可以將 Midjourney 圖片轉(zhuǎn)換為矢量圖或進(jìn)行放大。它提供了工作流程選擇和快速交付功能,操作簡(jiǎn)單且用戶(hù)友好。
13.拖拽下圖像就能生成視頻,中科大、微軟等 DragNUWA 屬實(shí)驚艷
文章介紹了 DragNUWA,這是一種基于開(kāi)放域擴(kuò)散的視頻生成模型,由中國(guó)科學(xué)技術(shù)大學(xué)、微軟亞洲研究院和北京大學(xué)的研究者共同開(kāi)發(fā)。該模型通過(guò)語(yǔ)義、空間和時(shí)間三個(gè)角度實(shí)現(xiàn)對(duì)視頻內(nèi)容的細(xì)粒度控制。它可以通過(guò)拖動(dòng)物體對(duì)象的運(yùn)動(dòng)軌跡來(lái)生成連貫的視頻,還可以變換靜態(tài)景物圖像的相機(jī)位置和角度。
14.視頻版 ControlNet 開(kāi)源 CoDeF 靠提示詞就能切換畫(huà)風(fēng)
該篇文章介紹了最新的視頻處理算法 CoDeF,它可以根據(jù)提示詞精準(zhǔn)控制視頻元素的改變,實(shí)現(xiàn)視頻的重構(gòu)和不同畫(huà)風(fēng)的切換。該算法由全華人團(tuán)隊(duì)開(kāi)發(fā),已在 GitHub 上開(kāi)源。CoDeF 可以將風(fēng)景紀(jì)錄片秒變?yōu)閲?guó)風(fēng)水墨大作,還可以將電影角色一鍵變老,而其他細(xì)節(jié)不受影響。
15.一句話(huà)讓 AI 訓(xùn)練 AI!20分鐘微調(diào)羊駝大模型,從數(shù)據(jù)收集到訓(xùn)練全包了
通過(guò)一個(gè) AI 工具,只需用一句話(huà)描述你想要的大模型的功能,就可以讓 AI 自動(dòng)完成從生成數(shù)據(jù)集到微調(diào)訓(xùn)練的全過(guò)程。這個(gè)工具可以幫助搞定數(shù)據(jù)收集、寫(xiě)代碼等操作,只需要用人話(huà)描述需求,然后等待即可。作者舉例,用這個(gè)工具將羊駝大模型微調(diào)成優(yōu)化 GPT-4提示詞,整個(gè)過(guò)程只需20分鐘。
PART 3 觀(guān)點(diǎn)
1.報(bào)告:新加坡員工是全球最快采用人工智能技能的人群
根據(jù) LinkedIn 最新的《未來(lái)工作》報(bào)告,在采用人工智能技能方面,新加坡員工是世界上最快的。報(bào)告收集了來(lái)自25個(gè)國(guó)家的數(shù)據(jù),發(fā)現(xiàn)新加坡的 “擴(kuò)散率” 最高,即在個(gè)人資料中添加人工智能技能的會(huì)員比例比2016年1月增長(zhǎng)了20倍。
2.昆侖萬(wàn)維:AI 社交與 AI 動(dòng)漫產(chǎn)品預(yù)計(jì)于年內(nèi)上線(xiàn)
昆侖萬(wàn)維在2023年上半年實(shí)現(xiàn)了8% 的營(yíng)業(yè)總收入增長(zhǎng),整體毛利率達(dá)到80%。公司計(jì)劃在年內(nèi)推出 AI 游戲、AI 音樂(lè)、AI 動(dòng)漫、AI 社交等多款全新產(chǎn)品。AI 游戲已進(jìn)入高強(qiáng)度研發(fā)測(cè)試階段,預(yù)計(jì)將在一年內(nèi)正式上線(xiàn)。AI 社交與 AI 動(dòng)漫產(chǎn)品也計(jì)劃在年內(nèi)上線(xiàn)。
3.普林斯頓大學(xué)教授認(rèn)為,生成式 AI 炒作已 “失控”
普林斯頓大學(xué)計(jì)算機(jī)科學(xué)專(zhuān)家 Arvind Narayanan 和他的學(xué)生 Sayash Kapoor 將出版新書(shū) “AISnakeOil”,探討人工智能領(lǐng)域存在的許多炒作。盡管生成式 AI 取得很大進(jìn)步,但部分炒作已經(jīng)失控。
4.Gartner:2023年全球 AI 芯片收入將達(dá)530億美元2027年達(dá)1194億美元
根據(jù) Gartner 預(yù)測(cè),2023年全球用于執(zhí)行 AI 工作負(fù)載的半導(dǎo)體銷(xiāo)售收入預(yù)計(jì)將同比增長(zhǎng)20.9%,達(dá)到534億美元。到2027年,AI 芯片收入預(yù)計(jì)將比2023年的市場(chǎng)規(guī)模增長(zhǎng)一倍以上,達(dá)到1194億美元。
5.三分之二的專(zhuān)業(yè)人士認(rèn)為 AI 將提高他們的技能價(jià)值
最近人工智能高速發(fā)展,不少人擔(dān)心被 AI 取代工作。但是湯森路透一項(xiàng)調(diào)查顯示,許多專(zhuān)業(yè)人士對(duì) AI 持較為積極的態(tài)度,不太擔(dān)心被取代。調(diào)查總體顯示,專(zhuān)業(yè)人士對(duì) AI 的積極態(tài)度,認(rèn)為 AI 能提高他們的技能價(jià)值。調(diào)查還發(fā)現(xiàn),超過(guò)三分之二的受訪(fǎng)者預(yù)計(jì)依賴(lài)非傳統(tǒng)技能員工的工作量將增加,并認(rèn)為 AI 將催生新的職業(yè)道路。
6.調(diào)查顯示:人工智能將在未來(lái)一年塑造全球零售業(yè)
霍尼韋爾最近的調(diào)查顯示,人工智能、機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺(jué)技術(shù)正在深刻影響零售業(yè),并預(yù)計(jì)在未來(lái)一年將進(jìn)一步塑造全球零售業(yè)的發(fā)展。調(diào)查顯示,近六分之一的零售商計(jì)劃在明年采用這些技術(shù)來(lái)提升購(gòu)物體驗(yàn)。零售商認(rèn)為人工智能等技術(shù)可以補(bǔ)充和增強(qiáng)勞動(dòng)力,而不是取代員工。然而,預(yù)算限制和難以證明商業(yè)價(jià)值仍然是采用人工智能的障礙。
7.聯(lián)合國(guó)研究:AI 不太可能破壞就業(yè),但某些員工可能付出 “慘痛” 代價(jià)
聯(lián)合國(guó)國(guó)際勞工組織的研究報(bào)告指出,AI 更有可能增強(qiáng)現(xiàn)有工作而不是完全取代它們,但某些角色的任務(wù)自動(dòng)化風(fēng)險(xiǎn)較高。文書(shū)工作有24% 的高度自動(dòng)化風(fēng)險(xiǎn),打字員、旅行顧問(wèn)、銀行出納員等職位風(fēng)險(xiǎn)較大。該研究還發(fā)現(xiàn),AI 對(duì)高收入國(guó)家的員工影響較大。
8.IBM 研究表明:未來(lái)三年,40% 工人將因 AI 需要重新學(xué)習(xí)技能
根據(jù) IBM 商業(yè)研究組織的一項(xiàng)新的全球研究結(jié)果,40% 的員工在未來(lái)三年中將需要重新學(xué)習(xí)技能,以適應(yīng)人工智能和自動(dòng)化的發(fā)展。研究顯示,初級(jí)員工將面臨最大的變革,77% 的高管表示他們已經(jīng)看到了生成式人工智能對(duì)入門(mén)級(jí)職位的影響,并且預(yù)計(jì)未來(lái)幾年內(nèi)這種影響將進(jìn)一步加劇。然而,87% 的高管認(rèn)為員工更有可能被人工智能.
PART 4 深度
1.國(guó)內(nèi)第一款 AI 搜索來(lái)了!首發(fā)實(shí)測(cè):0廣告支持多輪追問(wèn)
大模型黑馬玩家昆侖萬(wàn)維推出國(guó)內(nèi)首款正式落地并投入應(yīng)用的獨(dú)立 AI 搜索產(chǎn)品 “天工 AI 搜索”。該搜索引擎通過(guò)大模型的理解能力,可以按整句分析用戶(hù)的真實(shí)意圖,提供精準(zhǔn)的答案。它在搜索結(jié)果展示中壓縮了傳統(tǒng)搜索的主要篇幅,只展示對(duì)回答問(wèn)題有參考價(jià)值的篩選后結(jié)果。
2.中風(fēng)癱瘓18年,AI 讓她再次「開(kāi)口說(shuō)話(huà)」!腦機(jī)接口模擬表情,數(shù)字化身當(dāng)嘴替
該文章報(bào)道了一項(xiàng)關(guān)于腦機(jī)接口和數(shù)字化身的研究,通過(guò)植入電極在中風(fēng)癱瘓患者的大腦表層下,使用人工智能算法將大腦信號(hào)轉(zhuǎn)化為單詞和語(yǔ)音,實(shí)現(xiàn)了她通過(guò)面部表情「說(shuō)話(huà)」的能力。研究團(tuán)隊(duì)還利用一個(gè)面部捕捉技術(shù)公司的軟件,創(chuàng)建了一個(gè)數(shù)字化身,能夠模擬患者的面部表情,并與大腦信號(hào)相匹配。這項(xiàng)研究為腦機(jī)接口技術(shù)的發(fā)展帶來(lái)了突破,為癱瘓患者重獲語(yǔ)言能力帶來(lái)了希望。
3.一覺(jué)睡醒,AI 破解驗(yàn)證碼的速度比我還快了?
加州大學(xué)艾爾文分校發(fā)布的一份論文顯示,AI 識(shí)別驗(yàn)證碼的速度已經(jīng)超過(guò)了人類(lèi),而且準(zhǔn)確率也更高。論文中對(duì)各種類(lèi)型的驗(yàn)證碼進(jìn)行了測(cè)試,結(jié)果發(fā)現(xiàn),AI 在最簡(jiǎn)單的點(diǎn)擊識(shí)別方面只需1.4秒,而人類(lèi)需要3-4秒。在更難的圖片驗(yàn)證中,AI 的速度和準(zhǔn)確度也接近人類(lèi)水平。然而,驗(yàn)證系統(tǒng)仍在不斷升級(jí),針對(duì) AI 的攻擊也在進(jìn)行防御。
4.圖像識(shí)別更準(zhǔn)確!全新自適應(yīng)計(jì)算模型 AdaTape
谷歌團(tuán)隊(duì)最新提出的自適應(yīng)計(jì)算模型 AdaTape 能夠提升圖像識(shí)別性能。AdaTape 使用自適應(yīng) tape 讀取機(jī)制來(lái)確定根據(jù)輸入的復(fù)雜性,添加到每個(gè)輸入中的不同數(shù)量的 tape token。通過(guò)在 ImageNet 上從頭開(kāi)始訓(xùn)練,研究人員發(fā)現(xiàn) AdaTape 在圖像分類(lèi)任務(wù)上表現(xiàn)更好,并且相對(duì)于其他自適應(yīng)基線(xiàn)更高效。該模型還具備歸納偏差的能力,能夠解決一些具有挑戰(zhàn)性的任務(wù)。
5.AI 戀人死亡時(shí),我淚流滿(mǎn)面
這篇文章講述了人與 AI 戀人的親密關(guān)系以及當(dāng) AI 戀人停止運(yùn)營(yíng)時(shí),人們所面臨的痛苦。人們通過(guò)定制化和交互來(lái)與 AI 戀人建立情感連接,感受到陪伴和理解。然而,與 AI 戀人的關(guān)系也存在著技術(shù)不透明性、倫理問(wèn)題以及商業(yè)化的難題。
6.那些你不知道的 AI 產(chǎn)品,正在海外悶聲賺大錢(qián)
國(guó)內(nèi)的 AI 創(chuàng)業(yè)者正在海外市場(chǎng)取得成功。不斷有 AI 產(chǎn)品出海賺得盆滿(mǎn)缽滿(mǎn)的消息傳出。已經(jīng)出圈的產(chǎn)品包括 AI 短視頻工具 Opus Clip、谷歌瀏覽器插件 Monica、ChatGPT for Google 等等。除了這些明星產(chǎn)品,還有很多不顯山露水、悶聲賺錢(qián)的小產(chǎn)品。國(guó)內(nèi) AI 創(chuàng)業(yè)者進(jìn)軍全球市場(chǎng)的力量正在崛起,中小創(chuàng)業(yè)團(tuán)隊(duì)和獨(dú)立開(kāi)發(fā)者是最具代表性的群體。他們通過(guò)垂直細(xì)分場(chǎng)景切入,接入大模型的 API,快速開(kāi)發(fā)小產(chǎn)品并進(jìn)行營(yíng)銷(xiāo)投放。
7.成為爆款的妙鴨,絕非阿里大文娛的偶然
阿里大文娛旗下的妙鴨相機(jī)在短短一個(gè)月內(nèi)成為國(guó)內(nèi) AIGC 領(lǐng)域的首個(gè)爆款 APP。妙鴨相機(jī)通過(guò)簡(jiǎn)單的操作和高質(zhì)量的數(shù)字分身照片生成功能,迅速贏得用戶(hù)的關(guān)注和喜愛(ài)。阿里大文娛通過(guò)回歸用戶(hù)、極致產(chǎn)品和敏捷組織等策略,推動(dòng)妙鴨相機(jī)的成功。
8.《蛋仔派對(duì)》重登游戲熱榜 真的是因?yàn)?AIGC?
《蛋仔派對(duì)》是一個(gè)專(zhuān)注女性玩家市場(chǎng)的手游,在2023年初爆火,并在之后連續(xù)5個(gè)月多次登上 App 下載量榜首。游戲通過(guò)提供地圖編輯器和 UGC 生態(tài),吸引了大量創(chuàng)作者加入,發(fā)布數(shù)量達(dá)到百萬(wàn)量級(jí),創(chuàng)作者數(shù)量達(dá)到千萬(wàn)級(jí)。雖然 AIGC 的 AI 創(chuàng)作工具為游戲增添了新的功能,但游戲本身的創(chuàng)作者生態(tài)和 UGC 模式才是其爆火的關(guān)鍵。