ChatGPT是什么
ChatGPT是由美國公司AI target=_blank class=infotextkey>OpenAI基于GPT—3.5架構(gòu)開發(fā)的大型語言模型,能夠生成各種不同的文本類型,可以針對對話場景進(jìn)行特別優(yōu)化,根據(jù)上下文自動生成跟人類一樣的對話文本。OpenAI在公司官網(wǎng)對ChatGPT產(chǎn)生方法進(jìn)行介紹時說,該模型是使用人類反饋強(qiáng)化學(xué)習(xí)訓(xùn)練而來,方法與Instruct GPT(OpenAI開發(fā)的一種“指令生成預(yù)訓(xùn)練”語言模型)一致,但在數(shù)據(jù)收集設(shè)置上略有不同。
ChatGPT工作的原理及技術(shù)架構(gòu)包括四方面內(nèi)容:
第一,生成基于GPT的模型(AI在海量數(shù)據(jù)下學(xué)習(xí)基于前后文生成后續(xù)文本能力),由于GPT模型會產(chǎn)生多個不同的輸出結(jié)果,例如:告訴GPT“世界上最大的平原是____”,可以給出“綠色的”“是無邊無盡的”“亞馬孫平原”等多個合理答案。
第二,引導(dǎo)方向,并監(jiān)督微調(diào)初始模型,通過前述問題,不難看出“亞馬孫平原”是最符合人類期望的答案,因此,開發(fā)者通過人工給出一些問題答案,進(jìn)而訓(xùn)練AI學(xué)習(xí),從而形成一個初始的ChatGPT模型。
第三,提升能力的獎勵模型。研究人員會讓GPT對特定問題給出多個答案,由人類進(jìn)行好壞排序,基于比較數(shù)據(jù)從而生成符合人類標(biāo)準(zhǔn)的回答模型。
第四,AI指導(dǎo)AI,強(qiáng)化學(xué)習(xí)。由于以上三步形成較為成熟AI,因此使用AI指導(dǎo)AI進(jìn)行強(qiáng)化學(xué)習(xí),不斷訓(xùn)練迭代,形成完整ChatGPT模型。
ChatGPT具有廣泛的知識儲備和強(qiáng)大的語言理解能力,讓翻譯、生成文案、分析文本等工作變得簡單,極大提升了工作效率。它還具有較強(qiáng)的自我學(xué)習(xí)及推理能力,也讓應(yīng)用場景變得多樣,不僅能夠從事文字工作,還能夠從事AI建模、語音交流、圖像生成等復(fù)雜工作。
聽到這里是不是很心動
chatgpt能幫我們做這么多事
但需要注意了
ChatGPT應(yīng)用可能產(chǎn)生安全風(fēng)險。
使用ChatGPT時可能
導(dǎo)致的安全風(fēng)險
使用ChatGPT面臨著較為嚴(yán)重的版權(quán)風(fēng)險。從ChatGPT生成框架來看,ChatGPT運(yùn)用大量不同的數(shù)據(jù)集訓(xùn)練形成大型語言模型,它的數(shù)據(jù)集可能來自受著作權(quán)保護(hù)的材料,若沒有經(jīng)過授權(quán),則可能存在侵犯他人作品復(fù)制權(quán)的問題。
從ChatGPT生成內(nèi)容來看,ChatGPT具有強(qiáng)大的語言重組和整理能力,當(dāng)用戶輸入特定命令時,若ChatGPT生成的內(nèi)容主旨與他人在先前作品獨(dú)創(chuàng)性表達(dá)存在部分或完全一致時,基于ChatGPT通過計算機(jī)傳播,且用戶可以在自己選定時間及地點(diǎn)獲取內(nèi)容,符合信息網(wǎng)絡(luò)傳播權(quán)構(gòu)成要件,因此存在作品信息網(wǎng)絡(luò)傳播權(quán)侵權(quán)風(fēng)險。
此外,ChatGPT作為典型的語言模型,它的模型訓(xùn)練需要海量的文本數(shù)據(jù)集,若開發(fā)公司為訓(xùn)練ChatGPT引入特定作者的作品進(jìn)行訓(xùn)練,在未經(jīng)相關(guān)著作權(quán)人許可情況下,當(dāng)用戶輸入特定命令時,ChatGPT生成的內(nèi)容若具有一定獨(dú)創(chuàng)性,且存在與在先作品的相似表達(dá),即便其可能會構(gòu)成演繹作品,但其生成內(nèi)容也為侵權(quán)作品;若開發(fā)公司訓(xùn)練ChatGPT時,從未引入特定作者的作品,只是由于用戶的特定問題使算法“預(yù)測”生成內(nèi)容時剛好與在先作品相同,則不構(gòu)成侵權(quán)。
因此,如何規(guī)制ChatGPT帶來的侵權(quán)風(fēng)險,大家還需要持續(xù)性的關(guān)注和思考。
來源:融媒體中心 深圳文化產(chǎn)權(quán)交易所