IT之家 8 月 23 日消息, AI target=_blank class=infotextkey>OpenAI 在官網宣布,推出 GPT-3.5Turbo 微調功能并更新 API,使企業、開發人員可以使用自己的數據,結合業務用例構建專屬 ChatGPT。
OpenAI 聲稱,這樣定制的模型可以在某些任務上達到或超過 GPT-4 的能力。該公司還表示,GPT-4 的微調功能將于今年秋天推出。
OpenAI 公司在博客文章中寫道:“自 GPT-3.5 Turbo 發布以來,開發人員和企業都要求能夠定制模型,為用戶創造獨特且差異化的體驗。此更新使開發人員能夠定制更適合其用例的模型,并大規模運行這些定制模型。”
通過微調,通過 OpenAI 的 API 使用 GPT-3.5 Turbo 的公司可以使模型更好地遵循指令,例如讓它始終以給定的語言進行響應。或者,他們可以提高模型一致地格式化響應的能力(例如,用于完成代碼片段),以及磨練模型輸出的“感覺”,例如它的語氣,以便它更好地適合品牌。
此外,微調使 OpenAI 客戶能夠縮短文本提示詞,以加快 API 調用并降低成本。OpenAI 在博客文章中聲稱:“早期測試人員通過對模型本身的指令進行微調,將提示詞大小減少了 90%。”
目前微調需要準備數據、上傳必要的文件并通過 OpenAI 的 API 創建微調作業。該公司表示,所有微調數據都必須通過“審核”API 和 GPT-4 支持的審核系統,以查看是否與 OpenAI 的安全標準相沖突。但 OpenAI 計劃在未來推出一個微調 UI,其中包含一個儀表板,用于檢查正在進行的微調工作負載的狀態。
微調成本如下:
- 訓練:0.008 美元 / 1K tokens
- 使用輸入:0.012 美元 / 1K tokens
- 使用輸出:0.016 美元 / 1K tokens
OpenAI 表示,包含 100,000 個 token(約 75,000 個單詞)的訓練文件的 GPT-3.5-turbo 微調工作將花費約 2.40 美元(IT之家備注:當前約 18 元人民幣)。
此外,OpenAI 今天提供了兩個更新的 GPT-3 基本模型(babbage-002 和 davinci-002),它們也可以進行微調,支持分頁和“更多可擴展性”。正如之前宣布的,OpenAI 計劃于 2024 年 1 月 4 日停用初代 GPT-3 基礎模型。
OpenAI 表示,對 GPT-4 的微調支持(與 GPT-3.5 不同,GPT-4 可以理解除文本之外的圖像)將于今年秋季晚些時候發布,但沒有提供除此之外的具體信息。