消息人士及一份內部文件顯示,OpenAI 正在推動一個自主研究的 AI 模型及代理人程式的開發新式方法,代號為 Strawberry 。
媒體在五月取得的一份內部文件顯示, Strawberry 專案目的是開發能從事研究的 AI 系統,它不只能依用戶需求查詢並產生答案,而是能夠事前規劃、自主搜尋網路,並執行該公司稱為「深度研究 (deep research)」的任務。這是目前 AI 模型尚力有未逮的。
Strawberry 專案之前名為 Q*,消息人士指出,當時訓練出的 AI 模型已經能回答現今 AI 模型無法回答的複雜科學及數學問題。
Strawberry 的開發,是為了解決現有 AI 模型欠缺進階理解能力的問題,以便能從事更複雜的任務,從科學發現到規劃、打造新式軟體。路透社報導,Strawberry 的訓練方法是在一組大型資料集預訓練後,再以特定領域的資料進行後訓練,以提升其在專門領域的理解能力。
而 Strawberry 使用的訓練方式也和史丹佛大學 2022 年開發自我學習理解者 (Self-Taught Reasoner, STaR) 很類似,後者是藉由反覆建立自己的訓練資料,以不斷將自己的智能推升到更高水準,理論上可用來改良 AI 語言模型的智慧水準。
OpenAI 特別希望其模型能使用「深度研究」的能力,利用電腦代理程式自主搜尋網路資料進行研究,並根據研究結果採取行動。 OpenAI 也計畫讓它做做軟體和機器學習工程師做的工作。
不過 Strawberry 何時會推出,以及會以何種面貌問世,目前不得而知。 OpenAI 官方沒有證實 Strawberry 專案,但是說,長期以來該公司一直投入 AI 訓練,理論上是會不斷提高 AI 的理解能力。
來源:路透社
