微軟旗下的 GitHub 及 OpenAI 本周釋出一項名為 Copilot 的 AI 工具,它內建於 Visual Studio 程式碼編輯器,還會自動補足程式碼。
GitHub 表示,Copilot 不只是會機械式重複它以前看過的程式碼,還會分析開發人員曾經寫過的程式碼,然後產生相應程式碼,包括以前呼叫過的函式。 Copilot 專案的網站工具還包括撰寫匯入推文、畫散布圖 (scatterplot) 或加入 Goodreads 書櫃評分機制。
Copilot 可使用主流程式語言包括 Python 、 JavaScript 、 TypeScript 、 Ruby 和 Go 。
GitHub 認為這是結隊程式設計 (Pair Programming) 的演進,結隊程式設計是兩名開發人員寫同一個專案,以便抓出彼此錯誤,加速開發流程。 Copilot 中,其中一名開發人員就變成了 AI 。
這項計畫是微軟 2019 年投資 OpenAI 10 億美元的第一項重大成果,目前是由 Y Combinator 總裁 Sam Altman 主導。在 Altman 接掌後,OpenAI 就從一個非營利研究機構變成一個「capped-profit」獲利模式,即可獲利扣除投資金額皆歸 OpenAI 所有。這讓 OpenAI 引進微軟投資,也授權 GPT-3 文字產生的 AI 演算法。
Copilot 採用的 OpenAI Codex 演算法,OpenAI CTO Greg Brockman 形容為 GPT-3 的後代。
GPT-3 是 OpenAI 旗艦語言產生演算法,可產生與人類寫作幾無二致的文字。它之所以那麼神奇,是因為使用了 1750 億個參數,使演算法得以在文字、字母、片語和句子之間建立關聯。 GPT-3 產生英文語句,而 OpenAI Codex 是產生程式碼。
OpenAI 計畫今年夏天透過 API 釋出 Codex,供開發人員開發應用程式。
OpenAI 指出,Codex 是以數 TB GitHub 公開可取得的程式碼和英語範例來訓練。雖然 Copilot 可大幅提升生產力,但 GitHub 也表示,不是所有使用的程式碼都檢查過 bug 、不安全的運作或是否有個資在內。雖然 Github 也提供一些過濾工具防止 Copilot 產生冒犯人的語言,但也不是萬無一失。
GitHub 還警告 Copilot 模型有可能會建議個人電子郵件、 API 金鑰或電話號碼,不過從現有例子來看都是模型合成或隨機產生的假個資。但另一方面,Copilot 產生的程式碼都是原創的,和訓練資料集相同的程式碼比例僅 0.1% 。
Copilot 目前僅開放少數人測試,但有興趣的人仍可上網註冊等待開放試用。
來源:The Verge
