GitHub 推出 Copilot 用 AI 幫你寫出正確的程式
微軟旗下的 GitHub 及 OpenAI 本周釋出一項名為 Copilot 的 AI 工具,它內建於 Visual Studio 程式碼編輯器,還會自動補足程式碼。
GitHub 表示,Copilot 不只是會機械式重複它以前看過的程式碼,還會分析開發人員曾經寫過的程式碼,然後產生相應程式碼,包括以前呼叫過的函式。Copilot 專案的網站工具還包括撰寫匯入推文、畫散布圖 (scatterplot) 或加入 Goodreads 書櫃評分機制。
Copilot 可使用主流程式語言包括 Python、JavaScript、TypeScript、Ruby 和 Go。
GitHub 認為這是結隊程式設計 (Pair Programming) 的演進,結隊程式設計是兩名開發人員寫同一個專案,以便抓出彼此錯誤,加速開發流程。Copilot 中,其中一名開發人員就變成了 AI。
這項計畫是微軟 2019 年投資 OpenAI 10 億美元的第一項重大成果,目前是由 Y Combinator 總裁 Sam Altman 主導。在 Altman 接掌後,OpenAI 就從一個非營利研究機構變成一個「capped-profit」獲利模式,即可獲利扣除投資金額皆歸 OpenAI 所有。這讓 OpenAI 引進微軟投資,也授權 GPT-3 文字產生的 AI 演算法。
Copilot 採用的 OpenAI Codex 演算法,OpenAI CTO Greg Brockman 形容為 GPT-3 的後代。
GPT-3 是 OpenAI 旗艦語言產生演算法,可產生與人類寫作幾無二致的文字。它之所以那麼神奇,是因為使用了 1750 億個參數,使演算法得以在文字、字母、片語和句子之間建立關聯。GPT-3 產生英文語句,而 OpenAI Codex 是產生程式碼。
OpenAI 計畫今年夏天透過 API 釋出 Codex,供開發人員開發應用程式。
OpenAI 指出,Codex 是以數 TB GitHub 公開可取得的程式碼和英語範例來訓練。雖然 Copilot 可大幅提升生產力,但 GitHub 也表示,不是所有使用的程式碼都檢查過 bug、不安全的運作或是否有個資在內。雖然 Github 也提供一些過濾工具防止 Copilot 產生冒犯人的語言,但也不是萬無一失。
GitHub 還警告 Copilot 模型有可能會建議個人電子郵件、API 金鑰或電話號碼,不過從現有例子來看都是模型合成或隨機產生的假個資。但另一方面,Copilot 產生的程式碼都是原創的,和訓練資料集相同的程式碼比例僅 0.1%。
Copilot 目前僅開放少數人測試,但有興趣的人仍可上網註冊等待開放試用。
來源:The Verge