身為 AI 服務供應商之一的 Google,雖然過去幾年在自家的產品與服務上加上 AI 功能,但在 Generative AI 服務方面,顯然落後微軟支持的 OpenAI 所推出的 ChatGPT,該服務於 2022 年 11 月 30 日正式面市,而 Google 所發展的 Bard 則是在 2023 年 3 月才在英美兩國推出測試版,遲至 2023 年 7 月才開始大規模支援包括繁體中文等 40 個以上的語系。

帶領 Google 大型語言模型 (LaMDA/Bard) 發展的 Google DeepMind 傑出科學家紀懷新,表示 Google 在 2011 年建立 Google Brain 團隊發展 AI 技術,當時主要是用 Deep Learning 技術在 YouTube 與 Android Phone 的 App Store 建立推薦系統。
「在當時,所有的 AI 或語言模型都是分工合作的概念,像是翻譯和摘要都有專門的模型。然而,現在的發展趨勢是將所有功能放在一個大型語言模型中,因此出現了 LaMDA 這種可以執行多個任務的模型。」紀懷新解釋:「因此,Google 於 2022 年在 I/O 大會上發表了 LaMDA 模型,以 137 億個參數預先訓練,更重要的是這個 LLM 模型知道如何使用 Google 搜尋引擎。」

前述提到,Bard 從 7 月才開始支援 40 種以上語言,包括繁體中文。雖然晚於競爭對手,但紀懷新則強調 Bard 的獨特之處,在於可即時搜尋網路資料,提供出處的能力。
紀懷新表示,Bard 能夠深入理解不同的語言,而不只是相互翻譯而已,而是透過 Google 搜尋引擎的龐大資料為基礎,Bard 甚至可以對其翻譯作出解釋。例如,對於特定的德文諺語,Bard 不會按照字面翻譯,而是根據其背後的文化含義和用法,翻譯出正確的涵義。
此外,Bard 的另一個有趣功能是提供三個不同的答案選擇。使用者可以根據需求選擇最合適的答案。多模態的輸入和輸出也允許使用者輸入圖像,由 Bard 以文字解釋說明圖像畫面。

紀懷新也承認目前所有的 Generative AI 都有所謂的 AI 幻覺問題,也就是 AI 會提供「事實上不存在的資訊」。面對 AI 幻覺,紀懷新再次強調 Bard 透過存取 Google 搜尋引擎的能力來消除此問題。
當 Bard 輸出回答之前,將會先把使用者的提問送到搜尋引擎進行真實性判斷,再交給 Bard 進行回答。然而,該如何判斷真實性,是非常困難的事情。紀懷新表示 Google 透過搜尋引擎的資料,來提高 Bard 回答的真實性,「Bard 對於所輸出的回答,會提供資料出處,以便於使用者查證資訊。」
換言之,Google 對於 Bard 的能力採取謹慎樂觀的態度,呼籲使用者不應該全然倚賴相信 AI 所產生的結果,而是必須保持著懷疑與驗證的態度。
在建置 AI 訓練與推論的大型資料中心方面,紀懷新表示 Google 並不倚靠常見的 GPU 架構,而是採用 Google 自行開發的 TPU,畢竟 AI 運算需要硬體晶片對於深度學習演算法的理解,才能達到最佳的運算效率。
最後,紀懷新提到 Google DeepMind 正在開發的下一代 LLM:Gemini 模型,並表示 Gemini 是 Google DeepMind 非常重要的大型專案,未來 Bard 將會採用 Gemini 作為背後的 LLM 。

