在 2024 年的 Google I/O 大會上,Google 執行長 Sundar Pichai 強調了人工智慧 (AI) 的重要性,整場活動共提及「AI」多達 121 次。這場在加州山景城 Shoreline 露天劇場舉行的年度開發者大會,著重於將 AI 技術融入到全球超過 20 億人使用的 Google 應用和服務中。以下是大會上公布的主要更新內容。
本文目錄
推出新模型 Gemini 1.5 Flash 與 Gemini 1.5 Pro 最新消息

Google 宣布了一款全新的 AI 模型-Gemini 1.5 Flash,該模型最佳化了速度和效率,定位介於 Gemini 1.5 Pro 和最小的本機端專用模型 Gemini 1.5 Nano 之間。 Flash 應開發者需求而生,提供比 Pro 版本更輕便且成本更低的選擇,同時保留了一些特性如百萬級 Token 文字額度等。 Google 預計在今年稍晚將 Gemini 的文字處理額度擴充至 200 萬個 Token,使其能夠同時處理長達 2 小時的影片、 22 小時的音訊、超過 6 萬行程式碼或超過 140 萬字的文件。
Project Astra

Google 展示了 Project Astra,這是一個由 AI 驅動的通用助手,能在日常生活中提供幫助。 Astra 可透過手機鏡頭識別周圍環境,並與用戶進行自然對話。在展示影片中,用戶在 Google 倫敦辦公室移動時,Astra 能告知她眼鏡的位置,且眼鏡本身內建鏡頭,可與 Astra 自然互動,這暗示了 Google 可能正在開發類似 Meta Ray-Ban 智慧眼鏡的競爭產品。
Google Photos新功能

Google Photos 將利用 AI 提升搜尋能力,並開放美國的 Google One 用戶使用新的功能。使用者可輸入複雜的問題如「找出我造訪過的每個國家公園中的最佳照片」來搜尋圖片。這項功能結合了 GPS 資訊和 AI 判斷,將於未來幾個月內推出。 Google Photos 還能產生標題,方便用戶將照片發布到社交媒體。
Veo 和 Imagen 3

Google 推出了新的 AI 驅動媒體創作引擎 Veo 和 Imagen 3 。 Veo 能產生「高品質」的 1080p 解析度影片,並理解電影概念如延時攝影。 Imagen 3 是一款文字轉圖片產生器,其性能優於前一版本 Imagen 2,能產生細節豐富的逼真圖片,與 OpenAI 的 DALLE-3 競爭。
Google 搜尋重大更新

Google 對搜尋功能進行了重大變革。 AI 產生的答案將預設顯示在搜尋結果頂部,並計劃在年底前向全球超過 10 億用戶推出。這些更新將使搜尋能回答複雜問題,並用於規劃膳食和假期。
Gemini 與 Android 整合

在今年稍晚推出的 Android 15 中,Google 將直接整合 Gemini,能夠在應用、圖片或影片中提供上下文相關的回答。此舉可能會取代現有的 Google Assistant 。
Google Lens 新功能
Google Lens 新增了錄製影片搜尋的功能。用戶可以拍攝影片並提問,Google 的 AI 將試圖從網路上找出相關答案。
Circle to Search
在 Android 設備上,用戶現在可以圈出螢幕上的數學問題並獲得解答步驟。 Google 的 AI 不會直接提供答案,但會一步步解釋問題,協助用戶理解解題過程。
其他更新
Google 還宣布了多項更新,包括為 AI 產生的影片和文字添加數字浮水印,將 Gemini 整合到 Gmail 和 Docs 的側邊欄,並在 Workspace 中提供虛擬 AI 隊友。此外,Google 推出了電話詐騙偵測工具,並計劃進一步拓展 Gemini 的功能。
