Google 上周發佈 Gemini 2.5 Flash,首度增加可讓企業控制模型「思考」用量功能,以減少運算資源。
Gemini 2.5 Flash 上周以預覽版在 Google AI Studio 及 Vertex AI 上線。 Gemini 2.5 Flash 主打推理能力,又能提供具競爭力的價格,是和 OpenAI 競爭的最新武器。
Gemini 2.5 Flash 加入了「思考預算」,可讓開發人員指明要配置多少運算資源給推理任務,由其解決複雜問題並回應用戶,必要時也可以關閉。這新方法可以解決當今 AI 市場最主要難題之一:進階推理的高延遲性與高成本的代價。
這種彈性顯示隨著 AI 逐漸嵌入企業應用,Google 轉向更實用路線。為 Gemini 2.5 Flash 加入開關推理功能後,Google 稱之為「第一個完全混合推理」的模型。
價格也跟有沒有開啟推理能力有關。 Gemini 2.5 Flash 輸入費用是每百萬 token 0.15 美元,輸出費用方面,關閉推理時每百萬 token 0.06 美元,但開啟推理時則大漲 6 倍至 3.5 美元。這差異化收費結構反映了「思考」耗運算的本質,因為模型會評估多道可能路徑,經過種種考量,最後才生成回應。
思考預算可以從 0 到 24,570 token 彈性調整,而非傳統模型固定於特定用量。 Google 表示,Gemini 2.5 Flash 可以依任務複雜度判斷需配置多少資源,以減少不必要的耗用。這種調整彈性讓企業可以依不同應用場景自訂 AI:簡單查詢工作像是翻譯或基本的資訊查詢時可以關閉推理,而在執行多步驟推理任務,像是解決數學題,或艱深分析時才啟用及微調推理功能。
另外,Google 宣稱 Gemini 2.5 Flash 雖然小,但在多項標竿測試中都超越同業。在評估推理和知識的 Humanity Last Exam 中,Gemini 2.5 Flash 得分為 12.1%,,超越 Anthropic Claude 3.7 Sonnet (8.9%) 和 DeepSeek R1 (8.6%),但遜於 o4-mini (14.3%) 。
另外,Gemini 2.5 Flash 也分別取得 GPQA diamond 78.3% 和 AIME 數學測驗 78.0% 的成績。產業分析師認為,Google 已經拉近和競爭者的距離了。
Google 宣佈美國所有大學生免費使用 Gemini Advanced,就可使用 Gemini 2.5 Flash 直到 2026 年春天。
Google 上周才宣佈將影片生成模型 Veo2 推向 Gemini Advanced,以及能將用戶上傳的圖片轉化成 8 秒影片的服務。
來源:VentureBeat
