AI運算更省錢！Gemini 2.5 Flash讓企業決定是否打開推理功能

Google推出Gemini 2.5 Flash，首創「思考預算」功能，讓企業控制推理資源，提升效率、降低成本，並具備強大推理能力與彈性定價策略。

Google 上周發佈 Gemini 2.5 Flash，首度增加可讓企業控制模型「思考」用量功能，以減少運算資源。

Gemini 2.5 Flash 上周以預覽版在 Google AI Studio 及 Vertex AI 上線。 Gemini 2.5 Flash 主打推理能力，又能提供具競爭力的價格，是和 OpenAI 競爭的最新武器。

Gemini 2.5 Flash 加入了「思考預算」，可讓開發人員指明要配置多少運算資源給推理任務，由其解決複雜問題並回應用戶，必要時也可以關閉。這新方法可以解決當今 AI 市場最主要難題之一：進階推理的高延遲性與高成本的代價。

這種彈性顯示隨著 AI 逐漸嵌入企業應用，Google 轉向更實用路線。為 Gemini 2.5 Flash 加入開關推理功能後，Google 稱之為「第一個完全混合推理」的模型。

價格也跟有沒有開啟推理能力有關。 Gemini 2.5 Flash 輸入費用是每百萬 token 0.15 美元，輸出費用方面，關閉推理時每百萬 token 0.06 美元，但開啟推理時則大漲 6 倍至 3.5 美元。這差異化收費結構反映了「思考」耗運算的本質，因為模型會評估多道可能路徑，經過種種考量，最後才生成回應。

思考預算可以從 0 到 24,570 token 彈性調整，而非傳統模型固定於特定用量。 Google 表示，Gemini 2.5 Flash 可以依任務複雜度判斷需配置多少資源，以減少不必要的耗用。這種調整彈性讓企業可以依不同應用場景自訂 AI：簡單查詢工作像是翻譯或基本的資訊查詢時可以關閉推理，而在執行多步驟推理任務，像是解決數學題，或艱深分析時才啟用及微調推理功能。

另外，Google 宣稱 Gemini 2.5 Flash 雖然小，但在多項標竿測試中都超越同業。在評估推理和知識的 Humanity Last Exam 中，Gemini 2.5 Flash 得分為 12.1%，，超越 Anthropic Claude 3.7 Sonnet (8.9%) 和 DeepSeek R1 (8.6%)，但遜於 o4-mini (14.3%) 。

另外，Gemini 2.5 Flash 也分別取得 GPQA diamond 78.3% 和 AIME 數學測驗 78.0% 的成績。產業分析師認為，Google 已經拉近和競爭者的距離了。

Google 宣佈美國所有大學生免費使用 Gemini Advanced，就可使用 Gemini 2.5 Flash 直到 2026 年春天。

Google 上周才宣佈將影片生成模型 Veo2 推向 Gemini Advanced，以及能將用戶上傳的圖片轉化成 8 秒影片的服務。

來源：VentureBeat

AI 運算更省錢！Gemini 2.5 Flash 讓企業決定是否打開推理功能

相關

previousClaude 搶灘 Google Workspace 推出Reasearch與Workspace整合功能

next微軟推出「1-bit」AI 模型只需要CPU就跑得動，效能媲美主流系統

發表迴響取消回覆

相關

相關

previousClaude 搶灘 Google Workspace 推出Reasearch與Workspace整合功能

next微軟推出「1-bit」AI 模型 只需要CPU就跑得動，效能媲美主流系統

發表迴響取消回覆

相關

探索更多來自 網路資訊雜誌 的內容

next微軟推出「1-bit」AI 模型只需要CPU就跑得動，效能媲美主流系統

探索更多來自網路資訊雜誌的內容