AI 運算更省錢!Gemini 2.5 Flash 讓企業決定是否打開推理功能

Google推出Gemini 2.5 Flash,首創「思考預算」功能,讓企業控制推理資源,提升效率、降低成本,並具備強大推理能力與彈性定價策略。

Google 上周發佈 Gemini 2.5 Flash,首度增加可讓企業控制模型「思考」用量功能,以減少運算資源。

Gemini 2.5 Flash 上周以預覽版在 Google AI Studio 及 Vertex AI 上線。 Gemini 2.5 Flash 主打推理能力,又能提供具競爭力的價格,是和 OpenAI 競爭的最新武器。

Gemini 2.5 Flash 加入了「思考預算」,可讓開發人員指明要配置多少運算資源給推理任務,由其解決複雜問題並回應用戶,必要時也可以關閉。這新方法可以解決當今 AI 市場最主要難題之一:進階推理的高延遲性與高成本的代價。

這種彈性顯示隨著 AI 逐漸嵌入企業應用,Google 轉向更實用路線。為 Gemini 2.5 Flash 加入開關推理功能後,Google 稱之為「第一個完全混合推理」的模型。

價格也跟有沒有開啟推理能力有關。 Gemini 2.5 Flash 輸入費用是每百萬 token 0.15 美元,輸出費用方面,關閉推理時每百萬 token 0.06 美元,但開啟推理時則大漲 6 倍至 3.5 美元。這差異化收費結構反映了「思考」耗運算的本質,因為模型會評估多道可能路徑,經過種種考量,最後才生成回應。

思考預算可以從 0 到 24,570 token 彈性調整,而非傳統模型固定於特定用量。 Google 表示,Gemini 2.5 Flash 可以依任務複雜度判斷需配置多少資源,以減少不必要的耗用。這種調整彈性讓企業可以依不同應用場景自訂 AI:簡單查詢工作像是翻譯或基本的資訊查詢時可以關閉推理,而在執行多步驟推理任務,像是解決數學題,或艱深分析時才啟用及微調推理功能。

另外,Google 宣稱 Gemini 2.5 Flash 雖然小,但在多項標竿測試中都超越同業。在評估推理和知識的 Humanity Last Exam 中,Gemini 2.5 Flash 得分為 12.1%,,超越 Anthropic Claude 3.7 Sonnet (8.9%) 和 DeepSeek R1 (8.6%),但遜於 o4-mini (14.3%) 。

另外,Gemini 2.5 Flash 也分別取得 GPQA diamond 78.3% 和 AIME 數學測驗 78.0% 的成績。產業分析師認為,Google 已經拉近和競爭者的距離了。

Google 宣佈美國所有大學生免費使用 Gemini Advanced,就可使用 Gemini 2.5 Flash 直到 2026 年春天。

Google 上周才宣佈將影片生成模型 Veo2 推向 Gemini Advanced,以及能將用戶上傳的圖片轉化成 8 秒影片的服務。

來源:VentureBeat

發表迴響

關於我們

自 1990 年創刊 UXmaster 雜誌,1991 年獲得美國 LAN Magazine 獨家授權中文版,2006 年獲得 CMP Network Computing 授權,2009 年合併 CMP Network Magazine 獨家授權中文版,2014 年轉型為《網路資訊》雜誌網站,為台灣中小企業協助技術領導者落實企業策略,了解網路規劃及應用,為企業網路應用、管理、 MIS 、 IT 人員必備之專業雜誌網站。


與我們聯絡

加入《網路資訊》雜誌社群

© Copyright 2025 本站版權所有,禁止任意轉載 網路資訊雜誌 / 心動傳媒股份有限公司 聯絡電話:+886 2 29432416

探索更多來自 網路資訊雜誌 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading

Secret Link