Gemini 2.5 Deep Think 登場 推理能力直逼數奧金牌

Google最新Gemini 2.5 Deep Think模型,具數學奧林匹亞金牌實力,強調平行思考與長推論時間,現已開放付費用戶體驗。

兩個星期前,Google 和 OpenAI 分別宣佈其大語言模式 Gemini 和 GPT 測試結果等同國際數學奧林匹亞 (International Math Olympiad, IMO) 金牌。現在 Google 將把姐妹 Gemini 模型提供給大眾。

上周五 Google 宣佈 Gemini 應用程式將加入 Deep Think 功能提供給每月支付 250 美元,或是頭三個月支付 125 美元的用戶。這個版本是由 IMO 金牌的模型改編而來,但仍具備銅牌實力,而且執行日常任務的速度更快。

Gemini 解決困難問題的能力關鍵在於平行思考技術,讓 Gemini 得以同時產生回應內容,又能同時進行思考運算,甚至整合多個思維鏈以找出最佳解答。其他關鍵還包括更長的推論時間(又稱為思維時間),使 Deep Think 代理人得以研究更多選項再產生最後解答,以及新的強化學習 (reinforcement learning) 技術,使 Gemini 用得愈久,解題能力愈好。

Google 說,Deep Think 擅長疊代式開發與設計、科學與數學發現、以及程式撰寫,此等能力反映在 Gemini 2.5 Deep Think 在多個標竿測試的優異成績,包括測試多模態模型數理及人文知識的 Humanity’s Last Exam 。

Google 並說 Gemini 2.5 Deep Think 比 Gemini 2.5 Pro 更重視內容安全性及客觀的語氣表現,但缺點是它也更常拒絕用戶提出的無害要求。

現在,最高級版的 Deep Think 經由 Gemini App 提供給 Google AI Ultra 訂閱用戶。啟用方法是在使用 2.5 Pro 模型時,從選單啟用 Deep Think 功能。 Google 表示計畫未來幾周內將 Deep Think 從 Gemini API 提供給特定測試夥伴。

Google 並將具有數奧金牌能力的 Gemini 2.5 Deep Think 模型提供給部份數學家和研究人員以促進研究,同時蒐集專家使用意見。

來源:ZDNet

發表迴響

關於我們

自 1990 年創刊 UXmaster 雜誌,1991 年獲得美國 LAN Magazine 獨家授權中文版,2006 年獲得 CMP Network Computing 授權,2009 年合併 CMP Network Magazine 獨家授權中文版,2014 年轉型為《網路資訊》雜誌網站,為台灣中小企業協助技術領導者落實企業策略,了解網路規劃及應用,為企業網路應用、管理、 MIS 、 IT 人員必備之專業雜誌網站。


與我們聯絡

加入《網路資訊》雜誌社群

© Copyright 2025 本站版權所有,禁止任意轉載 網路資訊雜誌 / 心動傳媒股份有限公司 聯絡電話:+886 2 29432416

探索更多來自 網路資訊雜誌 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading

Secret Link