近日,谷歌正式推出了Gemini 2.5系列,其中實驗版Gemini 2.5 Pro在多項基準測試中均展現(xiàn)了最先進水平,并以顯著優(yōu)勢登頂LMArena排行榜首位。
Gemini 2.5系列的一大亮點在于其具備的思維鏈推理能力。在處理任務時,該模型會先進行系統(tǒng)化思考推演,類似于人類面對復雜問題時的深入分析方式。這種思考方式使Gemini 2.5系列在性能提升和準確性增強方面取得了顯著成效。
Gemini 2.5 Pro作為該系列的重要版本,支持多種輸入模式,包括文本、圖像、音頻、視頻以及代碼,能夠輕松解析各種類型的信息。其上下文窗口高達100萬token,相當于約75萬單詞,足以解析長篇巨著。谷歌還計劃進一步升級這一能力,將上下文窗口擴大至200萬token,以在處理跨模態(tài)復雜問題時展現(xiàn)出更大優(yōu)勢。
目前,Gemini 2.5 Pro已正式登陸谷歌AI Studio開發(fā)平臺及Gemini應用生態(tài)中的Gemini Advanced用戶專區(qū),支持移動端與桌面端。開發(fā)者與企業(yè)用戶可以立即接入體驗這一強大的模型,并將其應用于智能客服、數據分析、內容創(chuàng)作等多種實際場景中。
值得一提的是,Gemini 2.5 Pro在不采用增加計算成本的測試階段技術(如多數投票)的情況下,已在GPQA(通用問題解答評估)與2025年AIME(國際數學邀請賽)等數學與科學類基準測試中排名榜首,展現(xiàn)了其卓越的高級推理能力。