當(dāng)前位置：首頁 > 新聞 > 熱點資訊 > AI大模型高考評測：語英成績優(yōu)異，數(shù)學(xué)全軍覆沒

AI大模型高考評測：語英成績優(yōu)異，數(shù)學(xué)全軍覆沒

2024-06-20 10:09:13 標(biāo)簽：AI 高考

　　據(jù)新浪科技報道，上海人工智能實驗室旗下的司南評測體系OpenCompass對七個大型語言模型進(jìn)行了高考“語數(shù)外”全卷能力測試，并發(fā)布了首個大模型高考全卷評測結(jié)果。

　　此次測試的語文、數(shù)學(xué)和英語三科總分為420分。測試結(jié)果顯示，阿里巴巴的通義千問2-72B以303分的成績排名第一，OpenAI的GPT-4以296分緊隨其后，位居第二。上海人工智能實驗室的書生浦語2.0排名第三。這三個大模型的得分率均超過70%。法國初創(chuàng)公司Mistral的大模型排名末尾。

AI大模型高考評測：語英成績優(yōu)異，數(shù)學(xué)全軍覆沒

　　從測試結(jié)果來看，大模型在語文和英語考試中的表現(xiàn)普遍較好，但在數(shù)學(xué)科目上表現(xiàn)欠佳，最高分僅為75分，全部未能及格。

AI大模型高考評測：語英成績優(yōu)異，數(shù)學(xué)全軍覆沒

推薦內(nèi)容

《潛行者2》PC版優(yōu)化問題 30系顯卡似乎全軍覆沒
備受矚目的《潛行者2》現(xiàn)已正式解鎖并發(fā)售，Steam國區(qū)標(biāo)準(zhǔn)版售價為268元人民幣，并且貼心地配備了簡體中文界面。游戲一經(jīng)上市便受到了廣大玩家的熱烈關(guān)注，目前在Steam平臺上收獲了“多半好評”的評價，總計3992篇評價中好評率高達(dá)77%。然而，在中文區(qū)域，該游戲的評價略顯低迷，好評率僅為61%，呈現(xiàn)出“褒貶不一”的局面。
2024-11-21
丹麥研究：AI模型利用生活數(shù)據(jù)精準(zhǔn)預(yù)測死亡時間
最近，一項由丹麥技術(shù)大學(xué)和哥本哈根大學(xué)領(lǐng)導(dǎo)的研究揭示了一個引人注目的發(fā)現(xiàn)，即利用大量個人生活數(shù)據(jù)（包括教育、職業(yè)、住房、收入、健康等方面）來訓(xùn)練大型生成式語言模型，例如ChatGPT，這類人工智能模型可以以高精度預(yù)測一個人未來生活的發(fā)展，甚至能夠估計死亡的時間點。
2023-12-21
40系N卡用戶將從幀生成新AI模型中受益
　　英偉達(dá)員工Jacob Freeman透露，新一代40系列NVIDIA顯卡的用戶將能夠從一項創(chuàng)新的AI模型中獲益。這項新AI模型將被集成到DLSS 3中，并支持所有RTX 40系列顯卡。
2025-01-15
Google推出史上最卓越的AI模型-Gemini 2.0
　　今日，科技領(lǐng)域傳來重磅消息，谷歌正式推出了專為新時代智能體設(shè)計的下一代AI模型——Gemini 2.0。這一發(fā)布標(biāo)志著谷歌在AI領(lǐng)域又邁出了重要一步。
2024-12-12
高手玩家以木質(zhì)匠心制作鋼普拉模型
　　鋼普拉因其精巧細(xì)致而聞名，然而，一些熱衷的玩家已經(jīng)將這一愛好推向了新的高度，他們親手制作的全木質(zhì)版鋼普拉不僅擁有獨特的韻味，而且在性能上也不遜于官方版本。
2025-01-14