首頁 -> 內地

阿里通義千問發布最新推理模型 股價大漲

分享到:
2025-03-06 18:25 | 稿件來源:香港中通社

【字號:

香港中通社3月6日電 中國阿里巴巴集團旗下通義千問大模型團隊6日宣布,正式推出最新的推理模型QwQ-32B。據通義千問大模型團隊介紹,這是一款擁有320億參數的模型,其性能可與具備6710億參數(其中370億被激活)的DeepSeek-R1媲美。

圖為阿里巴巴集團總部——杭州西溪園區內一角。新華網資料圖

在數學推理、編程能力和通用能力的一系列基準測試中,通義千問大模型團隊將QwQ-32B與美國科企OpenAI的o1-mini以及中國科企DeepSeek滿血版及蒸餾版進行了比較,結果顯示,在測試數學能力的AIME24評測集上,以及評估代碼能力的LiveCodeBench中,QwQ-32B表現與DeepSeek-R1相當,遠勝於o1-mini及相同尺寸的R1蒸餾模型。

至於為何能夠實現這一點,奧秘仍在於大規模強化學習的方法。據介紹,在冷啟動基礎上,阿里通義團隊針對數學和編程任務、通用能力分別進行了兩輪大規模強化學習。在初始階段,特別針對數學和編程任務進行了強化學習訓練。與依賴傳統的獎勵模型不同,通義千問大模型團隊通過校驗生成答案的正確性來為數學問題提供反饋,並通過代碼執行服務器評估生成的代碼是否成功通過測試用例來提供代碼的反饋。

目前,阿里已採用寬鬆的Apache2.0協議,將QwQ-32B模型向全球開源。

QwQ-32B面世後,6日,阿里巴巴港股股價升逾8%。

2月底,阿里剛宣布全面開源旗下視頻生成模型萬相2.1模型。1月底,阿里通義千問宣布開源兩款大模型Qwen2.5-VL和Qwen2.5-1M。(完)

【編輯:馬華】

視頻

更 多
台籍全國人大代表陳雲英:“大陸那邊不好”這樣的謊言能夠持續多久?
啟德體育園首場迎桌球頂尖賽事 世一卓林普香港首次主場告勝
(2025中國兩會)霍啟剛:在政府工作報告中看到香港機遇 32頁全文我要好好琢磨
港澳特首人大開幕會後互爲攝影師 與港澳代表委員親密互動
在中國兩會尋找答案|高科技產業飛速發展,中國的傳統行業能轉型成功嗎?
“老街坊”劉德華驚喜現身啟德體育園開幕禮 市民大讚場館頂級
世界數字科學院為何選定香港建“亞太研究院”?