阿里通義千問發布最新推理模型股價大漲 | 內地 - 香港中通社

2025年04月25日星期五繁简

首頁 -> 內地

阿里通義千問發布最新推理模型股價大漲

分享到：

分享到微信

分享到微博

分享到Twitter

分享到Facebook

分享到QQ

2025-03-06 18:25 | 稿件來源：香港中通社

【字號：大中小】

香港中通社3月6日電中國阿里巴巴集團旗下通義千問大模型團隊6日宣布，正式推出最新的推理模型QwQ-32B。據通義千問大模型團隊介紹，這是一款擁有320億參數的模型，其性能可與具備6710億參數（其中370億被激活）的DeepSeek-R1媲美。

圖為阿里巴巴集團總部——杭州西溪園區內一角。新華網資料圖

在數學推理、編程能力和通用能力的一系列基準測試中，通義千問大模型團隊將QwQ-32B與美國科企OpenAI的o1-mini以及中國科企DeepSeek滿血版及蒸餾版進行了比較，結果顯示，在測試數學能力的AIME24評測集上，以及評估代碼能力的LiveCodeBench中，QwQ-32B表現與DeepSeek-R1相當，遠勝於o1-mini及相同尺寸的R1蒸餾模型。

至於為何能夠實現這一點，奧秘仍在於大規模強化學習的方法。據介紹，在冷啟動基礎上，阿里通義團隊針對數學和編程任務、通用能力分別進行了兩輪大規模強化學習。在初始階段，特別針對數學和編程任務進行了強化學習訓練。與依賴傳統的獎勵模型不同，通義千問大模型團隊通過校驗生成答案的正確性來為數學問題提供反饋，並通過代碼執行服務器評估生成的代碼是否成功通過測試用例來提供代碼的反饋。

目前，阿里已採用寬鬆的Apache2.0協議，將QwQ-32B模型向全球開源。

QwQ-32B面世後，6日，阿里巴巴港股股價升逾8%。

2月底，阿里剛宣布全面開源旗下視頻生成模型萬相2.1模型。1月底，阿里通義千問宣布開源兩款大模型Qwen2.5-VL和Qwen2.5-1M。（完）

【編輯：馬華】

相關新聞

中國阿里巴巴推全模态AI模型　可處理音頻視頻及手機上用

Manus橫空出世！台輿論：對普通人更適用，說明大陸不止DeepSeek

中國AI開源模型推動全球共享智能紅利

DeepSeek-R1多芯片版本開源

AI競爭愈發激烈：馬斯克剛發佈Grok 3，DeepSeek跟著發重磅論文

性能超過Deepseek！蘋果選擇阿里巴巴合作開發AI功能

DeepSeek到底什麼水平？

專訪AI專家：資金是香港“DeepSeek級”大模型的東風

華為騰訊阿里百度等上線DeepSeek大模型

DeepSeek異軍突起　中國AI大爆發

中國DeepSeek橫空出世，外媒讚其“震動硅谷”

中國新AI大模型DeepSeek登頂美國APP排行榜

視頻

更多

香港救援隊緬甸地震搜救背後的故事

【通講壇】新加坡教授：對華關稅戰暴露美國製造業“軟肋”　中國要爭取產業話語權

Web3頂級音樂會香港開唱　黃貫中陳慧琳等大咖雲集

一場香港美聲慈善音樂會　奏響基層“閃耀之星”的藝術夢

過萬人一起吃盆菜是種什麼體驗？現場市民：場面震撼　氣氛很好

新加坡學者：中國製造業的競爭力恰恰在於它不夠高端　這能讓中國至少再吃10到20年紅利

四月的香港“科技含量”爆滿　最新科創產品和全球科技菁英齊匯聚

來論

更多

論壇

更多

圖集

更多

香港勞工處舉行勞動節酒會

關稅戰下的香港樓市：正負面影響交替

5月10日香港53間戲院票價統一30港元

閱讀排行

友情鏈接

關於我們

Copyright © 2009-2023 All Rights Reserved 香港中國通訊社有限公司版權所有

承印人：香港中國通訊社有限公司

承印地址: 香港南區黃竹坑道21號環匯廣場30樓

Tel: (+852) 28561919 Fax: (+852) 25647453