DeepSeek發布V3模型　編程能力大幅提升 | 內地 - 香港中通社

2025年04月02日星期三繁简

首頁 -> 內地

DeepSeek發布V3模型　編程能力大幅提升

分享到：

分享到微信

分享到微博

分享到Twitter

分享到Facebook

分享到QQ

2025-03-25 17:25 | 稿件來源：香港中通社

【字號：大中小】

香港中通社3月25日電中國初創公司深度求索（DeepSeek）發布了V3模型更新，加強了模型的編程能力，顯示這家公司希望在人工智能（AI）激烈競爭中保持領先優勢。

DeepSeek 香港中通社資料圖

綜合媒體25日報道，AI開源模型DeepSeek-V3的版本更新V3-0324於北京時間3月24日深夜在AI開源平台HuggingFace上線。DeepSeek沒有為此次版本更新發布任何公告，延續了該公司的低調風格。

據悉，初代DeepSeek-V3發布於去年12月26日，這款模型自上線後便以高性價比火速“出圈”。根據官方技術披露，DeepSeek-V3模型的總訓練成本為557.6萬美元，而GPT-4o等模型的訓練成本約為1億美元。

更新後的DeepSeek-V3模型大小為641GB，參數量6850億。與V3相同，V3-0324模型採用專家混合（MoE）架構，並開源允許自由商用。

此次DeepSeek發布的V3版本更新，編程能力的優化成了最大亮點。有網民使用V3-0324模型編寫800多行代碼，全程沒有出現任何故障。

有AI研究者在X發布評測指出，V3-0324模型在所有基準測試中都取得巨大進步，可能已超越美國Anthropic的Claude Sonnet 3.5，成為最強大的非推理模型。Sonnet 3.5是當前最受認可的商業AI模型之一。（完）

【編輯：彭玉婷】

相關新聞

DeepSeek橫空出世改變AI生態系？台專家：這一註解挺有說服力

港嶺大ChatGPT門戶網站接入DeepSeek-R1助教與學

AI競爭愈發激烈：馬斯克剛發佈Grok 3，DeepSeek跟著發重磅論文

DeepSeek熱度一路“狂飆”：微信等大型科企政企不斷接入

百度智能雲千帆上架DeepSeek模型推限時免費

性能超過Deepseek！蘋果選擇阿里巴巴合作開發AI功能

DeepSeek到底什麼水平？

華為騰訊阿里百度等上線DeepSeek大模型

DeepSeek異軍突起　中國AI大爆發

中國DeepSeek橫空出世，外媒讚其“震動硅谷”

中國新AI大模型DeepSeek登頂美國APP排行榜

中國大模型DeepSeek為何會讓Meta恐慌？

視頻

更多

東江水供港60年　李家超：是國家與香港血濃於水的深情典範

中國發展高層論壇剛結束　這家跨國企業就宣布在香港投資3億

香港七人欖球賽2025　超11萬次觀眾入場　遊客大讚香港是最棒的！

記者帶你走一圈！看首次於香港啟德體育園舉辦的七欖氣氛如何？

"這些技術關乎人民幸福"——中國數字基建出海，給世界帶來了什麼？

《哪吒3》將全部由AI剪輯？哪吒項目執行製片人帶來解答

被問及投資者為何選擇香港　陳茂波這樣回答......

來論

更多

論壇

更多

圖集

更多

張國榮逝世22周年　大批粉絲到香港中環悼念

國際水務領袖高峰論壇開幕　特首李家超致辭

香港多批市民強烈反對美國政府干涉香港事務和中國內政

閱讀排行

友情鏈接

關於我們

Copyright © 2009-2023 All Rights Reserved 香港中國通訊社有限公司版權所有

承印人：香港中國通訊社有限公司

承印地址: 香港南區黃竹坑道21號環匯廣場30樓

Tel: (+852) 28561919 Fax: (+852) 25647453