首頁 -> 國際

中國人工智能開源模型橫空出世 印媒:美國的限制失效了

分享到:
2025-01-03 18:32 | 稿件來源:香港新聞網

【字號:

香港新聞網1月3日電  2024年末,刷屏的中國技術成果不僅僅是“六代機”,還有人工智能(AI)模型DeepSeek-V3。這款語言模型不僅在性能上媲美西方頂級閉源模型,其低成本高效能的特點更是引發海內外AI業界的高度關注。有美國媒體表示,OpenAI、谷歌等行業巨頭的主導地位將面臨挑戰。

DeepSeek官方網站截圖

總部位於杭州的DeepSeek日前發佈了全新系列模型DeepSeek-V3首個版本,并同步開源。據了解,DeepSeek-V3在多項基準測試中超越了Meta開發的Llama-3.1,并在性能上與OpenAI開發的閉源模型GPT-4o不分伯仲。

值得注意的是,在較高性價比的訓練架構下,DeepSeek-V3的訓練成本僅為560萬美元,訓練時長只有兩個月,遠低於OpenAI模型GPT-4o愈1億美元的成本及三個月的訓練時長。

技術突破、性能優越、低成本……被冠以“AI界高效低價典範”的DeepSeek-V3迅速爆火,AI賽道上崛起的這股中國創新勢力在海內外掀起了廣泛熱議。

美國CNBC報道指,DeepSeek-V3的重要性體現在,谷歌、OpenAI等AI巨頭迄今為止耗費了數十億美元和大量時間來建立新的語言模型,但中國的DeepSeek帶來了另一個可能性——低成本高效能。

CNBC稱,DeepSeek這種具有競爭力的AI企業的出現,將使AI開發的進入壁壘降低,OpenAI、谷歌、Meta等在行業中的主導地位將面臨挑戰。

美國科技媒體Tom’s Hardware報道指,DeepSeek-V3的出現表明,儘管美國的制裁導致中國獲取硬件受限,但聰明的中國科技從業者正努力從有限的硬件裡提取最大性能。DeepSeek的成就表明,使用相對有限的資源訓練高級混合專家(MoE)模型的語言模型這一做法具有可行性。

《印度快報》評論道,隨著DeepSeek-V3這一技術創新成果的出現,美國對華芯片出口限制或許不如預期那般有效。

《分析印度》則指,考慮到DeepSeek-V3的高性能,美國過去幾年對華制裁似乎產生了反效果,獲取硬件的難度增大導致中國高度重視模型架構層面的優化。

該媒體還提到,DeepSeek-V3的出現還在社媒平台上引發了一些猜想,即如果一開始獲取芯片沒有受限,中國AI技術會到達何種程度。(編譯:李雪萍)

【編輯:李雪萍】

視頻

更 多
【通視街採】全球股市崩盤 香港股民怒罵特朗普
亞洲三項鐵人錦標賽香港開賽 過百位精英運動員雨中激情競逐
馬場黃金兩餸飯 清明祭祖也潮流
為什麼需要愛國教育?卓永興:中華民族是我們的根
全球第四!香港首季IPO集資額升287%
【通講壇】東部戰區開展聯合演訓,背後有這三點考量?
鄧炳強:感動市民明白維護國安重要性 現時香港仍面臨四大國安風險