聽新聞
0:00 /
0:00
GPT-5發布 傳DeepSeek將推R2

在OpenAI最新推出的旗艦語言模型GPT-5發布後,大陸AI新創企業DeepSeek就要出招了。12日市場上突然傳出,DeepSeek-R2大模型的預計發布時間為2025年8月15日至8月30日,但具體日期尚未官宣。
DeepSeek-R2模型發布在即,A股晶片股聞訊集體爆發。大陸「國產AI晶片第一股」、被視為替代輝達晶片之一的寒武紀直升20%漲停,站穩人民幣800元大關,股價創歷史新高。
快科技報導,DeepSeek-R2是一款基於華為昇騰910B(Ascend 910B)晶片集群訓練的模型,在FP16精度下達到512PetaFLOPS的計算能力,晶片使用效率為82%。
據華為實驗室統計,這個性能相當於輝達上一代A100訓練集群的91%左右。至於這些是不是真實的,還有待觀察,但看起來確實更強大、更自主了。
有分析師預計,DeepSeek-R2的定價可能顯著低於OpenAI同類產品,預示著其可能顛覆現有AI服務的定價模式。
此外,還有相關消息顯示,DeepSeek-R2預計比GPT-4成本下降97%;並且是在華為昇騰AI晶片上做的訓練,主打一個全方位全產業鏈的自主可控,性能不輸輝達。
據相關人士透露的情況,DeepSeek-R2的總參數量可能會達到1.2兆,比DeepSeek-R1的6,710億參數增加大約一倍。
不過,此前今年曾多次傳出DeepSeek-R2將發布的消息,但最終都沒有下文。DeepSeek-R2早期計畫指向2025年5月發布,但因技術進度和市場競爭因素被推遲。後來又有資訊指,發布時間被推至7月初。
延伸閱讀
贊助廣告
商品推薦
udn討論區
共 0 則留言
規範
- 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
- 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
- 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
- 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
FB留言