查看: 156|回复: 0
|
DeepSeek R2徹底擺脫輝達 全數華為晶片建構總參數提升1倍
[复制链接]
|
|
今年初DeepSeek R1在全球的驚訝聲中誕生,美國AI界為之震動,當紅人工智慧晶片企業輝達(Nvidia)股價隨之暴跌。據陸媒報導,在大陸與全球AI競爭對手的高度關注下,更強的新版本DeepSeek R2即將面世。
據《快科技》引述AI市場最新爆料稱,DeepSeek R2大模型將採用更先進的混合專家模型(MoE),總參數量較前代R1提升約1倍,預計達1.2兆(R1總參數量為6710億),單位推理成本較GPT-4大減,減幅高達驚人的97.4%。
報導導指出,由於中美科技戰、貿易戰愈演愈烈,輝達H20晶片面臨新一波出口管制。在DeepSeek R2預期發佈時間臨近的情況下,各界高度關注中國指標性AI大模型在缺乏美國晶片下的發展動向。
業界傳聞,DeepSeek R2規模與ChatGPT的GPT-4 Turbo以及谷歌的Gemini 2.0 Pro相當,還將結合更智慧的門控網路層(Gating Network),進而優化高負載推理任務的性能。
有消息指出,DeepSeek R2將徹底擺脫輝達晶片,訓練全程全部基於昇騰910B(Ascend 910B)晶片集群平台,在FP16精度下,計算性能達到512每秒浮點運算,晶片利用率高達82%,整體性能約為輝達A100集群的91%。
市場預期,這項進展有望降低大陸對海外高端AI晶片的依賴,且華為全新的昇騰910C晶片也開始進入大規模量產階段。
在成本方面,DeepSeek-R2的單位推理成本較OpenAI旗下的GPT-4大減97.4%。其中,R2輸入每百萬個詞元僅需0.07美元,而輸出每百萬個詞元僅0.27美元。
分析人士認為,R2若如傳聞般強勢,可能再次引發市場對AI基礎設施需求的質疑,加上華為AI晶片的國產替代,將對輝達帶來更大影響。 |
|
|
|
|
|
|
| |
本周最热论坛帖子
|