佳礼资讯网

 找回密码
 注册

ADVERTISEMENT

查看: 156|回复: 0

DeepSeek R2徹底擺脫輝達 全數華為晶片建構總參數提升1倍

[复制链接]
发表于 1-5-2025 06:07 PM | 显示全部楼层 |阅读模式

今年初DeepSeek R1在全球的驚訝聲中誕生,美國AI界為之震動,當紅人工智慧晶片企業輝達(Nvidia)股價隨之暴跌。據陸媒報導,在大陸與全球AI競爭對手的高度關注下,更強的新版本DeepSeek R2即將面世。

據《快科技》引述AI市場最新爆料稱,DeepSeek R2大模型將採用更先進的混合專家模型(MoE),總參數量較前代R1提升約1倍,預計達1.2兆(R1總參數量為6710億),單位推理成本較GPT-4大減,減幅高達驚人的97.4%。

報導導指出,由於中美科技戰、貿易戰愈演愈烈,輝達H20晶片面臨新一波出口管制。在DeepSeek R2預期發佈時間臨近的情況下,各界高度關注中國指標性AI大模型在缺乏美國晶片下的發展動向。

業界傳聞,DeepSeek R2規模與ChatGPT的GPT-4 Turbo以及谷歌的Gemini 2.0 Pro相當,還將結合更智慧的門控網路層(Gating Network),進而優化高負載推理任務的性能。

有消息指出,DeepSeek R2將徹底擺脫輝達晶片,訓練全程全部基於昇騰910B(Ascend 910B)晶片集群平台,在FP16精度下,計算性能達到512每秒浮點運算,晶片利用率高達82%,整體性能約為輝達A100集群的91%。

市場預期,這項進展有望降低大陸對海外高端AI晶片的依賴,且華為全新的昇騰910C晶片也開始進入大規模量產階段。

在成本方面,DeepSeek-R2的單位推理成本較OpenAI旗下的GPT-4大減97.4%。其中,R2輸入每百萬個詞元僅需0.07美元,而輸出每百萬個詞元僅0.27美元。

分析人士認為,R2若如傳聞般強勢,可能再次引發市場對AI基礎設施需求的質疑,加上華為AI晶片的國產替代,將對輝達帶來更大影響。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

 

ADVERTISEMENT



ADVERTISEMENT



ADVERTISEMENT

ADVERTISEMENT


版权所有 © 1996-2023 Cari Internet Sdn Bhd (483575-W)|IPSERVERONE 提供云主机|广告刊登|关于我们|私隐权|免控|投诉|联络|脸书|佳礼资讯网

GMT+8, 17-5-2025 06:40 AM , Processed in 0.129591 second(s), 24 queries , Gzip On.

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表