佳礼资讯网

 找回密码
 注册

ADVERTISEMENT

查看: 340|回复: 2

繞開輝達護城河 陸媒傳DeepSeek可改適配中國國產GPU晶片

  [复制链接]
发表于 3-2-2025 02:57 PM | 显示全部楼层 |阅读模式

據外媒報導,深度求索(DeepSeek)在研發大模型時繞過了輝達的軟硬體整合技術「統一計算架構」(CUDA)這道AI技術護城河,這種用新的演算法高效利用硬體層面加速,能提高模型效果。只要有足夠擅長寫PTX語言的內部開發者,就能讓大陸開發的AI模型更容易適配中國國產GPU晶片,這讓美國不少AI巨頭們感受到極大的威脅。

據《快科技》報導,DeepSeek真的繞過了輝達的計算架構CUDA,北京航空航太大學黃雷副教授接受採訪時表示,繞過CUDA意味著DeepSeek可以直接根據GPU的驅動函數做一些新的開發,從而實現更加細細微性的操作。

黃雷指出,譬如DeepSeek在多節點通信時繞過了CUDA,直接使用並行線程執行代碼(Parallel Thread Excution, PTX),其最多只能實現以演算法的方式來高效利用硬體層面的加速。一旦速度變得更快,這就意味著別人的模型要訓練10天,而DeepSeek只需要訓練5天,那麼就能給模型喂更多的資料,即能讓模型在同等時間內看到更多的資料,間接提高模型的效果。

因此,透過PTX雖然可以進行更多專門的最佳化調整,但缺點是很難維持穩定,需要人力大量除錯,因此也顯示出 Deepseek 工程師的設計功力。

報導說,Deepseek 的出現,打破了矽谷巨頭在人工智慧競爭中的軍備競賽局面,AI 開發或許不一定非要追求最強晶片和龐大晶片數量,透過精細的程式設計也能讓低規設備跑出高效結果,這可能也是前日美國科技股市震盪的主要原因。

報導引述消息人士指出,DeepSeek擁有一些擅長寫PTX語言的內部開發者,假如它之後使用中國國產GPU,其在硬體適配方面將會更得心應手,其只要瞭解這些硬體驅動提供的一些基本函數介面,就可以仿照輝達GPU硬體的程式設計介面去寫相關的代碼,從而讓自家大模型更加容易適配國產硬體。
回复

使用道具 举报


ADVERTISEMENT

发表于 3-2-2025 07:47 PM | 显示全部楼层

评分

参与人数 1人气 +5 收起 理由
dalap + 5 谢谢分享

查看全部评分

回复

使用道具 举报

 楼主| 发表于 4-2-2025 09:21 AM | 显示全部楼层
于是呆蛙只能:  梦回清朝。。。梦回清朝。。。梦回清朝。。。梦回清朝。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

 

ADVERTISEMENT



ADVERTISEMENT



ADVERTISEMENT

ADVERTISEMENT


版权所有 © 1996-2023 Cari Internet Sdn Bhd (483575-W)|IPSERVERONE 提供云主机|广告刊登|关于我们|私隐权|免控|投诉|联络|脸书|佳礼资讯网

GMT+8, 22-8-2025 12:36 AM , Processed in 0.125807 second(s), 25 queries , Gzip On.

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表