繞開輝達護城河陸媒傳DeepSeek可改適配中國國產GPU晶片

dalap · 发表于 3-2-2025 02:57 PM

據外媒報導，深度求索(DeepSeek)在研發大模型時繞過了輝達的軟硬體整合技術「統一計算架構」(CUDA)這道AI技術護城河，這種用新的演算法高效利用硬體層面加速，能提高模型效果。只要有足夠擅長寫PTX語言的內部開發者，就能讓大陸開發的AI模型更容易適配中國國產GPU晶片，這讓美國不少AI巨頭們感受到極大的威脅。

據《快科技》報導，DeepSeek真的繞過了輝達的計算架構CUDA，北京航空航太大學黃雷副教授接受採訪時表示，繞過CUDA意味著DeepSeek可以直接根據GPU的驅動函數做一些新的開發，從而實現更加細細微性的操作。

黃雷指出，譬如DeepSeek在多節點通信時繞過了CUDA，直接使用並行線程執行代碼（Parallel Thread Excution, PTX），其最多只能實現以演算法的方式來高效利用硬體層面的加速。一旦速度變得更快，這就意味著別人的模型要訓練10天，而DeepSeek只需要訓練5天，那麼就能給模型喂更多的資料，即能讓模型在同等時間內看到更多的資料，間接提高模型的效果。

因此，透過PTX雖然可以進行更多專門的最佳化調整，但缺點是很難維持穩定，需要人力大量除錯，因此也顯示出 Deepseek 工程師的設計功力。

報導說，Deepseek 的出現，打破了矽谷巨頭在人工智慧競爭中的軍備競賽局面，AI 開發或許不一定非要追求最強晶片和龐大晶片數量，透過精細的程式設計也能讓低規設備跑出高效結果，這可能也是前日美國科技股市震盪的主要原因。

報導引述消息人士指出，DeepSeek擁有一些擅長寫PTX語言的內部開發者，假如它之後使用中國國產GPU，其在硬體適配方面將會更得心應手，其只要瞭解這些硬體驅動提供的一些基本函數介面，就可以仿照輝達GPU硬體的程式設計介面去寫相關的代碼，從而讓自家大模型更加容易適配國產硬體。

素还真 · 发表于 3-2-2025 07:47 PM

dalap · 发表于 4-2-2025 09:21 AM

于是呆蛙只能：梦回清朝。。。梦回清朝。。。梦回清朝。。。梦回清朝。

		自动登录	找回密码
密码			注册

繞開輝達護城河陸媒傳DeepSeek可改適配中國國產GPU晶片

评分

所属分类: 政经文教

浏览过的版块

繞開輝達護城河 陸媒傳DeepSeek可改適配中國國產GPU晶片

评分

所属分类: 政经文教

浏览过的版块

繞開輝達護城河陸媒傳DeepSeek可改適配中國國產GPU晶片