查看: 194|回复: 1
|
螞蟻AI大突破:傳使用華為晶片
[复制链接]
|
|
螞蟻集團表示,該公司使用高性能硬體訓練1兆個token的成本約為635萬元人民幣(約88萬美元),但其優化方法使用低規格硬體訓練1兆個token的成本降至510萬元人民幣。
知情人士表示,螞蟻使用其關係企業阿里巴巴集團控股公司和華為技術生產的「國產晶片」,來訓練採用「混合專家」(Mixture of Experts,MOE)機器學習與深度學習架構的AI模型,所得到的結果與採用輝達H800等晶片相似。知情人士表示,螞蟻仍在使用輝達晶片開發AI系統,但現在其最新的模型主要依賴其他公司的晶片,包括超微的晶片和中國製晶片。
這些AI模型意味著螞蟻加入了美中兩國企業的競爭。自從DeepSeek展示如何以遠低於OpenAI和谷歌的成本訓練出性能強大的AI模型以來,這場美中企業之間的競爭便愈演愈烈。這也凸顯出中國企業多麼想讓中國製晶片來取代輝達最先進的半導體。
MoE模型的訓練通常仰賴高效能晶片,如輝達的GPU。到目前為止,其成本對許多規模較小的公司而言實在高不可攀,也限制了該AI模型的普及。螞蟻一直致力於如何更有效地訓練LLM,並消除這樣的限制。該公司的報告標題明確表示,其設定的目標是「不使用高階 GPU來擴展模型」。
這與輝達打的如意算盤背道而馳。上周在GTC年度開發者大會上,輝達執行長黃仁勳表示,即使出現像DeepSeek R1如此低成本高效能的AI模型,但運算需求仍將大幅成長。他認為企業需要的是更好的晶片來創造更多的收入,而非使用較便宜的晶片來降低成本。
今年初,中國新創公司DeepSeek號稱以極低成本、較少的AI晶片就打造出極具競爭力旳AI模型,這令投資人對估值已高的輝達及其昂貴的AI晶片信心動搖,使輝達股票一度遭到拋售。 |
|
|
|
|
|
|
|

楼主 |
发表于 25-3-2025 02:24 PM
|
显示全部楼层
陸螞蟻集團以本土晶片訓練AI媲美輝達H800 成本大降2成
近期有知情人士對外媒透露,大陸螞蟻集團正使用中國本土製造的半導體來開發AI模型訓練技術,這將使成本降低20%。而且令人意外的是,這種來自阿里巴巴與華方的晶片採用專家混合(Mixture of Experts,MoE)機器學習方法來訓練模型,測試結果與採用輝達H800等晶片測試的結果極為相似。
據《網易新聞》報導,《彭博》引述知情人士提供訊息稱,螞蟻目前仍在使用輝達的晶片進行 AI 開發,但在最新的模型中,主要依賴的是來自AMD和中國廠商的替代晶片。
報導說,螞蟻集團 CTO、平台技術事業群總裁何征宇帶領 Ling Team 團隊,打造了兩款開源MoE模型:Ling-Lite 和 Ling-Plus。前者參數規模為168億,後者參數規模高達2900億。
據螞蟻集團本月發佈的研究論文顯示,該技術團隊在模型預訓練階段使用較低規格的硬體系統,將計算成本( 635 萬元人民幣/兆Token)降低約 20%,達508萬元人民幣,但模型效能卻能與Qwen2.5-72B-Instruct和DeepSeek-V2.5-1210-Chat相媲美。
論文中也指出,即使是硬體或模型結構的微小改動,也可能引發問題,比如導致模型的錯誤率突然上升。其部分模型在某些基準測試中超越了Meta,但該數據尚未經過獨立驗證。知情人士稱,螞蟻計劃使用這兩個新模型在醫療和金融領域提供AI 服務。
陸媒指出,螞蟻集團的研究正加速AI技術本土化,以降低成本並減少對美國高端晶片的依賴。
據公開資料顯示,輝達H800是英偉達研發的晶片,專為高性能計算和人工智慧訓練設計的高端GPU晶片,廣泛應用於資料中心和AI模型訓練場景。從2023年起,輝達特供給中國的A800與H800晶片從12萬(人民幣,下同)左右,漲到近30萬,甚至還出現高達50萬一片。2023年9月,H800伺服器價格約210萬元/台,後在同年10月,因限售政策漲至350萬元/台。2025年市場資料顯示,H800整機價格穩定在230萬元左右。 |
|
|
|
|
|
|
| |
本周最热论坛帖子
|