in ,

華為昇騰晶片太廢  令DeepSeek推出新模型R2計劃受阻

中國人工智能公司DeepSeek因無法在華為「昇騰」(Ascend)晶片上順利完成新一代模型的訓練,導致R2模型需延遲發布。《金融時報》引述三名知情人士透露,DeepSeek於今年1月發佈R1模型後,中國當局「鼓勵」改用華為昇騰處理器,取代原先使用的輝達(Nvidia)晶片進行AI模型訓練。然而,在R2的開發過程中,昇騰芯片出現不穩定表現、連接速度較慢,以及大量技術及功能受限等問題,令訓練進度嚴重受阻。

報道指,華為曾派出工程師團隊前往DeepSeek數據中心協助解決問題,但即使在工程師駐場期間,公司仍未能在昇騰平台上完成一次完整的訓練。最終,DeepSeek被迫恢復使用輝達GPU進行R2的訓練,並保留華為晶片作推理運算用途。

報道補充,DeepSeek至今仍與華為合作,嘗試令R2在昇騰晶片上保持兼容性。

記者:阿鬼

天生火爆,用一團火和光合作用,繼續盡力發聲做記者。