華為昇騰晶片太廢　　令DeepSeek推出新模型R2計劃受阻

記者：阿鬼 August 15, 2025, 7:01 am

中國人工智能公司DeepSeek因無法在華為「昇騰」（Ascend）晶片上順利完成新一代模型的訓練，導致R2模型需延遲發布。《金融時報》引述三名知情人士透露，DeepSeek於今年1月發佈R1模型後，中國當局「鼓勵」改用華為昇騰處理器，取代原先使用的輝達（Nvidia）晶片進行AI模型訓練。然而，在R2的開發過程中，昇騰芯片出現不穩定表現、連接速度較慢，以及大量技術及功能受限等問題，令訓練進度嚴重受阻。

報道指，華為曾派出工程師團隊前往DeepSeek數據中心協助解決問題，但即使在工程師駐場期間，公司仍未能在昇騰平台上完成一次完整的訓練。最終，DeepSeek被迫恢復使用輝達GPU進行R2的訓練，並保留華為晶片作推理運算用途。

報道補充，DeepSeek至今仍與華為合作，嘗試令R2在昇騰晶片上保持兼容性。

記者：阿鬼

天生火爆，用一團火和光合作用，繼續盡力發聲做記者。

華為昇騰晶片太廢　　令DeepSeek推出新模型R2計劃受阻

記者：阿鬼

田園書屋宣佈結業　　50年後因國安消失

Anthropic回應近日開放權重模型爭議　　矛頭指向中共

Log In

Sign In

Forgot password?

Your password reset link appears to be invalid or expired.

Log in

Privacy Policy

Add to Collection

No Collections