英國《金融時報》報道,中國人工智能(AI)公司DeepSeek的新模型,因轉用華為芯片未能完成訓練,而推遲發布。 報道引述3名知情人士指,D...
英國《金融時報》報道,中國人工智能(AI)公司DeepSeek的新模型,因轉用華為芯片未能完成訓練,而推遲發布。報道引述3名知情人士指,DeepSeek今年1月發布R1模型後,被鼓勵採用華為昇騰處理器,而不是輝達的芯片,來進行AI模型訓練。報導指,公司在使用昇騰晶片訓練R2模型的過程中,遇到技術問題,隨後改用輝達晶片進行訓練,並使用華為晶片進行推理。令原定在5月發布的新模型,要推遲發布時間。