字節跳動據報計劃採用華為晶片訓練新AI模型

2024年09月30日 13:46
東網電視
更多新聞短片
外媒引述三名知情人士指,中國影片分享程式抖音海外版TikTok母公司字節跳動,計劃開發一種主要使用華為晶片訓練的人工智能(AI)模型,因美國的禁令讓這家社交媒體巨頭轉向在國內尋找晶片。
自2022年美國開始限制英偉達(Nvidia)等先進AI晶片的出口以來,字節跳動已轉向國內AI晶片供應商,並加速自身發展。知情人士稱,字節跳動在AI競賽中的下一步,是使用華為的Ascend 910B晶片來訓練大語言AI模型。不過也有另一知情人士表示,字節跳動正計劃推出新的AI模型,但無法透露是否會使用華為晶片。消息指,該公司已經將Ascend 910B晶片主要用於計算密集程度較低的推理任務,其中涉及預先訓練的AI模型進行預測。
報道指,訓練AI模型的要求極高,需要大量數據,以及運用超高性能晶片,如英偉達的高級圖形處理器(Graphics Processing Unit, GPU)。知情人士指,從計算參數來衡量,新模型的能力及複雜性將不如字節跳動現有的AI模型豆包。
字節跳動沒有作出回應。TikTok駐華盛頓發言人Michael Hughes代表字節跳動指,「整個前提都是錯誤,沒有開發任何新模型」。
報道提到,據報字節跳動今年已訂購超過10萬塊Ascend 910B晶片,但截至7月,收到的晶片還不到3萬塊,速度太慢,無法滿足公司的需求。知情人士又稱,與英偉達在中國推出的晶片相比,由於供應及運算能力有限,導致字節跳動無法為新模型設定時間表。