字節跳動最新思考模型單位 推理成本比DeepSeek R1減半

新聞觀看次數:402
香港時間
04月14日(一) 13:04
東網電視
更多新聞短片
短視頻平台抖音及TikTok母企字節跳動宣布,其最新思考模型Seed-Thinking-v1.5,將於周四(17日)透過火山引擎開放介面供用戶體驗。其單位推理成本相比DeepSeek R1降低50%。
目前該模型技術報告已公開。模型在數學、程式設計、科學推理等專業領域及創意寫作等一般任務中表現突出,模型採用MoE架構,總參數200B,激活參數為20B,具備顯著的推理成本優勢。
關鍵字
感謝您瀏覽東網。請按入詳細閱讀本網站所載之使用條款及細則私隱政策聲明,並須確定您同意接受有關條款及聲明的約束才可繼續瀏覽。