阿里曾漲7%！全新推理模型QwQ-32B媲美DeepSeek R1

東網電視

更多新聞短片

人工智能(AI)大戰日日上演！阿里巴巴(09988)的通義千問Qwen團隊周三(5日)晚間發文宣布最新研究成果—QwQ-32B大語言模型，在僅有DeepSeek-R1約二十分之一參數量的情況下，用強化學習(Reinforcement learning，RL)實現性能上的驚人跨越。阿里巴巴股價曾漲逾7%，報139.6港元，目前仍升6.4%。

Qwen團隊在部落格文章提到，他們深入探索RL在提升大語言模型智慧方面的巨大潛力，QwQ-32B成功發布，有力證明RL是提升模型性能的強大引擎。