阿里曾漲7%!全新推理模型QwQ-32B媲美DeepSeek R1

2025年03月06日 10:47
東網電視
更多新聞短片
人工智能(AI)大戰日日上演!阿里巴巴(09988)的通義千問Qwen團隊周三(5日)晚間發文宣布最新研究成果—QwQ-32B大語言模型,在僅有DeepSeek-R1約二十分之一參數量的情況下,用強化學習(Reinforcement learning,RL)實現性能上的驚人跨越。阿里巴巴股價曾漲逾7%,報139.6港元,目前仍升6.4%。
Qwen團隊在部落格文章提到,他們深入探索RL在提升大語言模型智慧方面的巨大潛力,QwQ-32B成功發布,有力證明RL是提升模型性能的強大引擎。