騰訊推自研深度思考模型「混元T1」 推理能力升級

新聞觀看次數:1k
香港時間
03月22日(六) 20:30
東網電視
更多新聞短片
人工智能(AI)大戰打不停,企業紛紛推出AI大模型!騰訊(00700)宣布推出自研深度思考模型「混元T1」正式版,並已在騰訊雲官網上線供用戶使用。定價方面,輸入價格為1元人民幣/每百萬tokens,輸出價格為4元人民幣/每百萬tokens。
內媒報道,該模型以騰訊早前發布的「混元Turbo S」為基座打造,是一款能秒回、吐字快、擅長超長文處理的強推理模型。通過大規模強化學習,並結合專項優化,混元T1正式版進一步提升推理能力,與此前已上線騰訊元寶的「混元T1-preview」模型相比,綜合效果有明顯提升。
技術層面上,混元T1正式版沿用混元Turbo S的創新架構,採用Hybrid-Mamba-Transformer融合模式。據報,這是業界首次將混合Mamba架構無損應用於超大型推理模型。知情人士指,這一架構顯著降低訓練及推理成本,讓混元T1實現首字秒出,吐字速度達到最快每秒80 tokens(Token為處理文本的最小單元)。