商湯推出「日日新5.0」大模型體系 稱全面對標GPT-4

2024年04月23日 22:00
東網電視
更多新聞短片
徐立
商湯科技(00020)發佈「雲、端、邊」全棧大模型產品矩陣,以滿足不同規模場景的應用需求,同時發佈升級的「日日新SenseNova 5.0」大模型體系,聲稱其綜合能力全面對標GPT-4,加速生成式AI向產業落地的全面躍遷,實現大模型按需所取。
該企指,在人工智能發展最基本法則的尺度定律(Scaling Law)的準則下,將持續尋求最有數據配比並建立數據質量評價體系,推動自身大模型研發的同時,也為行業夥伴提供大模型訓練、微調、部署各類生成式AI的能力及服務。
商湯科技董事長兼行政總裁徐立表示,在尺度定律的指導下,會持續探索大模型能力的KRE三層架構(知識、推理、執行),不斷突破大模型能力邊界。
據悉,「日日新SenseNova5.0」基於超過10TB tokens訓練,覆蓋大量合成數據,並採用混合專家架構,推理時上下文窗口可以有效到達200K左右。本次更新主要增強了知識、數學、推理及代碼能力。