快手推影片生成AI 未來擬加大投資創新

2024年07月07日 22:15
東網電視
更多新聞短片
快手(01024)上周六(6日)在2024世界人工智能大會(WAIC)發布視頻生成大模型「可靈」、圖像生成大模型「可圖」的多項新功能。
論壇上,可靈推出更加清晰的高畫質版,以及首尾幀控制、鏡頭控制等新功能,同時,創作者單次生成的文生視頻時長增加至10秒。可圖則正式開源,力求激發行業活力,共建一個更為繁榮的文生圖大模型社區生態。
快手高級副總裁、主站業務與社區科學線負責人蓋坤表示,未來將繼續加大在AI領域的投入,大力推動技術創新,「堅定地為用戶做最好的AI技術」。
蓋坤介紹,快手搭建了以「快意」語言大模型、推薦大模型、視覺生成大模型為核心的大模型矩陣,其中,快手的推薦大模型SIM,具備十萬億參數的規模。
快手副總裁、大模型團隊負責人張迪表示,將用大模型技術重塑業務,通過「升級理解、創新互動、探索生成」,在內容生產方面,打造「新一代AIGC創作、素材工具」和低門檻、智能化的內容生產體驗;在內容消費領域,升級平台的內容理解和分發體系,提升用戶消費體驗。
據了解,基於快意大模型搆建的視頻腳本生成,直播實時腳本生成、廣告線索客服,疊加數字人技術,助力商業化廣告主低成本生成高品質的視頻和直播內容,提升線索轉化效率。
快手商業化外循環和AI商業產品負責人劉逍透露,半年來,近2萬平台商家借助大模型能力實現智能化經營。相比今年1月,今年6月的AIGC月活躍客戶數增長了8倍。劉逍表示,磁力開創、女媧數字人、π數字員工等新工具將持續為商家深度賦能,創新和深化AI技術在商業化中的應用。
而在本次WAIC論壇上,可靈AI基礎模型再升級,推出更加清晰的高畫質版,以及首尾幀控制、鏡頭控制等全新編輯能力,同時,創作者單次生成的文生視頻時長增加至10秒。
可靈於6月6日正式發布文生視頻功能,隨後推出視頻續寫等多項新功能,支持用戶最長生成約3分鐘視頻。可靈以真實世界物理規則為基準,生成的視頻展現出電影級別的畫質與動態效果,甚至能夠模擬大幅度的物理運動。
蓋坤介紹,截至目前,已有超過50萬用戶申請可靈的內測資格,視頻生成數量達700萬。團隊也將繼續提升模型基礎質量,增強畫質清晰度,并引入更多創新功能,以滿足用戶多樣化需求。
快手視覺生成與互動中心負責人萬鵬飛表示,最新發布的版本中,可靈在運動生成、生成時長、物理規律、視頻畫質、指令響應、圖生視頻、視頻可控性等7方面的表現進一步升級。
另外,中國計算機學會(CCF)宣布與快手共同成立「CCF-快手大模型探索者基金」,並同步開啟基金申請通道,旨在應對AI技術迅猛發展的趨勢及業界對前沿技術的迫切需求,聚焦新一代大模型的關鍵技術研發。據悉,雙方致力於深化學術研究與工業實踐的融合,共同培育大模型領域的科研及工程技術人才。基金特別針對「大語言模型」、「視覺理解與生成」、「視頻處理大模型」、「代碼大模型」及「語音大模型」5大領域,於本年度推出共計12個研究項目,每項課題最高可獲30萬元人民幣的支持。