商湯發布「可控人物」生成視頻大模型Vimi

2024年07月04日 17:00
東網電視
更多新聞短片
 
商湯(00020)推出首個向廣大用戶開放的可控人物視頻生成大模型Vimi,現已在官網開放預約,並將在7月5日商湯科技舉辦的「大愛無疆.向新力」人工智能論壇上披露更多細節。
商湯表示,Vimi基於商湯日日新大模型的強大能力,只需要一張任何風格的照片就能生成和目標動作一致的人物類短片,並支持多種驅動方式,可通過已有人物影片、動畫、聲音、文字等多種元素進行驅動。
Vimi可以實現精準的人物表情控制,還可控制照片中人物上半身的自然肢體動作,並自動生成與人物相符的頭髮、服飾及背景變化。同時光影變化也能做到合理生成,讓人物動作和視覺效果流暢自然,畫面和諧唯美。更重要的是,Vimi具備極強的穩定性,可穩定生成長達1分鐘的單鏡頭人物類短片,畫面效果不會隨着時間變化而降低品質或失真,滿足娛樂互動等需要長時間穩定短片生成的需要。