商湯發布「可控人物」生成視頻大模型Vimi

東網電視

商湯(00020)推出首個向廣大用戶開放的可控人物視頻生成大模型Vimi，現已在官網開放預約，並將在7月5日商湯科技舉辦的「大愛無疆.向新力」人工智能論壇上披露更多細節。

商湯表示，Vimi基於商湯日日新大模型的強大能力，只需要一張任何風格的照片就能生成和目標動作一致的人物類短片，並支持多種驅動方式，可通過已有人物影片、動畫、聲音、文字等多種元素進行驅動。

Vimi可以實現精準的人物表情控制，還可控制照片中人物上半身的自然肢體動作，並自動生成與人物相符的頭髮、服飾及背景變化。同時光影變化也能做到合理生成，讓人物動作和視覺效果流暢自然，畫面和諧唯美。更重要的是，Vimi具備極強的穩定性，可穩定生成長達1分鐘的單鏡頭人物類短片，畫面效果不會隨着時間變化而降低品質或失真，滿足娛樂互動等需要長時間穩定短片生成的需要。

on.cc東網