即梦AI在其官方外交媒体平台上近日发布了一段引东说念主注筹划新功能预报视频欧洲杯体育,揭示了一项名为OmniHuman的改造多模态视频生成模子。该模子仅需用户输入一张图片和一段音频,即可自动生成一段无邪传神的AI视频,这一打破有望极地面普及AI短片的分娩效率和视觉质地。
据即梦AI视频号发布的实质截图炫夸,OmniHuman是由字节跳跃自主研发的闭源模子。该模子概况处理包括肖像、半身照及全身照等不同尺寸的图片输入,并依据用户提供的音频实质,自动为视频中的东说念主物生成相应的四肢,如演讲、颂赞、乐器演奏以及体魄迁徙等。尤为OmniHuman在处置东说念主物视频生成中常见的手势失真问题上,相较于现存工夫有了权臣普及。
不仅如斯,OmniHuman还相沿动漫、3D卡通等非真东说念主图片的输入,并能保捏这些特定作风及原有的显露时势,生成的视频抑制一样出色。从工夫主页上的演示抑制来看,OmniHuman所生成的视频仍是具备了高度的当然度和传神感。
关系词,为驻防这项工夫被虚耗,字节跳跃工夫团队明确暗示,OmniHuman将不会对外提供下载工作。即梦AI的有关认真东说念主露出,尽管OmniHuman模子仍是展现出了精熟的性能,但在生成达到影视真确级别的视频方面,仍有待进一步普及。因此,该模子相沿的多模态视频生奏遵守将率先在即梦平台上以小领域内测的形势进行调优和完善,并慢慢向更世俗的用户洞开。
为确保AI工夫的正面运用和积极影响,即梦AI不仅拓荒了严格的安全审核机制,还将在输出的视频上标注水印以作辅导。这一举措旨在助力视频创作家更好地齐全创意抒发,同期确保工夫的使用适宜说念德和法律范例。
欧洲杯体育