一张图+一段音频即可生成视频字节最新数字东谈主模子行将上线

发布日期：2025-03-22 16:03 点击次数：144

近期，即梦AI在官方酬酢媒体上发布了一条新功能上线预报片。视频炫耀，给与了全新的多模态视频生成模子OmniHuman，用户仅需输入一张图片和一段音频，就不错生成一条灵活的AI视频，有望大幅晋升AI短片的制作效率和质料。

OmniHuman手艺主页信息炫耀，该模子为字节极端自研的闭源模子，可撑捏肖像、半身以及全身等不同尺寸的图片输入，并笔据输入的音频，在视频中让东谈主物生成与之匹配的手脚，包括演讲、唱歌、乐器演奏以及迁移。关于东谈主物视频生成中常见的手势崩坏，也比拟现存身手得回了权臣的改善。此外，对动漫、3D卡通等非真东谈主图片输入的撑捏效率也较为出色，生成的视频能保捏特定格归拢原有的清爽花样。

笔据手艺主页展示的演示效率来看，OmniHuman的生成效率依然具有较高的当然度。为防卫该项手艺被欠妥期骗，字节极端手艺团队在主页中十分标注称，OmniHuman将不会对外提供下载。

即梦AI相干认真东谈主显现，该模子当今已具备较好的发达，但在生成影视的确级别的视频上仍存在一定的晋腾飞间。由其撑捏的多模态视频生收遵循会在即梦上以小界限内测的边幅进行调优调遣，并放心敞开。该认真东谈主同期示意，即梦还会对这一功能开拓严格的安全审核机制，况兼对输出的视频标注水印以作教导，从而确保AI阐明正面、积极的作用，助力视频创作家更好地收场念念象力的抒发。

图片来自即梦AI视频号推行截图

文/北京后生报记者温婧

裁剪/周超

上一篇：强化中枢期间立异攻关，一款专利护航带来近千万利润

下一篇：荣耀联袂Deepseek开启智能新纪元助力贤慧生存升级

一张图+一段音频即可生成视频 字节最新数字东谈主模子行将上线

一张图+一段音频即可生成视频字节最新数字东谈主模子行将上线