以 1080P 视觉保真度和统一音频合成,提升你的创作叙事。生成最长 15 秒视频,内置音效、首尾帧控制和负面提示词——基于阿里 27B MoE 架构。
生成的视频结果将显示在这里
最先进的开源视频模型,内置音频生成和帧级控制。
不同于分别生成视频和音频的模型,Wan 2.7 在单次生成中同时产出两者。背景音乐、环境音效和角色对话同步合成,实现完美的音画一体。
上传起始图片,可选上传结束图片,精确控制视频的叙事弧线。适合产品演示、场景过渡和有确定起止点的故事叙述。
采用 270 亿参数混合专家架构,Apache 2.0 开源许可。在完整 15 秒时长内提供卓越的运动质量、时间一致性和细节保持。
三步创建带音频的精彩视频。
编写详细的文字提示词或上传起始图片。可选添加尾帧图片实现受控动画。用负面提示词排除不想要的元素。
选择分辨率(720p 或 1080p)、时长(2-15 秒)和宽高比(16:9、9:16、4:3、3:4 或 1:1)。音频自动生成。
点击生成,获得带同步音频的完整视频。预览效果后以所选分辨率下载。
Wan 2.7 是阿里巴巴最新旗舰开源视频模型,采用 270 亿参数混合专家(MoE)架构。可生成最高 1080p、最长 15 秒的高清视频,并内置统一音频合成——背景音乐、环境音效和角色配音与画面同步生成。支持文生视频和图生视频两种模式,具备首尾帧控制、负面提示词和自动提示词扩展功能。