AIWan2.1 开源视频生成模型,支持多种任务和分辨率
Wan2.1 是一套全面开放的视频生成模型,采用主流的扩散变换器(diffusion transformer)范式,支持多任务处理和高分辨率生成,同时兼容消费级GPU。 核心功能 1、SOTA性能在多个基准测试中超越现有开源模型和商业解决方案。 支持生成中英文视觉文本(如视频中的文字嵌入)。 2、低硬件门槛T2V-1.3B模型仅需8.19GB显存,可在RTX 4090上4分钟生成5秒480P视频(未优化)。 14B模型支持多GPU分布式推理(FSDP + xDiT USP技术)。 3、多任务支持文本生成