iOS教程长江存储图片编辑软件火箭云限免软件游戏主板 DOVE TizLink 冲鸭二次元 ThinkPad笔记本

部落志 >> AI >> Wan2.1 开源视频生成模型，支持多种任务和分辨率

Wan2.1 开源视频生成模型，支持多种任务和分辨率

2月26日发布在AI

Wan2.1 是一套全面开放的视频生成模型，采用主流的扩散变换器（diffusion transformer）范式，支持多任务处理和高分辨率生成，同时兼容消费级GPU。

核心功能

1、SOTA性能
在多个基准测试中超越现有开源模型和商业解决方案。

支持生成中英文视觉文本（如视频中的文字嵌入）。

2、低硬件门槛
T2V-1.3B模型仅需8.19GB显存，可在RTX 4090上4分钟生成5秒480P视频（未优化）。

14B模型支持多GPU分布式推理（FSDP + xDiT USP技术）。

3、多任务支持
文本生成视频（T2V）

图像生成视频（I2V）

视频编辑、文本生成图像（T2I）、视频生成音频（V2A）

4、创新视频VAE
Wan-VAE支持任意长度的1080P视频编解码，保留时序信息，为生成任务提供高效基础。

技术细节

1、模型架构

基于扩散Transformer（DiT）和流匹配（Flow Matching）框架。

提出3D因果VAE（Wan-VAE），优化时空压缩效率，降低内存占用。

2、训练策略

大规模数据清洗流程：从候选数据集中筛选高质量图像和视频。

支持多分辨率训练（480P/720P/1080P）。

3、性能对比

在1035条内部测试提示下，人工评估显示Wan2.1在14个主维度和26个子维度上优于闭源模型（如Sora、Pika）和开源模型（如Stable Video Diffusion）。

快速使用指南

1、安装依赖

git clone https://github.com/Wan-Video/Wan2.1.git
cd Wan2.1
pip install -r requirements.txt  # 需确保PyTorch >=2.4.0

2、模型下载
通过Hugging Face或ModelScope下载模型：

huggingface-cli download Wan-AI/Wan2.1-T2V-14B --local-dir ./Wan2.1-T2V-14B

3、生成示例
文本生成视频（单GPU）：

python generate.py --task t2v-14B --size 1280x720 --ckpt_dir ./Wan2.1-T2V-14B \
--prompt "两只拟人化猫咪穿着舒适的拳击装备激烈对战"

启用提示扩展（提升细节质量）：

DASH_API_KEY=your_key python generate.py --use_prompt_extend --prompt_extend_method dashscope

4、Gradio交互界面

cd gradio
DASH_API_KEY=your_key python t2v_14B_singleGPU.py  # 支持DashScope API扩展提示

性能与兼容性

模型	分辨率	单GPU耗时（秒）	显存占用（GB）	适用场景
T2V-1.3B	480P	240	8.19	消费级GPU（如RTX 4090）
T2V-14B	720P	480（8 GPU）	分布式优化	高性能多GPU服务器

Wan2.1通过创新的3D VAE架构、高效训练策略和大规模数据工程，实现了视频生成领域的突破性进展。

Wan2.1地址：

https://github.com/Wan-Video/Wan2.1

hello-claw：零基础玩转OpenClaw，打造自己的AI龙虾助理

OCRBench v2 2025 年 9 月最新榜单

B站开源IndexTTS2，一键生成带情感的影视级配音，精准控制语速时长

仅需一行代码，轻松替代现有激活函数

中国人工智能学会主办的2025第十四届中国智能产业大会与吴文俊人工智能创新大会将在江苏常州举办

李沐团队Higgs Audio V2用1000万小时数据淬炼的语音大模型

无 Tokenizer 时代将至？H-Net 用动态分块挑战 Transformer

GPT-4.1 Prompting 提示词官方指南

Midscene.js 让 AI 帮你操作网页、验证内容，提取数据

BrowseComp AI 基准测试

休闲手游《梦幻庄园》攻略软件应用

AutoCAD2026中如何快速实现仅显示选定对象的图层？

哈佛医学院：吃柑橘有抗抑郁作用，闻柑橘味能提升认知功能软件应用

视频音频和图片下载工具you-get使用指南操作系统

微软 Windows 11 25H2 驱动优化

刷短视频停不下来？短视频成瘾如何重塑我们的身心

美剧《孤鸽镇 Lonesome Dove》迅雷全4集

解决 Win10 连接 Wifi 显示无 internet 访问权限的问题

斯嘉丽·约翰逊主演科幻片《侏罗纪世界：重生》HD英语中字BT迅雷

创业应该选择个人独资企业还是一人有限公司？

中国人工智能学会主办的2025第十四届中国智能产业大会与吴文俊人工智能创新大会将在江苏常州举办

孩子几岁能用洗面奶和祛痘护肤品

buluozhi#outlook.com