# 视频工具

软件应用
软件应用CogVideo 支持文本生成视频、视频延续和图像生成视频
CogVideoX是由清影团队开发的视频生成开源项目,包含CogVideoX-2B、CogVideoX-5B及CogVideoX-5B-I2V三个版本。支持文本生成视频、视频延续和图像生成视频三种功能。基础模型基于Transformer架构,采用3D位置编码技术处理时序数据。 核心版本参数 CogVideoX-2B:基础版,FP16训练,支持FP8量化,单卡最低需18GB显存 CogVideoX-5B:增强版,BF16训练,视频质量提升,单卡最低需26GB显存 I2V版本:支持图像输入生成视频,需配合特
AI
AIWan2.1 开源视频生成模型,支持多种任务和分辨率
Wan2.1 是一套全面开放的视频生成模型,采用主流的扩散变换器(diffusion transformer)范式,支持多任务处理和高分辨率生成,同时兼容消费级GPU。 核心功能 1、SOTA性能在多个基准测试中超越现有开源模型和商业解决方案。 支持生成中英文视觉文本(如视频中的文字嵌入)。 2、低硬件门槛T2V-1.3B模型仅需8.19GB显存,可在RTX 4090上4分钟生成5秒480P视频(未优化)。 14B模型支持多GPU分布式推理(FSDP + xDiT USP技术)。 3、多任务支持文本生成
软件应用
软件应用开源视频压缩与转换工具HandBrake使用指南
HandBrake是一款开源的视频压缩与转换工具,支持Windows、macOS和Linux,HandBrake基于FFmpeg多媒体框架开发,能够将视频从任何格式转换为广泛支持的现代编解码器,如MP4、MKV等。 HandBrake的特点 1、多格式支持:HandBrake支持几乎所有常见视频格式的转换,包括DVD、蓝光视频等。 2、跨平台兼容:无论是Windows、macOS还是Linux用户,都能轻松使用HandBrake进行视频处理。 3、高质量压缩:通过H.264编码,HandBrake在保持
AI
AI阿里巴巴通义实验室AI人像视频生成技术 EMO2
EMO是由阿里巴巴通义实验室开发的音频驱动高表现力人像AI视频生成技术,最新升级版EMO2通过一张人物肖像图片和任意长度的音频,能够驱动人物进行说话、唱歌或手势舞,生成的表情和动作具有高度的感染力和专业水准。 在AI技术领域,通过音频驱动人物面部表情已实现,但在虚拟主播和数字人交互等新兴领域,如何通过音频自动生成自然流畅的动作和表情仍是技术焦点,以往的方法在手部动作生成上存在肢体错乱或动作幅度不足的问题,主要因为人类身体作为多关节复杂系统,难以实现复杂动作的驱动。 EMO2受机器人控制系统启发,将手视为
AI
AIAI YouTube Shorts Generator长视频剪辑工具
AI YouTube Shorts Generator能自动剪辑长视频精华,一键生成短视频利器。 支持自动分析长视频,提取最有趣的部分,支持视频裁剪和合成,生成短视频。 AI YouTube Shorts Generator开源,用户可自定义和扩展功能,适用于内容创作者和视频编辑者,通过自动提取和合成视频,快速制作短视频。
1