腾讯混元发布全新视频生成模型:14G消费级显卡流畅运行 生成5-10秒高清视频
快科技11月21日消息,今日,腾讯混元大模型团队宣布开源最新视频生成模型HunyuanVideo 1.5,这是一款基于Diffusion Transformer(DiT)架构、参数为8.3B的轻量级视频生成模型,支持生成5-10秒的高清视频。
该模型已经抢先在“元宝”上线,普通用户可以直接体验,可通过两种方式:一是输入文字描述(Prompt),直接实现“文生视频”;二是上传图片配合Prompt,轻松将静态图片转化为动态视频。

据介绍,HunyuanVideo 1.5模型能力全面,支持中英文输入的文生视频与图生视频。
其中,图生视频能力展现出图像与视频的高度一致性,生成的视频在色调、光影、场景、主体和细节等方面都能与原图较好匹配。
模型还具备强指令理解与遵循能力,能够精准地实现多样化场景,包括运镜、流畅运动、真实的物理规律遵循、写实人物和人物情绪表情等多种指令。

在元宝中可以通过文字和图片生成视频
同时,HunyuanVideo 1.5支持写实、动画、积木等多种风格,并可在视频中生成中英文文字,满足多样化内容创作需求。
在画质方面,模型可原生生成480p和720p高清视频,并可通过超分模型提升至1080p电影级画质。
此前,视频生成领域的开源SOTA旗舰模型至少有20B,需要超过50GB显卡方可部署。

HunyuanVideo 1.5定位为“开源小钢炮”,显著降低了使用门槛可在14G显存的消费级显卡上流畅运行,真正让每一位开发者和创作者都能“玩起来”。
HunyuanVideo1.5通过多层次的技术创新,实现了生成效果、性能与尺寸上的平衡。
HunyuanVideo 1.5创新的SSTA稀疏注意力机制(全称Selective and Sliding Tile Attention,选择性滑动分块注意力)在保证高质量生成的同时显著提升推理效率,配合多阶段渐进式训练策略,在运动连贯性、语义遵循等关键维度均达到商用水平。
《腾讯混元发布全新视频生成模型:14G消费级显卡流畅运行 生成5-10秒高清视频》转载自互联网,如有侵权,联系我们删除,QQ:369-8522。
相关图文
-
Win11大翻车!微软确认新Bug几乎影响所有核心功能
快科技11月21日消息,微软在一篇新的支持文章中承认,Windows 11系统存在一个重大问题,几乎影响了所有主要的XAML核心功能,包括开始菜单、任务栏、文件资源管理器和Windows设置等所有Shell组件... -
微软发布Win11 KB5070312更新:修复文件管理器普遍Bug!
快科技11月21日消息,微软面向Windows 11 23H2用户推出了一个可选的累积更新,即KB5070312(内部版本号22631.6276)。这次的非安全预览更新主要聚焦于质量改进,尤其修复了一个困扰用户的文件... -
想过80大寿不能靠强推AI:需要全新开发的Windows 12
快科技11月21日消息,Windows系统到今年已经40年了,可以说绝大多数人使用PC都是Windows系统伴随左右的,现在问题来了,它还能再长盛未来40年吗?80大寿的Windows是啥样,现在不可想象,windo... -
微软高管已不食人间烟火:Win11的AI功能已与用户脱节
快科技11月22日消息,AI时代万物皆可基于AI,微软现在就等不及全新开发的Win12了,要把Win11打造成一个原生AI代理系统。但是微软强推AI化的Win11也让广大网友不满,最近这件事已经引发了一系列... -
微软为Edge Copilot新增截图功能 可即时分析屏幕内容
快科技11月23日消息,据媒体报道,微软近日在Edge Canary测试版中推出了一项新功能:用户现可直接通过侧边栏中的Copilot进行截图,并与其展开交互。据了解,Copilot原本就通过“+”...











