阿里发布万相 2.6 系列模型,上线国内首个角色扮演功能
最新 12 月 16 日消息,阿里发布新一代万相 2.6 系列模型,该系列模型面向专业影视制作和图像创作场景进行了全面升级,全新的万相 2.6 是国内首个支持角色扮演功能的视频模型。该模型同时支持音画同步、多镜头生成及声音驱动等功能,是全球功能最全的视频生成模型。万相 2.6 已同步上线阿里云百炼、万相官网。

最新附官方介绍如下:
万相 2.6 视频生成升级亮点
角色扮演
万物皆可入戏,万相 2.6 能参考输入视频中的角色外观和音色、实现角色扮演,按照提示词生成单人、多人、人与物合拍的视频。
多镜头叙事
万相 2.6 可将用户简单的提示词转换为多分镜脚本,生成包含多个镜头的连贯叙事视频,并且保持多镜头间的主体、场景等关键信息的一致性。
自然音画同步
多人对话场景稳定生成,真实自然的人声表达,声音质感提升,更好听的音乐和歌曲生成。
15s 长视频生成
生成视频最长 15s(参考生视频 10s),提升画面时空内容容量,支持更完整叙事。
音频驱动生成
万相 2.6 可根据用户输入的文本和音频,驱动生成视频,并实现多镜头演绎。
万相 2.6 文生图升级亮点
艺术风格的高度美学与可控性
精准捕捉艺术灵魂:对各类风格关键词理解深入,还原度更高,画面整体风格统一且完整。
风格融合自然流畅:支持多种艺术风格有机融合,过渡平滑,创作出独具一格的视觉作品。
细节刻画生动丰富:对「肌理、色彩、笔触」等细节的呈现更为到位,赋予图像故事感与表现力。
真实人像质感,光影细节到位
在写实人像生成中,人物神态自然、肤质真实,有效削弱“AI 感”。模型综合优化构图与光影,呈现更具表现力的人像视角。
文字生成,图表、插画与海报设计
可依据中英文长文本内容,结合美学设计与图文协调性,精准生成海报、图文说明、信息图表等,实现内容与视觉的高度统一。
万相 2.6 图像生成升级亮点
图文混排输出
多张图片和文字一体化生成,具备逻辑推理能力,实现有层次、有逻辑的视觉化叙事。
多图融合生成
多张图片的任意参考、组合或替换,融合多重视觉灵感,生成全新创意图像。
商用级一致性保持
保持角色、风格或元素的高度一致,拓展商业级使用场景。
美学要素迁移
提取参考图的颜色、风格、构图等创意灵感,实现美学参考生成。
镜头和光影精准控制
可指定镜头视角、近远景及光影细节,实现对画面空间与氛围的精确调控。
《阿里发布万相 2.6 系列模型,上线国内首个角色扮演功能》转载自互联网,如有侵权,联系我们删除,QQ:369-8522。
相关图文
-
保时捷设计推 C-Seed 折叠电视,售价超三台 911
保时捷设计工作室联合研发的C-Seed折叠电视亮相,它更像一件科幻雕塑艺术品。闲置时如未来柜体,一键启动后屏幕自动旋转,五块Micro LED面板依次展开,支持室内外两用。但价格令人咋舌:约40万美元,超三台保时捷911 Carrera总价。#天价电视# #保时捷设计#... -
三星高管:不追噱头,专注打造“真正有用且不唐突”的 AI
三星欧洲区CEO Simon Sung表示,其AI战略核心是打造“真正有用且不唐突”的人工智能,聚焦日常实用价值而非新奇噱头。三星高斯大模型并未像ChatGPT那样独立推出,而是以Galaxy AI为核心深度集成于手机,并布局于家电等多条产品线。公司内部正推动AI能力渗透各部门,构建统一的智能环境。#三星AI# #GalaxyAI#... -
英伟达黄仁勋谈 AI 对职场影响:只替你干杂活,岗位核心还得靠人
英伟达CEO黄仁勋在播客中分享了对AI与就业的见解:AI自动化的是工作中的具体任务,而非岗位的核心价值。他以放射科为例,尽管AI已能读取影像,但放射科医生人数和收入却创下新高,因为其核心价值在于诊断与治疗决策。这一逻辑同样适用于律师、软件工程师等职业。#AI与就业# #黄仁勋谈AI#... -
谷歌重申暂无在 Gemini 中投放广告计划,聚焦搜索广告
谷歌全球广告副总裁丹·泰勒表示,目前没有在Gemini应用中投放广告的计划,广告团队正将重心放在AI搜索广告上。他指出,AI助手与搜索定位不同,商业化需谨慎,过早插入广告可能引发用户反感。目前谷歌AI概览月活已超20亿,广告点击率与传统搜索持平。#谷歌Gemini##AI广告商业化#... -
波士顿动力 CEO:Atlas 人形机器人从零件分拣起步,5-10 年或进入家庭
波士顿动力CEO透露,其全电动人形机器人阿特拉斯计划2028年投入工厂应用,将从汽车零部件分拣等简单任务起步。机器人面部设计灵感源自皮克斯小台灯,旨在传递友好信号。CEO认为机器人将创造新岗位,与人类形成共生关系,而非简单取代。#人形机器人##波士顿动力#...

















