首页 > 互联网>苹果发表 Manzano：近乎无损融合“看图”与“绘图”的多模态 AI 模型

苹果发表 Manzano：近乎无损融合“看图”与“绘图”的多模态 AI 模型

IT之家互联网2026-01-15 09:20:04

科技媒体 Appleinsider 今天（1 月 15 日）发布博文，报道称苹果发表重磅研究论文，详细介绍了名为“Manzano”的多模态模型，融合“视觉理解”与“文本生成图像”两大功能。...

感谢最新网友对的时间点的线索投递！

最新 1 月 15 日消息，科技媒体 Appleinsider 今天（1 月 15 日）发布博文，报道称苹果发表重磅研究论文，详细介绍了名为“Manzano”的多模态模型，融合“视觉理解”与“文本生成图像”两大功能。

该模型最大的创新在于“双修”：它不仅能像人类一样精准理解图像内容（视觉理解），还能根据文本描述生成高质量图片（图像生成）。

苹果发表 Manzano：近乎无损融合“看图”与“绘图”的多模态 AI 模型

行业内此前仅有少数模型能同时兼顾这两项任务，且往往需要在画质与理解力之间做出妥协，研究人员指出，核心矛盾在于“视觉分词”的方式不同。

简单来说，AI 进行“图像理解”时喜欢连续的数据流（类似看视频），而进行“图像生成”时则更依赖离散的数据块（类似拼图）。传统模型强行让同一个大脑处理这两种截然不同的信号，往往会导致严重的任务冲突，要么“看得懂但画不出”，要么“画得好但理解偏”。

Manzano 为了解决这一难题，引入了一种创新的三段式架构：

首先，它使用“混合视觉分词器”同时生成连续和离散的视觉表示；
接着，利用大语言模型（LLM）预测图像的语义内容；
最后，将这些预测结果交给“扩散解码器”进行像素级渲染。

苹果发表 Manzano：近乎无损融合“看图”与“绘图”的多模态 AI 模型

这种设计让 Manzano 既保留了强大的理解能力，又具备了精细的绘图能力，甚至能处理深度估计、风格迁移和图像修复等复杂任务。

测试数据显示，Manzano 在处理反直觉、违背物理常识的复杂指令时表现惊人。例如，当要求生成“一只鸟在大象下方飞翔”的画面时，Manzano 的逻辑准确性与 OpenAI 的 GPT-4o 以及谷歌的 Nano Banana 模型旗鼓相当。

苹果发表 Manzano：近乎无损融合“看图”与“绘图”的多模态 AI 模型

苹果发表 Manzano：近乎无损融合“看图”与“绘图”的多模态 AI 模型

苹果发表 Manzano：近乎无损融合“看图”与“绘图”的多模态 AI 模型

研究团队测试了从 3 亿到 300 亿（30B）参数的不同版本，证实了该架构在模型规模扩大时依然能保持高效的性能提升。

苹果发表 Manzano：近乎无损融合“看图”与“绘图”的多模态 AI 模型

虽然 Manzano 目前仍处于研究阶段，尚未直接应用于 iPhone 或 Mac 设备，但这表明苹果正在构建更强大的底层 AI 能力。

该媒体认为这项技术极有可能会被整合进未来的“图乐园 Image Playground”功能中，为用户带来更智能的修图体验和更具想象力的画面生成能力，进一步巩固苹果在端侧 AI 领域的竞争力。

最新附上参考地址

MANZANO: A Simple and Scalable Unified Multimodal Model with a Hybrid Vision Tokenizer

《苹果发表 Manzano：近乎无损融合“看图”与“绘图”的多模态 AI 模型》转载自互联网，如有侵权，联系我们删除，QQ：369-8522。

本文网址：https://keji.jxzy.wang/2026/01/8681.html

相关图文

找钢网集团总部齐聚BATJ 共议AI+传统产业应用前景

1月16日，由中国电子商会人工智能专业委员会主办、找钢网集团联合主办的“智赋百业·慧入千行”——首届“AI+传统产业”实践应用发展论坛在上海举行。来自...

互联网 2026-01-19 1
Intel华丽回归！2026年开年股价已上涨31%

快科技1月19日新消息，曾经深陷低谷、被认为错过AI初期浪潮的半导体巨头Intel，不仅在2025年实现了股价的三位数增长，更在2026年初继续保持强劲势头。回望过去一年，2025年初Intel股价一度跌至...

互联网 2026-01-19 1
5名骑手用钢管将手指砸骨折骗保超32万涉嫌诈骗被判刑

1月19日消息，据检察日报正义网报道，近期，一起由外卖骑手精心策划的保险诈骗案在成都宣判，骑手张某曾因送餐受伤获赔后，组织团伙骗保，通过故意将手指砸至骨折，累计作案8起，骗取3家保险公司...

互联网 2026-01-19 1
北方冬天的奇幻一幕！40℃温差让牛棚秒变凌霄宝殿

快科技1月19日消息，随着四九开场，一场寒潮来袭北方，大部分地区经历冷暖逆转。近日，一位网友分享了北方冬天的奇幻一幕，引发网友热议。在内蒙古锡林郭勒，40℃温差让牛棚秒变“凌霄...

互联网 2026-01-19 1
西贝回应羊肉1年集中采购1次：8-10月份是羔羊风味巅峰

快科技1月19日消息，最近西贝因为创始人贾国龙的接连发声重获关注，在冷冻西兰花等问题之外，还首次正面回应了羊肉1年集中采购1次的话题。西贝表示，这并非出于成本考量，而是尊重草原的自然规...

互联网 2026-01-19 1
分屏交互决策更高效！蜻蜓点金深度适配鸿蒙折叠电脑移动端体验焕新专业投资如影随行

金融市场瞬息万变，对于投资者而言，他们对“专业”工具的需求，从来不局限于“功能”本身，而是希望在任何时间、场景下，都能以最便捷的方式实时获取行情动态、准确做出投...

互联网 2026-01-19 1