10.5.1 多图输入功能概述
即梦4.0图片模型的多图输入功能,指使用者能够一次上传多张图片,模型能把这些图片进行智能融合、合成,或者依据多图综合信息与提示词做拓展创作,产出新图像 。它可理解多图的内容元素、构图逻辑等,生成画面和谐自然、主题连贯统一的新作品,且处理时能较好保留原图关键细节与主体特征 。
10.5.2 应用案例:
1. 时尚穿搭展示
输入以上5张图,给出提示词:将上述服装搭配在一个年轻时尚的男性模特身上,模特站在城市街头背景前,摆出自然且充满活力的姿势,整体画面色调明快。
生成结果如下图:

2.美食创作设计
输入一张草莓蛋糕裸胚图、一盒新鲜草莓图、一瓶奶油图、一些巧克力碎粒图4张图。
生成图片提示词:用这些食材装饰草莓蛋糕,草莓摆放成爱心形状在蛋糕顶部,奶油均匀涂抹在蛋糕表面和侧面并挤出花纹,巧克力碎粒撒在草莓周围,蛋糕放置在精致的餐桌上,旁边有一杯牛奶。
生成结果:
3.宠物主题插画
输入4张图片:一张猫咪慵懒趴着的图、一个毛线球图、一张逗猫棒图、一碗猫粮图。