即梦AI人物总变形?这份‘参考图’使用指南请收好!
一直想通过提示词来实现AI人物的一致性,目前即梦AI在人物一致性方面还存在不足,但会越来越强。前面几期也都介绍了几种方法,但还不完整,这期继续聊一聊即梦AI人物一致性的问题。
目前来看想要高度一致性,就两种方法,一种是精准提示词,一种是参考图,也就是需要用到即梦AI的参考图模式,就是先生成一张人物照,其他场景的都叠加这张人物照。但是面对复杂一点场景就有点力不从心的感觉,生成出来的图与预期的有较大出入,我想这是目前即梦AI模型的能力问题,不比其他AI工具,是开源的,可以自己训练loar模型,或者调用别人训练好的模型,然后重复使用。即梦AI的参考图应该就类似这种模型,可以洗图,但效果还有待提升。
这期先讲用参考图模型来生成一组艺术摄影写真照片,下期再讲用精准提示词来生另一组艺术摄影写真照片。案例中用的AI工具:豆包+DeepSeek+即梦AI。
原创不易,希望和大家一起进步,在这里看见更大的世界。
一、参考图模式实操流程
首先找一组参考图,然后打开豆包,上传参考图,输入你的要求,豆包思考几十秒后反馈结果,不理想,继续对话AI。
其次打开即梦AI,上传参考图,选择智能参考模式,最后输入豆包给出的提示词,即可生成图片,选择自己满意的即可。如果不符合预期,可以微调提示词或尝试重新生成。

参考图
二、案例:艺术摄影写真组图
图1:30岁东方女性,丰满御姐,黑色长发(发尾过肩),绝世容颜,穿【黑色无袖吊带(领口贴锁骨)+红色直筒长裙(裙摆盖脚踝)】。场景:纯黑空旷空间,顶部偏左侧1/4处有小方形天窗(边长≈画面宽度1/10,边缘锐利,仅占顶部极小区域);光线:硬光,从天窗斜向右下45°射出,光束纤细(直径≈人物肩宽),恰好笼罩人物全身;人物位置:画面右侧1/3区域,全身占画面高度1/5(脚底距画面底边1/10,头顶距画面顶边4/5),四周留白极多;动作:双臂自然下垂(手指微蜷),头部微垂后仰5°(下巴朝向右上方天窗);表情:眼神低垂后抬,瞳孔聚焦天窗,嘴唇轻抿,神态带疏离感,整体因人物小比例与空旷背景显强烈孤独感。

图2:30岁东方女性,丰满御姐,黑色长发(发尾过肩),绝世容颜。脸部特写(占画面中间1/3区域,四周大量纯黑留白)。光线:柔光,从画面正上方偏左垂直照射,仅照亮脸部(头发、耳朵隐入黑暗);动作:双手遮住嘴巴;表情:双眼半睁,瞳孔朝画面左上(天窗方向),眼角微垂,嘴角平,神态沉静中带孤独,因人物小比例与大面积黑暗强化孤独感。

图3:30岁东方女性,丰满御姐,黑色长发(发尾过肩),绝世容颜,穿【黑色无袖吊带(领口贴锁骨)】。胸部至头部(占画面中间1/6区域,位于右侧1/3),四周纯黑。光线:双柔光,从顶部偏左、偏右各20°对称照射,脸部仅显轮廓光;隐约反光;动作:头部微仰3°,双眼完全闭合(眼睑平滑);表情:嘴角平,面部肌肉放松,因人物极小占比与空旷背景,显静谧孤独。

图4:30岁东方女性,丰满御姐,黑色长发(发尾过肩),绝世容颜,穿【黑色无袖吊带(领口贴锁骨)】。肩颈至头部(占画面上1/4区域,位于右侧1/3),四周纯黑留白。光线:硬光,从画面左侧30°斜射,左脸亮部占1/2,右脸隐入阴影(明暗对比强);动作:头部微侧向右(下颌线朝右),黑色长发随头势搭右肩;表情:眼神向右下方低垂,眼皮半垂,神态疏离,因人物小比例与大面积黑暗强化孤独感。

图5:30岁东方女性,丰满御姐,黑色长发(发尾过肩),绝世容颜,穿【黑色无袖吊带(领口贴锁骨)+红色直筒长裙(裙摆盖脚踝)】。半身侧像(腰部至头部,占画面右侧1/4区域),左侧为浅灰粗糙墙(墙占画面左侧1/2,有3条从左上30°斜向右下的光纹,细且淡)。光线:硬光,与墙纹同角度(左上30°),人物右侧受光,左侧隐入墙影; 人物位置:墙右侧1/5处,四周大量留白;动作:双手交握于后腰(手指相扣),头部向右侧微转10°(鼻尖朝右);表情:眼神直视右前方(无焦点),嘴唇轻闭,神态平静中带疏离,整体因人物小比例与空旷背景显强烈孤独感。

图6:30岁东方女性,丰满御姐,黑色长发(发尾过肩),绝世容颜,穿【黑色无袖吊带(领口贴锁骨)+红色直筒长裙(裙摆盖脚踝)】。场景:纯黑空间,右侧有灰黑色粗水泥柱(柱宽≈画面宽度1/6,高度贯穿画面);光线:硬光,从左侧偏上30°斜射,柱子左侧与人物左侧受光,右侧全暗;人物位置:紧贴柱子左侧(左肩距柱面1cm),位于画面右侧1/3,全身占画面高度1/5(同图1比例);动作:双手背于柱后(仅手腕露于柱侧),头部轻靠柱子(后脑勺贴柱面);表情:眼神向左下方,眼皮半垂,神态慵懒中带孤独,整体因人物小比例与空旷背景显强烈孤独感。

这组案例展示了即梦AI参考图模式在保持人物和场景一致性的潜力,它简化了操作,避免了在每张图上反复描述基础细节。
但也能看到,当涉及到精确的光影控制、复杂的构图比例、特定姿态以及与环境的深度互动时,结果有时会偏离预期。这说明参考图模型还有提升空间。
不过,这依然是一个非常实用的功能。它的价值在于:
1、锁定核心形象:大大提升了复杂场景特征的稳定性。
2、提升操作效率:省去了重复描述基础特征的麻烦。
3、未来可期:随着即梦AI的持续升级,参考图功能的精准度值得期待。
下期预告:我们将尝试完全不用参考图,仅靠精准的提示词描述来挑战生成另一组风格统一的人物写真,看看纯文字提示能做到什么程度。