Gemini 2.0引领文生图变革,修改可控性与多样功能凸显

AI快讯5小时前发布 niko
13 0
AiPPT - 一键生成ppt

gemini 2.0改写文生图可控性格局 在文生图技术不断演进的当下,Gemini2.0的出现堪称重大变革。此前,文生图的可控性一直是行业难题,而Gemini 2.0 FlashExperimental以其卓越的修改可控性脱颖而出。例如在一组花田图测试中,使用Imagen3官方实例生成图片后,通过简单的修改提示词,模型精准理解“局部改色”意图,仅对天空局部改动,花田和天空过渡处的油彩基本不变,充分展示了其强大的可控性。

生成与修改的最佳搭配在实际应用中,局部修改功能若直接在现有图片上操作,效果欠佳。而最稳定的方式是从生成到修改一条龙完成。以城市街景为例,通过逐步的提示词引导,从白天到夜晚的场景变换中,模型严格按照指令,说改车就改车,行人部分若无改动指令则保持原样,后续修改的可控性极高,这一组合为文生图创作提供了可靠路径。

视角改动拓展应用边界 除了局部改动,Gemini2.0还具备实用的视角改动功能。这对于短片故事板、产品多视角展示等领域帮助巨大。在产品图修改方面,真正实现了创作者的随心所欲。不过,在下达指令时需要注意,要描述图片最终的样子,而非修改过程,指令越简单直接,模型理解和执行得越好。

基础设置与应用尝试 进入StUdio使用Gemini 2.0时,一些基础设置必不可少。需在右侧Model一栏选择最新的Gemini 2.0FlashExperimental,成功进入后,在左侧Library一栏设置账号关联生成Library,以确保能保存会话。此外,创作者还进行了各种有趣尝试,如将生日卡片中的花朵替换成星球并做3D效果,甚至发出“我要五彩斑斓的黑”这样极具挑战的指令,虽等待良久未得到满意结果,但也从侧面反映了Gemini2.0在理解复杂指令上的局限。

© 版权声明
智谱清言 - 国产最强AI模型