图像生成领域Prompt 的七个缺陷

返回首页　

设为首页　

加入收藏　

今天是:

网站首页音乐游戏家居汽车公益旅游体育文化美食

图像生成领域Prompt 的七个缺…
《中国大百科全书》中的“范…
跨越边界：探索中国文化对外…
中国十大米粉排名
济南发布餐饮行业五项标准名…
中国十大最“臭”美食你敢尝…
在美食体验周走近林芝
美食与传统文化相融合！第八…
萌龙大乱斗怎么改名字萌龙大…
一股清流来袭 LPL的选手们谁…
全民水浒怎么改名全民水浒改…
个人向-名字最好听的六个中国…
金庸小说哪些高手名字很好听…
腾讯音乐研究院：2022华语数…
在线音乐付费用户破亿腾讯音…
特斯拉招募中国运营团队推动…
首款QQ音乐“臻品认证”空间…
腾讯音乐2023Q2财报扎实稳健…
比亚迪说在一起长城说不如打…
汽车产业不再被卡脖子！王传…
雪佛兰用硬核实力展现运动基…
新能源汽车进入“拼速”时代
长城VS比亚迪谁是中国汽车的…
中安在线铜陵频道铜陵新闻
捐赠衣物达3吨东莞电信心系广…
韵达快递开通公益捐赠服务免…
孩子们亲手“复活”的一台台…
甘肃：结对帮扶送关爱真情助…
2023年铁艺床十大品牌排行榜
百源板材荣膺甄品榜生态板十…
2022美国家具出口统计：加拿…
帝舜搏杀恶龙娥皇女英泪化湘…
《轩辕剑3》炼妖壶炼化表
美国vs约旦前瞻：“镜像科比…
NBA随便打就有好数据的巨星：…
NBA震惊世界的五大大交易湖人…
NBA五方大交易哈登加盟热火湖…
恩比德联手杜兰特！NBA震撼交…
这趟Y字头列车直达茶卡！网友…
茶卡盐湖·天空之镜「天镜回…
十一黄金周有哪些值得一去的…
秋天去哪儿？这五个地方让你…
2023哈尔滨旅游攻略两天一夜…
在巩固文化主体性中不断攀登…
2023年中国文化馆年会在包头…
生态+文化+体育+赛事！中国&…
在文化传承发展座谈会上的讲…
28年的文明工程探索与实践 2…
它是“长寿菜”一护肝二清热…
七夕快到了分享4道家常菜的做…

专题栏目

您现在的位置：资讯速递网 >> 文化 >> 正文

高级搜索

图像生成领域Prompt 的七个缺陷

作者：佚名文章来源：本站原创点击数：更新时间：2023/9/5 21:19:41 | 【字体：小大】

　　另类专区在向 AI 模型传递指令的过程中，我们常常需要借助 Prompt 这一形式，那么 Prompt 作为载体，是否存在一定的缺陷呢？本文作者讨论了图像生成领域里 Prompt 的七个缺陷，一起来看看吧。

　　src=Prompt是向 AI 模型传递指令的核心形式，随着 AI 绘画从艺术领域向设计领域深入，创作诉求趋于严谨、精确，Prompt 作为创作意图的重要载体，一些缺陷日益凸显，对生成结果的可控性、可用性有很大影响。

　　创作者要将大脑中构思的画面通过文字表达出来，画面是三维的、立体的，而文字却是一维的、线性的。

　　对于较为复杂的创作意图，这个转化过程极具挑战性、技巧性，依赖反复书写带来的经验累积或是专门的学习。

　　同一组用词，同一句话，受到语境、文化、群体共识等客观因素的影响，可能存在多重含义，面对文本的多义性，模型理解很容易发生偏差，生成内容无法切中创作者的真实意图。而创作者要基于错误反馈不断对导致歧义的内容进行替换、校正。

　　尽管多一些描述可以给模型更多细节，但当前 AI 模型对字数始终存在一个模糊的理解上限，超过上限后的内容，要么理解错乱，要么直接无视，所以创作平台往往对 Prompt 字数加以限制，这就导致更多的创意想法无法被完整表达。

　　相比口语化表达，模板化的描述指令更容易被模型理解而且更稳定，具有长期创作需求的创作者，需要学习并熟练掌握基于技术逻辑反推出的的指令公式（如：画面主体 + 场景 + 细节 + 风格修饰），还有控制各类权重的命令参数（如：-seed；-chaos；-::；— iw 等）。

　　对于不是描述主体的指令，往往难以判断它是否已对画面产生影响，因此我们看到绝美、完美、超美、大师画质、超高画质、顶级画质经常出现在一条 Prompt 中，冗余甚至相互对立。如需调整，则要通过删 A 留 B，删 B 留 A 的方式反复比对来定位修改点。

　　尤其是设计师的创作场景，对形式、位置、比例、层次、关系等要素的处理更加专业严谨，文字型指令可以做到但书写成本极高，用户能否写出画面偏左四分之三居中位置，一条高一百像素的金鱼？模型又能否对此精准执行？目前看，依靠 Prompt 进行精细化控制并不现实。

　　除使用创作相似外，创作者生成前对生成结果不可预测，生成过程又类似于黑箱，所以大家往往先生成几张，看看什么效果，找到符合预期的那张再继续深入。这个交互关系中最大的问题在于反馈的高延迟，造成了过高的尝试成本。

　　src=Prompt 的这些特点或问题，让人不得不想起 PC 系统早期的DOS 命令行界面：需要掌握语言范式、缺乏提示反馈、没有快捷操作、不直观等问题，让很多计算机初学者望而却步。

　　src=以上为输入环节，而在模型一侧，Prompt 的解码过程又会丢失一部分信息，使得创作者大量意图指令无法精准、有效的传递给生成模型，最终得到一个错误的或是可用性较低的生成结果，人们感到挫败并对技术能力产生质疑，其实，生成模型的能力往往由于语义理解的限制，并没有得到充分发挥。

　　如果经常使用 AI 绘画平台，可能对这些 Prompt 功能并不陌生：一键复制、创作相似、灵感推荐、智能补全、咒语大全、咒语生成器、创作手册、词包、撰写教程等等。这些功能在一定程度上降低了 Prompt 的撰写成本，尤其针对体验型、尝鲜型的用户，创作效率和质量均有提升，但对带有明确应用场景的设计师群体来说，上述问题依然存在。

　　那 Prompt 指令的问题如何解决？又如何让操作体验真正做到平民化呢？

　　显然技术侧的进展更快，涂抹、叠加、扩展等二次编辑能力，以 Lora 为代表的微调模型，还有 Controlnet 技术，支持边缘检测、草图处理、姿势识别等前沿黑科技，都在试图融合更多其他模态的意图信息，与 Prompt 形成互补，让生成结果更加精准可控。

　　说回体验层面，以 Prompt 为核心的创作范式可能并非终极形态，这方面的探索尚未达成共识。我想，在 PC 时代，图形用户界面基于出色的交互体验，快速取代了 DOS 命令行一直影响至今，即使进入 AIGC 时代，答案也许仍在其中。

文化录入：admin 责任编辑：admin
	上一个文化：《中国大百科全书》中的“范化” 下一个文化：没有了

　栏目文章

图像生成领域Prompt 的七个缺陷 (09-05)	《中国大百科全书》中的“范化” (09-05)
跨越边界：探索中国文化对外译介的有效机制 (09-05)	在巩固文化主体性中不断攀登新的思想高峰（深… (09-05)
2023年中国文化馆年会在包头开幕 (09-05)	生态+文化+体育+赛事！中国•密山兴凯湖… (09-05)
在文化传承发展座谈会上的讲话 (09-05)	28年的文明工程探索与实践 20年的《文明》探究… (09-05)
风雨故人来——进京赶考的台湾士子遇到台风怎… (09-04)	第二届“侨见·我们的故事”中华文化海外传播… (09-04)
国内外百余学者齐聚草原推进中国北部边疆民族… (09-04)	【地评线】荔枝网评：点亮传承发展之光铸就中… (09-04)
“丰收中国”融合传播行动启动！总台“三农”… (09-04)	坚守文学价值彰显中国精神 (09-04)
40年铸就文学的时代品格（逐梦40年） (09-04)	《中国文学史》：回到中国文学的本位立场 (09-04)
新中国文学70年：人民性的生动展示 (09-04)	精英立场应如何介入中国当代文学价值的评估？ (09-04)
国智书院｜长征智库首届长征文化导游实训班在… (09-03)	什么是好的企业文化？刘劲管理随笔 (09-03)

	设为首页加入收藏联系站长友情链接版权申明网站公告管理登录
	资讯速递网声明：登载内容出于传递信息之目的，绝不意味着赞同其观点或证实其描述，若侵权请来信告知，我们将及时处理！