共计 1835 个字符,预计需要花费 5 分钟才能阅读完成。
背景痛点:为什么需要自动化生成提示词?
手动编写 MidJourney 提示词 (Prompt) 存在明显的效率瓶颈:

- 风格描述不准确:非专业艺术家难以用文字精确表达视觉风格需求,比如 ” 赛博朋克 ” 可能被简单描述为 ” 未来感 ”,导致生成结果偏离预期
- 参数组合试错成本高:一个完整提示词通常包含主体、环境、风格、参数四部分,调整任意元素都需要重新生成测试,耗费大量 GPU 时间
- 语义模糊问题:如 ” 一个美丽的风景 ” 这种描述过于主观,AI 难以理解具体需求
- 元素冲突:常见于同时要求矛盾属性,比如 ” 极简主义的复杂装饰 ”
技术方案设计
路径对比:直接生成 vs 模板约束
- 直接生成:完全由 ChatGPT 自由发挥,优点是有创意多样性,缺点是质量不稳定
- 模板约束:预设结构化的输入输出格式,优点是可控性强,缺点是可能限制创造力
实际采用 混合策略:通过系统消息设定基本框架,同时保留部分自由发挥空间
ChatGPT 提示工程关键点
- 系统消息设定:
system_message = """ 你是一位专业数字艺术助手,擅长为 MidJourney 生成精准提示词。输出格式:英文,按 [主题描述][环境细节][艺术风格][技术参数] 四段式结构。艺术风格需明确具体流派或艺术家,如 'by Studio Ghibli'"""
- 三段式输入设计:
- 风格基调(如 ” 水墨画风格 ”)
- 核心主题(如 ” 竹林中的熊猫 ”)
-
细节要求(如 ” 晨雾氛围,有红色印章效果 ”)
-
温度参数调节:
- 温度(Temperature)=0.3 时生成保守但稳定的提示词
- 温度(Temperature)=0.7 时更具创意但可能偏离需求
Python 实现代码
完整异步请求示例:
import openai
from typing import Optional
async def generate_mj_prompt(
theme: str,
style: str = "fantasy art",
max_tokens: int = 120,
temperature: float = 0.5
) -> Optional[str]:
"""
生成 MidJourney 提示词
参数说明:- max_tokens: 设为 120 可覆盖典型提示词长度
- temperature: 推荐 0.3-0.7 区间
"""
try:
response = await openai.ChatCompletion.acreate(
model="gpt-3.5-turbo",
messages=[{"role": "system", "content": system_message},
{"role": "user", "content": f"主题:{theme}| 风格:{style}"}
],
max_tokens=max_tokens,
temperature=temperature
)
# 基础结果过滤
raw_text = response.choices[0].message.content
if "sorry" in raw_text.lower():
return None
return raw_text.strip()
except Exception as e:
print(f"API 错误: {e}")
return None
关键防护措施:
- 通过
max_tokens限制生成长度避免资源浪费 - 错误消息过滤防止返回无意义内容
- 异步请求避免阻塞主线程
效果验证
测试 100 组提示词的生成效果:
| 评估指标 | 直接生成 | 模板约束 | 混合策略 |
|---|---|---|---|
| 可执行率 | 62% | 89% | 93% |
| 风格匹配度 | 4.2/10 | 7.8/10 | 8.5/10 |
| 创意新颖性 | 8.1/10 | 5.3/10 | 7.6/10 |
避坑指南
- 版权风险:
- 避免生成 ”in the style of [在世艺术家]” 类提示词
-
对明显涉及真人肖像的描述添加过滤词
-
成本优化:
- 本地缓存高频组合如 ”cyberpunk cityscape”
-
使用
gpt-3.5-turbo而非更贵的模型 -
质量保障:
- 必须保留人工审核环节
- 建立提示词黑白名单库
延伸思考
AI 生成与人类创造力的边界其实在于:
- 目前 AI 更适合作为灵感加速器而非替代者
- 最佳实践是先用 AI 生成多个选项,再由人类艺术家精选调整
改进方向建议:
- 结合 Stable Diffusion 的负面提示词 (negative prompt) 优化
- 开发可视化提示词调整工具
- 构建风格关键词向量数据库
实践心得
经过两个月的实际应用,这套方法使我们的提示词生成效率提升了 3 倍。最大的收获是:AI 生成的提示词往往能跳出人类思维定式,提供意想不到的风格组合。但同时也发现,最出彩的作品仍然需要人工对 AI 生成结果进行二次加工。技术工具与艺术直觉的结合,才是当前阶段的最优解。
正文完
发表至: AI技术
近一天内
