用ChatGPT生成MidJourney提示词的技术实践与避坑指南

19次阅读

没有评论

共计 1835 个字符，预计需要花费 5 分钟才能阅读完成。

手动编写 MidJourney 提示词 (Prompt) 存在明显的效率瓶颈：

风格描述不准确：非专业艺术家难以用文字精确表达视觉风格需求，比如 ” 赛博朋克 ” 可能被简单描述为 ” 未来感 ”，导致生成结果偏离预期
参数组合试错成本高：一个完整提示词通常包含主体、环境、风格、参数四部分，调整任意元素都需要重新生成测试，耗费大量 GPU 时间
语义模糊问题：如 ” 一个美丽的风景 ” 这种描述过于主观，AI 难以理解具体需求
元素冲突：常见于同时要求矛盾属性，比如 ” 极简主义的复杂装饰 ”

直接生成：完全由 ChatGPT 自由发挥，优点是有创意多样性，缺点是质量不稳定
模板约束：预设结构化的输入输出格式，优点是可控性强，缺点是可能限制创造力

实际采用 混合策略：通过系统消息设定基本框架，同时保留部分自由发挥空间

系统消息设定：

system_message = """ 你是一位专业数字艺术助手，擅长为 MidJourney 生成精准提示词。输出格式：英文，按 [主题描述][环境细节][艺术风格][技术参数] 四段式结构。艺术风格需明确具体流派或艺术家，如 'by Studio Ghibli'"""

三段式输入设计：
风格基调（如 ” 水墨画风格 ”）
核心主题（如 ” 竹林中的熊猫 ”）
细节要求（如 ” 晨雾氛围，有红色印章效果 ”）
温度参数调节：
温度(Temperature)=0.3 时生成保守但稳定的提示词
温度(Temperature)=0.7 时更具创意但可能偏离需求

完整异步请求示例：

import openai
from typing import Optional

async def generate_mj_prompt(
    theme: str, 
    style: str = "fantasy art",
    max_tokens: int = 120,
    temperature: float = 0.5
) -> Optional[str]:
    """
    生成 MidJourney 提示词

    参数说明：- max_tokens: 设为 120 可覆盖典型提示词长度
    - temperature: 推荐 0.3-0.7 区间
    """
    try:
        response = await openai.ChatCompletion.acreate(
            model="gpt-3.5-turbo",
            messages=[{"role": "system", "content": system_message},
                {"role": "user", "content": f"主题:{theme}| 风格:{style}"}
            ],
            max_tokens=max_tokens,
            temperature=temperature
        )

        # 基础结果过滤
        raw_text = response.choices[0].message.content
        if "sorry" in raw_text.lower():
            return None

        return raw_text.strip()
    except Exception as e:
        print(f"API 错误: {e}")
        return None

关键防护措施：