ERNIE-Image 接入 ERNIE Bot:对话式 AI 绘画实战指南

mei 5, 2026

ERNIE-Image 接入 ERNIE Bot:对话式 AI 绘画实战指南

百度官方将 ERNIE-Image 集成到 ERNIE Bot 平台,实现"对话即绘画"的新范式——无需 ComfyUI、无需编程。


一、ERNIE Bot 平台介绍

ERNIE Bot(文心一言)是百度推出的对话式 AI 平台,2026 年 4 月正式集成 ERNIE-Image 图像生成能力。

核心特性

特性 说明
对话式交互 通过自然语言对话直接生成图像
多轮迭代 基于对话上下文逐步优化生成结果
零门槛 无需安装 ComfyUI 或配置环境
API 集成 提供 REST API 供开发者调用

访问入口


二、对话式 AI 绘画工作流

基础对话

用户:帮我画一只在花园里散步的猫
ERNIE Bot:[生成图像]

多轮迭代优化

用户:帮我画一只猫
ERNIE Bot:[生成初始图像]

用户:把背景换成雪景
ERNIE Bot:[重新生成:猫在雪地中]

用户:加上圣诞帽
ERNIE Bot:[最终图像:戴圣诞帽的猫在雪地中]

关键技巧

  1. 详细描述:越详细,生成质量越高
  2. 分步优化:先粗后精,逐步调整
  3. 参考风格:提及具体艺术家或风格

三、API 调用实战

获取 API Key

  1. 登录百度智能云控制台
  2. 创建应用 → 获取 API Key 和 Secret Key

Python 调用示例

import requests
import base64

def ernie_image_generate(prompt, api_key, secret_key):
url = "https://aip.baidubce.com/rpc/2.0/ernie-image/v1/generate"

# 获取 access_token
token_url = f"https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id={api_key}&client_secret={secret_key}"
token_response = requests.get(token_url).json()
access_token = token_response["access_token"]

# 生成图像
response = requests.post(
    f"{url}?access_token={access_token}",
    json={
        "prompt": prompt,
        "n": 1,
        "size": "1024x1024",
        "model": "ernie-image-8b"
    }
)

result = response.json()
image_data = base64.b64decode(result["data"][0]["url"])

return image_data

使用示例

image = ernie_image_generate(
"一只橘猫坐在窗台上,阳光洒在它身上,窗外是城市夜景",
"YOUR_API_KEY",
"YOUR_SECRET_KEY"
)


四、ComfyUI vs ERNIE Bot 对比

维度 ComfyUI ERNIE Bot
技术门槛 高(需配置环境) 低(对话即可)
灵活性 极高(自定义节点) 中(对话控制)
批量生产 支持(CSV/API) 有限
IP-Adapter 支持 不支持
ControlNet 支持 不支持
成本 本地免费 按量计费

选择建议

  • 个人用户:ERNIE Bot(零门槛)
  • 专业创作者:ComfyUI(完全控制)
  • 企业应用:API + ComfyUI 组合

五、商用集成方案

场景 1:电商商品图生成

def generate_product_images(product_name, styles):
    images = []
    for style in styles:
        prompt = f"{product_name}, {style}, professional product photography"
        image = ernie_image_generate(prompt, api_key, secret_key)
        images.append(image)
    return images

场景 2:社交媒体内容

def generate_social_media_content(topic, platform):
    templates = {
        "xiaohongshu": "lifestyle, aesthetic, warm tones",
        "weibo": "vibrant, eye-catching, trending style",
        "wechat": "clean, professional, editorial"
    }
    style = templates.get(platform, "general")
    prompt = f"{topic}, {style}, social media content"
    return ernie_image_generate(prompt, api_key, secret_key)

六、总结

ERNIE-Image 接入 ERNIE Bot 的核心价值:

  1. 零门槛:对话即可生成高质量图像
  2. 多轮迭代:基于上下文逐步优化
  3. API 集成:开发者可快速集成到自有应用
  4. 商业友好:按量计费,无初始投入

对于普通用户,这是"从想法到图片"的最短路径。对于开发者,API 提供了灵活的集成方案。


本文基于 ERNIE Bot 官方 API 和 ERNIE-Image 8B 模型。

ERNIE-Image Team