1. API请求
智信AI-使用指南
  • 使用指南
    • 平台介绍
    • 使用指南
      • 快速开始
      • 注册账号
      • 账户充值
      • 新建API令牌
      • 获取BaseUrl
      • 系统令牌及用户ID
      • 余额查询接口
      • 计费规则
      • 平台管理类接口
        • 模型列表查询
        • 检索API令牌
        • 模型用量查询
        • 获取API令牌
    • 开发者文档
      • 基础核心概念
      • API请求
        • 平台通用格式
        • 文本对话(非流)
        • 文本对话(流式)
        • 输出JSON格式
        • 向量嵌入
        • 函数调用
        • 图片分析
        • Responses API
    • 接入指南
      • 编程工具
        • Cursor 配置指南
        • VSCode (Continue) 配置指南
        • Claude Code 配置指南
      • 应用集成
        • NextChat 配置指南
        • Open Claw 配置指南
        • Chatbox 配置指南
        • Dify 配置指南
  1. API请求

Responses API

OpenAI新一代统一接口 Responses API#


OpenAI Responses API(/v1/responses)是替代 Chat Completions 的新一代统一接口,主打有状态、内置工具、多模态、流式细粒度事件。下面从端点、请求体、响应体、流式事件、常用参数对比五部分完整介绍。

一、基础端点与认证#

端点:POST /v1/responses
认证:Authorization: Bearer sk-xxx
核心定位:一个接口统一文本、图像、工具调用、多轮对话

二、请求体格式(JSON)#

最简请求#

{
  "model": "gpt-4o",
  "input": "什么是Embedding?"
}

完整请求结构(含常用参数)#

{
  "model": "gpt-4o-2025-04-14",
  "input": [
    {"role": "user", "content": "什么是Embedding?"}
  ],
  "instructions": "你是AI技术专家,用通俗语言解释",
  "max_output_tokens": 1024,
  "temperature": 0.7,
  "top_p": 1.0,
  "store": true,
  "previous_response_id": "resp_xxx",
  "tools": [
    {"type": "web_search"},
    {"type": "code_interpreter"}
  ],
  "tool_choice": "auto",
  "response_format": {
    "type": "json_schema",
    "json_schema": {
      "name": "Explanation",
      "strict": true,
      "schema": {"type": "object", "properties": {"answer": {"type": "string"}}}
    }
  },
  "stream": false
}

关键字段说明#

model:模型名(如 gpt-4o、o3)
input:输入内容,支持字符串或消息数组(role/content)
instructions:系统级指令(替代旧版 system 角色)
max_output_tokens:最大输出 token(旧版 max_tokens)
store:是否持久化响应(默认 false,多轮设 true)
previous_response_id:多轮对话的上一轮响应 ID(有状态核心)
tools:内置工具(web_search/code_interpreter/file_search 等)
response_format:结构化输出(支持 json_schema,旧版 response_format 迁移)
stream:是否流式返回(true 启用 SSE)

三、响应体格式(非流式,JSON)#

标准响应示例#

{
  "id": "resp_67cb32528d6881909eb2859a55e18a85",
  "object": "response",
  "created_at": 1741369938.0,
  "model": "gpt-4o-2024-08-06",
  "output": [
    {
      "id": "msg_67cb3252cfac8190865744873aada798",
      "type": "message",
      "role": "assistant",
      "content": [
        {
          "type": "output_text",
          "text": "Embedding是将文本转为高维向量的技术...",
          "annotations": []
        }
      ]
    }
  ],
  "output_text": "Embedding是将文本转为高维向量的技术...",
  "usage": {
    "input_tokens": 28,
    "output_tokens": 42,
    "total_tokens": 70
  },
  "error": null,
  "status": "completed"
}

关键字段说明#

id:响应唯一 ID(多轮用 previous_response_id)
object:固定为 response
output:输出数组,包含消息/工具调用/推理等项
output_text:快捷获取纯文本内容(无需遍历 output)
usage:token 消耗统计
status:状态(completed/in_progress/failed)

四、流式响应(SSE,stream: true)#

事件流格式#

每行以 event: 和 data: 开头,最后以 data: [DONE] 结束。

核心事件类型#

1.
响应生命周期事件
event: response.created
data: {"id":"resp_xxx","status":"in_progress"}

event: response.completed  
data: {"id":"resp_xxx","status":"completed","usage":{...}}
2.
文本输出事件
event: response.output_text.delta
data: {"delta":"Embedding"}

event: response.output_text.delta
data: {"delta":"是将文本转为"}

event: response.output_text.done
data: {"text":"Embedding是将文本转为高维向量的技术..."}
3.
工具调用事件
event: response.web_search_call.created
data: {"id":"wsc_xxx","action":"search","queries":["什么是Embedding"]}

event: response.web_search_call.completed
data: {"id":"wsc_xxx","status":"completed"}

五、与 Chat Completions 核心差异#

特性Chat CompletionsResponses API
端点/v1/chat/completions/v1/responses
输入messages 数组input(字符串/数组)
系统指令system 角色instructions 字段
最大输出max_tokensmax_output_tokens
多轮对话手动传历史消息previous_response_id(有状态)
工具调用需自定义 functions内置 web_search/code_interpreter
流式事件粗粒度 choices.delta细粒度 output_text.delta/tool_call 事件

六、常用代码示例(Python)#

非流式调用#

流式调用#


修改于 2026-05-12 07:49:09
上一页
图片分析
下一页
Cursor 配置指南
Built with