创建聊天补全

POST/v1/chat/completions

为给定对话创建聊天补全响应。

身份验证

Authorization Bearer

在 Authorization header 中使用 API key 作为 Bearer token。

Request Body

modelstringdefault:glm-5.1required

要调用的文本模型代码。

Example: "glm-5.1"

messagesMessage[]required

作为模型输入的对话消息。

messages.roleenum<string>default:userrequired

消息作者角色。

Available options: system user assistant tool

messages.contentstringrequired

文本消息内容。

messages.tool_callsobject[]

assistant 消息生成的工具调用。

messages.tool_call_idstringtool 消息必填

tool 消息回应的工具调用 ID。

temperaturenumberdefault:1

采样温度。值越低越稳定。

max_tokensinteger

最大生成 token 数。

streambooleandefault:false

为 true 时返回 Server-Sent Events。

top_pnumberdefault:1

核采样参数。

stopstring | string[]

停止序列。

thinkingobject

推理控制,例如 {"type":"enabled"}、{"type":"disabled"} 或 {"type":"auto"}。

response_formatobject

结构化输出格式,例如 json_object 或 json_schema。

toolsobject[]

模型可调用的工具定义。

tool_choicestring | objectdefault:auto

工具选择策略。

Response

idstring

唯一补全 ID。

objectstring

非流式响应中为 chat.completion。

createdinteger

Unix 时间戳。

modelstring

本次请求使用的模型。

choicesobject[]

生成结果。

choices.indexinteger

结果下标。

choices.messageobject

assistant 消息。

choices.finish_reasonstring

stop、length 或 tool_calls。

usageobject

Token 用量和费用信息。

请求

1curl -X POST https://api.token360.ai/v1/chat/completions \
2  -H "Authorization: Bearer sk-your-api-key" \
3  -H "Content-Type: application/json" \
4  -d '{
5    "model": "glm-5.1",
6    "messages": [
7      {"role": "user", "content": "Reply with the exact text: Hello from Token360."}
8    ],
9    "temperature": 0.1,
10    "max_tokens": 20
11  }'

响应

JSON
1{
2  "id": "your-chat-completion-id",
3  "object": "chat.completion",
4  "created": 1776351874,
5  "model": "glm-5.1",
6  "choices": [
7    {
8      "index": 0,
9      "message": {
10        "role": "assistant",
11        "content": "Hello from Token360."
12      },
13      "finish_reason": "stop"
14    }
15  ],
16  "usage": {
17    "prompt_tokens": 57,
18    "completion_tokens": 7,
19    "total_tokens": 64
20  }
21}
此页面对您有帮助吗?