Ollama 官方中文文档
  1. 生成对话补全
Ollama 官方中文文档
  • 接口 Endpoints
  • 规范 Conventions
  • 生成补全
    • 概括
    • 流式生成请求(Streaming)
      POST
    • 非流式生成请求(No Streaming)
      POST
    • 带后缀的生成请求(with Suffix)
      POST
    • 结构化输出请求(Structured Outputs)
      POST
    • JSON 模式请求(JSON Mode)
      POST
    • 带图像的生成请求(with Images)
      POST
    • 原始模式请求(Raw Mode)
      POST
    • 可复现输出请求(Reproducible Outputs)
      POST
    • 参数化生成请求(with Options)
      POST
    • 加载模型
      POST
    • 卸载模型
      POST
  • 生成对话补全
    • 概括
    • 流式对话请求(Streaming)
      POST
    • 非流式对话请求(No Streaming)
      POST
    • 结构化输出对话请求(Structured Outputs)
      POST
    • 带历史上下文的对话请求(With History)
      POST
    • 带图像的对话请求(with Images)
      POST
    • 可复现输出的对话请求(Reproducible Outputs)
      POST
    • 支持工具调用的对话请求(with Tools)
      POST
    • 加载模型
      POST
    • 卸载模型
      POST
  • 创建模型
    • 概括
    • 创建新模型
      POST
    • 量化模型
      POST
    • 从 GGUF 文件创建模型
      POST
    • 从 Safetensors 目录创建模型
      POST
  • 检查 Blob 是否存在
    • 概括
  • 推送 Blob
    • 概括
  • 列出本地模型
    • 概括
    • 示例
  • 显示模型详情
    • 概括
    • 示例
  • 复制模型
    • 概括
    • 示例
  • 删除模型
    • 概括
    • 示例
  • 拉取模型
    • 概括
    • 示例
  • 推送模型
    • 概括
  • 生成嵌入向量
    • 概括
    • 示例
    • 多输入请求(Multiple Input)
  • 列出运行中模型
    • 概括
    • 示例
  • 生成单个嵌入向量
    • 概括
    • 示例
  • 版本信息
    • 概括
  1. 生成对话补全

支持工具调用的对话请求(with Tools)

POST
http://localhost:11434/api/chat
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST 'http://localhost:11434/api/chat' \
--header 'Content-Type: application/json' \
--data-raw '{
    "model": "gpt-3.5-turbo",
    "messages": [
        {
            "role": "user",
            "content": "你好,你是谁?"
        }
    ],
    "stream": false,
    "tools": [
        {
            "type": "function",
            "function": {
                "name": "get_current_weather",
                "description": "获取当前天气",
                "parameters": {
                    "type": "object",
                    "properties": {
                        "property1": {
                            "type": "string",
                            "description": "城市名称",
                            "enum": [
                                "北京",
                                "上海",
                                "广州"
                            ]
                        },
                        "property2": {
                            "type": "string",
                            "description": "城市名称",
                            "enum": [
                                "北京",
                                "上海",
                                "广州"
                            ]
                        }
                    },
                    "required": [
                        "location"
                    ]
                }
            }
        }
    ]
}'
响应示例响应示例
{
  "model": "llama3.2",
  "created_at": "2024-07-22T20:33:28.123648Z",
  "message": {
    "role": "assistant",
    "content": "",
    "tool_calls": [
      {
        "function": {
          "name": "get_current_weather",
          "arguments": {
            "format": "celsius",
            "location": "Paris, FR"
          }
        }
      }
    ]
  },
  "done_reason": "stop",
  "done": true,
  "total_duration": 885095291,
  "load_duration": 3753500,
  "prompt_eval_count": 122,
  "prompt_eval_duration": 328493000,
  "eval_count": 33,
  "eval_duration": 552222000
}

请求参数

Body 参数application/json
model
string 
使用的模型名称
必需
示例值:
gpt-3.5-turbo
messages
array [object {2}] 
必需
role
string 
消息角色
必需
示例值:
user
content
string 
消息内容
必需
示例值:
你好,你是谁?
stream
boolean 
是否使用流式响应
可选
示例值:
false
tools
array [object {2}] 
可选
type
string 
工具类型
可选
示例值:
function
function
object 
可选
示例

返回响应

🟢200Success
application/json
Body
model
string 
必需
created_at
string 
必需
message
object 
必需
role
string 
必需
content
string 
必需
tool_calls
array [object {1}] 
必需
done_reason
string 
必需
done
boolean 
必需
total_duration
integer 
必需
load_duration
integer 
必需
prompt_eval_count
integer 
必需
prompt_eval_duration
integer 
必需
eval_count
integer 
必需
eval_duration
integer 
必需
修改于 2025-03-27 09:15:13
上一页
可复现输出的对话请求(Reproducible Outputs)
下一页
加载模型
Built with