Ollama 官方中文文档
  1. 生成对话补全
Ollama 官方中文文档
  • 接口 Endpoints
  • 规范 Conventions
  • 生成补全
    • 概括
    • 流式生成请求(Streaming)
      POST
    • 非流式生成请求(No Streaming)
      POST
    • 带后缀的生成请求(with Suffix)
      POST
    • 结构化输出请求(Structured Outputs)
      POST
    • JSON 模式请求(JSON Mode)
      POST
    • 带图像的生成请求(with Images)
      POST
    • 原始模式请求(Raw Mode)
      POST
    • 可复现输出请求(Reproducible Outputs)
      POST
    • 参数化生成请求(with Options)
      POST
    • 加载模型
      POST
    • 卸载模型
      POST
  • 生成对话补全
    • 概括
    • 流式对话请求(Streaming)
      POST
    • 非流式对话请求(No Streaming)
      POST
    • 结构化输出对话请求(Structured Outputs)
      POST
    • 带历史上下文的对话请求(With History)
      POST
    • 带图像的对话请求(with Images)
      POST
    • 可复现输出的对话请求(Reproducible Outputs)
      POST
    • 支持工具调用的对话请求(with Tools)
      POST
    • 加载模型
      POST
    • 卸载模型
      POST
  • 创建模型
    • 概括
    • 创建新模型
      POST
    • 量化模型
      POST
    • 从 GGUF 文件创建模型
      POST
    • 从 Safetensors 目录创建模型
      POST
  • 检查 Blob 是否存在
    • 概括
  • 推送 Blob
    • 概括
  • 列出本地模型
    • 概括
    • 示例
  • 显示模型详情
    • 概括
    • 示例
  • 复制模型
    • 概括
    • 示例
  • 删除模型
    • 概括
    • 示例
  • 拉取模型
    • 概括
    • 示例
  • 推送模型
    • 概括
  • 生成嵌入向量
    • 概括
    • 示例
    • 多输入请求(Multiple Input)
  • 列出运行中模型
    • 概括
    • 示例
  • 生成单个嵌入向量
    • 概括
    • 示例
  • 版本信息
    • 概括
  1. 生成对话补全

概括

POST /api/chat
使用提供的模型生成聊天中的下一条消息。这是一个流式传输端点,因此会有一系列响应。可以使用 "stream": false" 禁用流式传输。最终的响应对象将包含请求的统计信息和附加数据。

参数 (Parameters)#

model:(必需) 模型名称 (model name)
messages:聊天的消息,可用于保持聊天记忆。
tools:JSON 格式的工具列表,供模型在支持的情况下使用。
message 对象具有以下字段:
role:消息的角色,可以是 system、user、assistant 或 tool。
content:消息的内容。
images (可选):要包含在消息中的图像列表(对于多模态模型,如 llava)。
tool_calls (可选):模型想要使用的 JSON 格式的工具列表。
高级参数 (Advanced parameters) (可选):
format:返回响应的格式。格式可以是 json 或 JSON schema (JSON schema)。
options:Modelfile 文档中列出的其他模型参数,例如 temperature。
stream:如果为 false,则响应将作为单个响应对象返回,而不是一系列对象。
keep_alive:控制模型在请求后保持加载到内存中的时间(默认值:5m)。

结构化输出 (Structured outputs)#

通过在 format 参数中提供 JSON schema (JSON schema) 来支持结构化输出。模型将生成与 schema (schema) 匹配的响应。请参阅下面的聊天请求(结构化输出)(Chat request (Structured outputs)) 示例。
修改于 2025-03-17 08:16:00
上一页
卸载模型
下一页
流式对话请求(Streaming)
Built with