概括 - Ollama 官方中文文档

`POST /api/embed`

从模型生成嵌入向量 (embeddings)。

model: 用于生成嵌入向量的模型名称

input: 要生成嵌入向量的文本或文本列表

高级参数：

truncate: 是否截断每个输入的末尾，以适应上下文长度。如果为 false 且超过上下文长度，则返回错误。默认为 true

options: 模型文件的文档中列出的其他模型参数，例如 temperature (温度)。参见 Modelfile 获取有效的参数和值。

keep_alive: 控制模型在请求后保持加载到内存中的时间（默认值：5m）

概括