模型
模型参数
了解如何在 OpenAI 兼容请求中选择模型和设置常用参数。
指定模型
调用聊天补全时,model 是必填字段。请使用模型页面或控制台展示的模型标识:
const completion = await openai.chat.completions.create({
model: 'deepseek/deepseek-chat-v3',
messages: [{ role: 'user', content: '解释量子计算' }],
});常用参数
| 参数 | 说明 |
|---|---|
temperature | 控制随机性。值越高,输出越发散。 |
top_p | 核采样参数,通常不要和 temperature 同时大幅调整。 |
max_tokens | 限制本次响应最多生成的 token 数。 |
stream | 设置为 true 后使用 SSE 流式返回。 |
response_format | 用于指定 JSON 等输出格式;是否支持取决于模型。 |
能力差异
不同模型对以下能力的支持可能不同:
- 上下文长度
- 图片或多模态输入
- 工具调用
- JSON 模式
- 推理过程字段
- 可用采样参数
如果请求参数不被当前模型支持,服务端可能返回参数错误,或忽略部分非必需参数。生产环境建议先用目标模型做最小请求验证。
选择建议
- 先根据任务类型筛选模型能力,例如文本、图片、长上下文或工具调用。
- 再根据响应速度、价格和稳定性做取舍。
- 对生产任务,为不同场景保留独立 API Key 和额度限制,便于监控和止损。