3-LangChain Chat Model 调用控制参数 一、说明在调用模型时会用到各类控制参数合理配置可以精准约束模型生成逻辑、输出形式、网络请求行为更好地控制模型的行为适配问答、代码生成、文案创作、结构化输出等业务场景。二、Chat Model 通用核心参数速查表表格参数类型默认值作用与适用场景modelstrNone指定模型名称如hunyuan-lite、hunyuan-proapi_keystrNoneOpenAI 兼容接口鉴权密钥必填base_urlstr厂商官方地址私有化大模型、中转代理、腾讯混元兼容 API 时填写temperaturefloat模型内置默认控制生成随机性0~0.3问答、代码、数据提取输出稳定0.7~1.0创意写作、闲聊发散性更强max_tokensint模型上下文上限限制单次回复最大输出 token节约计费、避免超长文本top_pfloat1.0核采样和 temperature 二选一使用数值越小输出越保守stoplist[str]空列表自定义停止标识符匹配文本后模型立刻停止生成用于截断冗余内容streamingboolFalse是否开启流式输出True逐段实时返回适合聊天界面False一次性返回完整结果timeoutint/floatNone请求超时时间秒生产环境必须配置防止接口阻塞max_retriesint厂商默认网络波动、接口限流时自动重试推荐 2~3 次三、代码示例示例 1ChatOpenAI 对接腾讯混元兼容接口基础完整版python运行import os from langchain_openai import ChatOpenAI from dotenv import load_dotenv # 加载环境变量 loaded load_dotenv() if not loaded: print(警告.env 文件未找到) # 读取环境变量密钥禁止代码硬编码密钥 hunyuan_api_key os.getenv(HUNYUAN_API_KEY) # 初始化混元模型 model ChatOpenAI( # 基础接口鉴权配置 modelhunyuan-lite, api_keyhunyuan_api_key, base_urlhttps://api.hunyuan.cloud.tencent.com/v1, # 模型生成行为控制参数 temperature0.3, max_tokens1024, top_p0.9, stop[###, 结束回答], # 输出模式控制 streamingFalse, # 关闭流式输出一次性返回完整结果 # 生产环境网络容错参数 timeout15, max_retries3 ) # 同步调用获取完整回答 response model.invoke(介绍LangChain ChatOpenAI常用配置参数) print(完整输出结果\n, response.content)示例 2init_chat_model 工厂函数初始化混元兼容接口python运行import os from langchain.chat_models import init_chat_model from dotenv import load_dotenv # 加载环境变量 loaded load_dotenv() if not loaded: print(警告.env 文件未找到) chat_model init_chat_model( modelhunyuan-lite, model_provideropenai, base_urlhttps://api.hunyuan.cloud.tencent.com/v1, api_keyos.getenv(HUNYUAN_API_KEY), # 直接传入 temperature0.3, streamingFalse, max_tokens1024, top_p0.9, stop[###, 结束回答], timeout15, max_retries3 ) res chat_model.invoke(讲解temperature参数作用) print(res.content)示例 3开启 streaming 流式输出演示python运行import os from langchain_openai import ChatOpenAI from dotenv import load_dotenv # 加载环境变量 loaded load_dotenv() if not loaded: print(警告.env 文件未找到) # 开启流式输出 model ChatOpenAI( modelhunyuan-lite, api_keyos.getenv(HUNYUAN_API_KEY), base_urlhttps://api.hunyuan.cloud.tencent.com/v1, temperature0.7, streamingTrue, timeout10, max_retries2 ) # 逐块打印实时返回内容 print(流式输出内容) for chunk in model.stream(写一段简短Python入门介绍): print(chunk.content, end, flushTrue)四、使用小贴士streaming仅控制默认调用模式streamingFalse使用invoke()一次性返回streamingTrue搭配stream()实现实时打字效果。temperature和top_p不建议同时大幅调整日常业务仅配置其中一个即可。线上业务必须配置timeout和max_retries提升接口调用稳定性。stop参数多用于 JSON、Markdown 结构化输出截断模型多余续写内容。