推理与工具调用

推理策略

CoT（思维链）：显式分步推理，适合数学/逻辑题。
ToT/树搜索：在多路径问题中生成并评分多条推理路径。
自我一致性：采样多条推理链，投票选取一致答案。
规划执行：先生成计划（task list），再逐步执行并校验状态。

工具调用模式

单工具：将函数签名与参数描述显式提供，要求模型仅返回参数对象。
多工具选择：提供工具列表、用途与示例；模型先选择工具，再给参数。
代理循环：感知-思考-行动-观察（ReAct），每轮输出行动与理由。

实践建议

严格输出格式：为函数调用定义 JSON Schema/参数约束，减少解析成本。
状态可观测：日志中保留模型思考与调用的分离输出，便于调试。
安全防护：对调用结果做白名单/上限校验；对自由文本响应做敏感词过滤。
性能优化：缓存工具描述，避免重复提示；结合系统提示降低漫谈。

典型框架对照

ReAct：感知-行动循环，简单易实现；易出现幻觉调用，需约束动作集合。
ReWOO：先计划再检索/调用，减少往返，适合信息聚合。
MRKL/Router：根据任务类型路由到不同工具/模型，适合多域场景。