Appearance
推理与工具调用
推理策略
- CoT(思维链):显式分步推理,适合数学/逻辑题。
- ToT/树搜索:在多路径问题中生成并评分多条推理路径。
- 自我一致性:采样多条推理链,投票选取一致答案。
- 规划执行:先生成计划(task list),再逐步执行并校验状态。
工具调用模式
- 单工具:将函数签名与参数描述显式提供,要求模型仅返回参数对象。
- 多工具选择:提供工具列表、用途与示例;模型先选择工具,再给参数。
- 代理循环:感知-思考-行动-观察(ReAct),每轮输出行动与理由。
实践建议
- 严格输出格式:为函数调用定义 JSON Schema/参数约束,减少解析成本。
- 状态可观测:日志中保留模型思考与调用的分离输出,便于调试。
- 安全防护:对调用结果做白名单/上限校验;对自由文本响应做敏感词过滤。
- 性能优化:缓存工具描述,避免重复提示;结合系统提示降低漫谈。
典型框架对照
- ReAct:感知-行动循环,简单易实现;易出现幻觉调用,需约束动作集合。
- ReWOO:先计划再检索/调用,减少往返,适合信息聚合。
- MRKL/Router:根据任务类型路由到不同工具/模型,适合多域场景。