从一次成功变成稳定运行
原型通常验证核心能力,生产系统还要处理并发、超时、模型不可用、接口异常和数据变化。
把身份和权限带入每一次调用
模型、知识检索和工具调用都需要了解当前用户身份,并遵循现有业务系统的权限边界。
建立可重复的质量评测
应使用真实业务问题构建评测集,持续检查准确性、引用、格式、规则遵循和任务完成情况。
让运行过程可观察
记录请求耗时、模型版本、知识来源、工具调用和用户反馈,才能定位问题并衡量改进。
保留人工介入和回退路径
对不确定、高风险或异常情况,应允许人员接管任务,并能够回到原有业务流程。
