计算机视觉部署踩坑与优化清单
模型从实验环境到生产环境,常常不是“打包即上线”。很多性能和稳定性问题都出在工程细节上。
我最常见的 5 类问题
- 预处理不一致导致线上精度下降。
- 线程模型不合理导致吞吐抖动。
- 输入分辨率变化造成延迟不可控。
- 日志不足,故障难定位。
- 缺少回滚策略,风险放大。
优化 checklist
- 固化训练/推理预处理配置。
- 用基准脚本固定硬件、批量与线程参数。
- 增加健康检查和延迟报警。
- 灰度发布,保留上一版本可回退。
一个经验
先把“稳定性预算”写进需求,再做性能优化,整体交付质量会明显提升。
计算机视觉部署踩坑与优化清单