Please enable JavaScript.
Coggle requires JavaScript to display documents.
模型部署 (预测分类 (在线预测 (说明
根据需求短时间内生成预测, 优点
可在新项目加入时对其进行预测,非常适合存在长尾的情况, 缺点 …
模型部署
预测分类
在线预测
-
优点
可在新项目加入时对其进行预测,非常适合存在长尾的情况
缺点
- 计算量非常大,对延迟较为敏感,可能会限制模型的复杂度
- 监控需求更多
离线预测
说明
生成一组预测,存储这些预测,然后根据需求检索这些预测
优点
- 不需要过多担心推理成本
- 可以使用批量方法或某些巨型 MapReduce 方法
- 可以在推送之前对预测执行后期验证
缺点
- 只能对我们知晓的数据进行预测,不适用于存在长尾的情况
输入是一支且固定的,例如全国各个城市,如果输入不固定,例如根据随机输入词条推荐,那就不能用这个,好像是这样
- 更新可能延迟数小时或数天
数据依赖关系
监控数据
可靠性
信号是否始终可用?信号来源是否不可靠?
- 信号是否来自因负载过重而崩溃的服务器
- 信号是否来自每年 8 月去度假的人群
版本控制
问题描述
有时数据来自上游进程。如果该进程突然发生变化,您的模型可能会受到影响
可能的问题
- 计算此数据的系统是否发生过变化
- 多久一次
- 您如何知道系统发生变化的时间
必要性
-
可能的问题
添加的特征可能会意外降级(性能的降低或造成更多的不稳定性或系统维护成本)
相关性
问题描述
输入特征是不是真的和输出存在因果关系,还是只是相关关系,而且这个关系是否会变化
可能的问题
例如某个研究:人活得越久,墓碑的就越高。这可能只是正相关关系,很可能根本原因是人比较有钱,所以活得更就,而因为有钱,就更可能有高墓碑
反馈环
-
可能的问题
一个股市预测模型,模型预测股票会涨,所以就买入,而又因为这买入导致股价上涨,反过来影响模型的判断
概述
- 机器学习系统的行为取决于其输入特征的行为和品质
- 在机器学习开发中,虽然编码仍是工作的一部分,但您必须同时关注数据
实现步骤
生成pb文件
定义
表示 MetaGraph 的 protocol buffer格式的文件
-
优点
- 语言独立性,可独立运行,封闭的序列化格式
- 框架独立性,可以在不同的框架下运行
- 保存为 PB 文件时候,模型的变量都会变成固定的,导致模型的大小会大大减小,适合在手机端运行
-