1. OAC简介
Oracle Analytics Cloud empowers business analysts and consumers with modern, AI-powered, self-service analytics capabilities for data preparation, visualization, enterprise reporting, augmented analysis, and natural language processing/generation.
OAC(Oracle analytic Cloud,甲骨文分析云),就是甲骨文最新云版数据可视化和数据分析工具。
更多OAC知识请移步OAC文档。
2. 文档描述
此技术文档主要描述了在OAC中如何使用机器学习,使用回归算法训练一个模型,根据优惠编码和日期预测销售数量,包括建立模型和应用模型。主要面对的是OAC工具的使用,机器学习算法明细不在此文档范围内。
3. 创建和训练模型
3.1 创建数据流
我们选择Oracle ADW自带的销售数据(sh.sales表)作为数据集。
我们需要用time_id, promo_id来预测quantity字段,为了后面筛选数据,添加product_id字段,所以需要取数据集这四个字段:
- Product_id
- Time_id
- Promo_id
-
quantity
3.2 添加筛选器
因OAC中ML一次只能运行不超过12500数据,我们做一个筛选,只选取product_id为30的数据。
3.3. 添加训练数字预测步骤
这里我们选择线性回归作为此次预测算法。
3.4 配置线性回归模型参数
在Target中选择QUANTITY列作为预测目标列;
回归方法选择OLS,即最小二乘法;
其它参数请参见线性回归相关机器学习知识。
3.5 保存模型
添加保存模型步骤,取模型名称为regr_test,注意,名称最好为英文。
3.6. 运行数据流训练模型
点击右上角运行数据流按钮,运行时会提示需要先保存数据流。
4. 查看生成的模型
主菜单 > 机器学习 可查看创建的模型。
鼠标指针放置在模型列上,点击右边图标按钮,点击检查菜单可查看模型信息。
5. 应用模型预测数据
准备测试数据,可以手工创建,我们需要的是指定promo_id和time_id,然后应用建立的regr_test模型,预测quantity值。
5.1. 准备数据
需要准备测试集数据,用于验证模型。这里从sh.sales中随机抽取了一定量数据用于演示。
5.2. 添加应用模型步骤
这里我们选择开始建立的regr_test模型。
指定输出列名称,这里我们保持系统自动生成的名称。
在输入栏里指定列的映射。
5.3. 添加保存数据步骤
该步骤会生成一个新的数据集,这里我们指定名称为Test Data Set。
5.4. 运行数据流生成包含预测列的数据集
运行前会要求保存数据流。
运行成功后我们能在数据集中查看建立的数据集。
6. 建立项目查看预测值和原值匹配程度
因本次训练集和测试集为同一表,故按时间求和后数据完全一致。如测试数据为新建数据,更能验证预测准确率。
其中数量列为实际值,PredictedValue列为预测值。
7. 结语
原创文章,需转载请留言和私信联系。如有疑问,欢迎留言或私信共同探讨。