微软贝叶斯-挖掘模型建立及应用

实验目的：

1.学习使用Microsoft NaïveBayes创建OLAP数据挖掘模型。

2.深入理解贝叶斯分类的数据挖掘意义。

实验步骤：

（1）打开程序->Microsoft SQL Server 2008->SQL Server Business Intelligence Development Studio，启动SQL Server 2008 BI的开发环境。

（2）在“文件”菜单上，指向“新建”，然后选择“项目”。选中“项目类型”窗格中的“商业智能项目”。选中“模板”窗格中的“Analysis Services项目”。在“名称”框中，将新项目重命名，单击“确定”。

（3）参照实验一具体方法，在“解决方案资源管理器”中“新建数据源”。

（4）参照实验一具体方法，在解决方案资源管理器中“新建数据源视图”。

（5）参照实验一具体方法，在“解决方案资源管理器”中“新建挖掘结构”。注意在“创建数据挖掘结构”页上，选择“MicrosoftNaïveBayes”。

如图所示：

在进行类型选择的时候，发现只能检测的属性的类型有点误差，所以需要手动修改出身、国别、身份的属性类别为离散的，其他输入属性都为可离散化的属性类型。

在这里我使用的是测试集为30%的比例。

（6）在解决方案资源管理器中，右键单击创建的挖掘结构，选择“处理”该挖掘结构；在“处理挖掘结构”页面中单击“运行”按钮，完成数据挖掘过程。

（7）通过“挖掘模型查看器”、“挖掘准确性图表”和“挖掘模型预测”查看挖掘结果，并能通过模型预测未知数据的结果。

点击依赖网络，根据实验结果的观察，发现政治、统御、忠诚、武力、智慧都是输入属性，可预测的输出属性只有身份。

通过点击查找节点（望远镜），选择武力对身份预测的颜色变化，可以清楚的看到武力对身份的影响。

通过点击属性配置文件，可以观察到每个输入属性和每个输出属性的关系。

比如说看到统御对身份预测的影响，结果可以看到，统御这个属性对身份1和身份2的预测能力比较好，可以清楚的区分出几个身份，就拿统御来说就可以清楚的分辨出身份1和身份2，因为色块占的比重区别很大。

对挖掘模型的预测中，发现贝叶斯算法和决策树算法有点不同，连续的属性不能进行自动输入值，而是一个区间的值，预测的步骤相同。

可以看到预测为身份1

可以看到提升图中预测的准确率可以达到73%，比贝叶斯算法准确率高。

通过观察属性特征，对身份值为3即文官来说，属性忠诚、政治、智慧的概率达到了50%以上，说明对文官来说这三个属性是决定属性。

通过观察属性对比，当武力值大于86、统御值大于83明显倾向于身份为1即将军。

其他属性倾向不明显或者趋向于其他状态。

观察分类矩阵可以看到对角线上是准确的值，其他部分就是不准确的预测点。

在这里可以设置算法的参数，根据需要对输出属性、输入属性以及状态值得设置，但是一般不进行最后一个参数的修改。

实验总结：

对于朴素贝叶斯算法，我在实验的过程中可以感觉到决策树和贝叶斯算法的一些区别，可以看到预测的准确率要比决策树的准确率高很多，离群点对于整体影响并不大。但是缺点就是在实际生活中，各属性一般情况下都会有关联，不会绝对的独立。在属性的特征和属性对比图上可以很清晰的属性与预测部分的关系。

最后编辑于：2017.12.11 12:16:53

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 218,122评论 6赞 505
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 93,070评论 3赞 395
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 164,491评论 0赞 354
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,636评论 1赞 293
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,676评论 6赞 392
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,541评论 1赞 305
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,292评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,211评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,655评论 1赞 314
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,846评论 3赞 336
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,965评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,684评论 5赞 347
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,295评论 3赞 329
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,894评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,012评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,126评论 3赞 370
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,914评论 2赞 355

微软贝叶斯-挖掘模型建立及应用

推荐阅读更多精彩内容