漫画,用Python预测你有没有女朋友,男朋友可以预测不

林外传里佟掌柜有一句话,春天已然到来,而属于我的春天何时能够到来呢,小安如此“优秀”,怎么就是没有属于自己的另一半呢,刚巧在浏览GitHub时碰到一个预测自己会不会有女朋友的项目,觉得很有意思,于是特地与大家分享,用漫画的来讲!

首先,数据集分为训练集和测试集,训练集一共有300个样本,每个样本包含四个属性,分别为“金钱”,“长相”,“身材”,“性格”。每个样本的每个属性值都被归一化为0到1中的值,代表着每个样本在这一属性上的得分高低。

最后的标签是指是否有女朋友,0代表没有,1就是代表着有,1代表有。我们要做的就是根据训练集的数据来训练出模型来判断我们是否有女朋友,在进行训练之前,我从练数据集中随机选取了10个样本作为我们的交叉验证数据集,目的是用来测试我们模型的准确性。


机器学习的模型有很多种,我这次采用了逻辑回归和决策树进行分类决策,但是发现决策树的准确率更好,那就重来讲一下决策树,并引入混淆矩阵来评判决策树模型的好坏。




如果你在学习Python的过程当中有遇见任何问题,可以加入我的python交流学企鹅群:【611+530+101】,多多交流问题,互帮互助,群里有不错的学习教程和开发工具。学习python有任何问题(学习方法,学习效率,如何就业),可以随时来咨询我



什么是决策树算法呢?大家都买过西瓜吧,那么大家都是从几个方面来判断西瓜是否是纯熟的呢?以小编个人经验来说,我一般都是先看颜色,然后再看形状,觉得颜色,形状都不错的,就拿起来再敲一敲,是不是清脆,一通操作下来,就能调到合适的西瓜了。其实上述的选西瓜过程就是一个决策树决策的过程,如下图所示:

我们用一个评价指标A来作为评价决策树好坏的标准,还是以买西瓜为例子,比如小编特别爱吃西瓜,我就不管好坏,一口气的买了50个西瓜,回家再慢慢的调,经过我的挑选之后,我认为里面有46个是好的西瓜,而只有四个是坏的西瓜,那我的评判准不准呢,经过我挨个西瓜的检测发现,我认为46个好的西瓜里面,有4个是坏的,而我认为4个坏的里面,有1个是好的,结果我就生成了下面的表格:


上面的表格中,可以看出我将4个坏瓜错误的预测成好瓜而将1个好瓜错误的预测成了坏瓜,而理想的情况下我应该全部预测正确,也就是上表的“1”和“4”应该为0,而“42”应该为43,而“3”应该为7。这就是评价指标A的作用,可以清晰地展示出我选瓜的水平如何。基础的知识讲完了,下面是实战的阶段,下图是部分代码的展示:

上述代码中我们还是先加载数据,然后从数据集中随机选择10个样本作为交叉验证集,为了保证实验的准确性,我们选取的交叉验证集样本同逻辑回归中的样本是相同的。由上图可以看出,模型在交叉验证集上的准确率为70%!


运行程序后,会输出交叉验证集的评价指标A,但是为了方便大家的理解,小编特地进行了改进,如下表所示:

上表显示,模型预测正确的有7(3和4)个值,而我们交叉验证集一共有10个数据,7/10 = 0.7,与我们的结果输出吻合一致。

拿小编自己来做实验,看看我们模型的效果,针对于金钱,长相,身材,性格四个属性,上面我我们讲到,我们要按照0到1来给自己打分,0代表最差,而1代表最好,所以小编对于自己的四项取值分别为0.2、0.6、0.6、0.6,最终模型预测的结果为0,


通过上述的讲解,小编带领大家通过数据科学来预测了一个人究竟有没有女朋友,以及想要找到女朋友,迫切需要改变什么(对结果影响最大的因素)。

当然,受制于训练数据集过小的影响,模型训练出来的结果,每一次也会有变化,因此,如果能在大量的数据集上进行训练的话,模型的鲁棒性会更加的好,以上就是今天的分享,大家赶快动起手来学习吧。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,546评论 6 507
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,224评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,911评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,737评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,753评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,598评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,338评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,249评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,696评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,888评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,013评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,731评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,348评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,929评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,048评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,203评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,960评论 2 355

推荐阅读更多精彩内容