2019-12-04

今天的科研还是没有啥进展嘞~嗯,早上上了两节课,打游戏打到整个人心态都崩了~也不晓得是我太菜还是对面太强,下午和晚上就是开会开会~

学习还是有那么一点收获的~大猪蹄子要解决这样的问题, 数据集有10个字段,想根具其中9个字段来分析预测那第10个字段的值,也就是根据原来的数据预测第十个字段是0还是1。

那么可以把这个问题看做预测问题,也可以看做是分类问题,那么就引入了随机森林的概念,随机森林由多颗决策树组成,首先构造多颗决策树,根据不同树的预测结果,选取其中较好的结果,哈哈~如下面可爱的图所示。


随机森林

在网上找到了相应的代码,并且在python上面跑通啦,这个代码是一个简单的小例子,精度不是很高~只有0.6。上代码的链接:https://blog.csdn.net/colourful_sky/article/details/82082854

除了进行预测之外还有一个问题就是这个代码输入的数据是float类型的,但是现实生活中的需求数据是以字符串的形式存储的,因此引入了第二个问题就是如何将汉字的字符串转化为float类型数据的问题。在这里可以使用get_dummies()函数,这个函数的作用相当于对数据进行one-hot表示,就可以将字符串转为向量的形式。但向量的形式还不能直接进行应用,引出来了第三个问题就是如何将向量表示为一个float类型,这里可以应用向量的范数,就可以得到相应向量的模值。

向量范数计算

恩~这个问题就这样解决了,虽然应用的技术都很low,后期如果想高大上的操作需要费一番功夫的,但是也算是按着要求都做到啦~从这里收获了一点就是拿着问题去找答案,一步一步的解决,就可以发现事情变得很easy啦~吼吼 今天没有完成自己的事情,也算是有点收获的~happy

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • Java核心技术卷一学习 day01 System.exit()方法用于终止程序时,返回其他的代码 每个语句必须以...
    c9017a43c804阅读 1,081评论 0 0
  • open函数 open 函数可以打开一个文件。超级简单吧?大多数时候,我们看到它这样被使用: 我现在写这篇文章的原...
    Jarodlu阅读 1,567评论 0 0
  • 家 庭 人生由爱情而进入婚姻,又建立家庭,这是一个幸福而又...
    瑞雪兆丰2019阅读 1,598评论 0 0
  • 什么才是人生的幸福? 因为有朋友借用了公司的场所,今天休息,顺便利用这个时间大家一致决定去看看老师的孩子与家人。 ...
    w卿然阅读 3,085评论 4 2
  • 藏族的天葬效果一般以秃鹫吃得越干净代表此人解脱得越彻底,风俗中也以此来评判死者一生的善恶功过。那另一种水葬一般是针...
    唐薇阅读 1,544评论 1 0

友情链接更多精彩内容