Stage 1 数学基础: 数据挖掘

   数据挖掘的起源,在1995年知识发现(KDD, Knowleage Discovery in Database)国际会议上被定义为"在众多数据中寻找出有用且未知数据的过程". 数据挖掘诞生于市场条查的现场,被人们熟知的的一个案例就是"啤酒与尿片"购买的分析.

   与“回归分析”这种写在统计学书上的词汇相比,“Neural Network”(神经网络)这样的引文单词确实显得更加时髦专业。但是,当我们仔细询问究竟为了什么或者出于什么目的进行分析的时候,却发现与数据挖掘相比,我们真正应该使用的确是统计学方法。就像“根据在人工智能领域的研究,对人类的神经元进行模拟实验”之类的说明,听起来非常高大上。但是只要掌握数据挖掘和统计学方法之间的区别和共同点,可以容易理解。

一 数据挖掘的萌芽

       数据挖掘的黎明期,经常接触数据的计算机技术人员和身出一线的市场调查员们发明各种各样的方法。比如啤酒和尿片的“购物车分析”,这时候有数据挖掘的指标,信赖度,改善度,支持度,消费组合被引入。信赖度:“购买某种商品的人同时购买其他的商品的概率”,改善度:“在所有顾客中啤酒购买率30%与购买尿片的顾客中啤酒购买率40%相比,改善率就是1.33(40/30)",通过简单计算可以找出具有关联性的商品,这是购物车分析的优点。

   但是与购物车相比,统计学有更加简便的工具----相关分析。用卡方检验来特带,卡方值越大改善度越大。


   目前这种购物车分析方面的数据挖掘,被广泛应用在购物推荐中。

二 高级数据挖掘法与人工智能

        除了购物车分析这种简单计算外,逐渐发展出个家高级的运算逻辑的方法,神经元网络,支持向量机,聚集性分析。在人工智能领域中,根据思考方法不同进行分类;在数据挖掘中采用从人类认知功能分类的法则。

1 聚集性分析

2 支持向量机

3 神经元网络




希望通过结构化知识,提高学习效率,让你的工作时间更值钱,赚钱更高效!------------《 数据分析笔记》

























希望通过结构化知识,提高学习效率,让你的工作时间更值钱,赚钱更高效!------------《 数据分析笔记》

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 阅读对象 只要你想读,你就读呗!最好点个赞再走。。。:-) 本文尽量通过例子和直观描述,来说明人工智能中机器学习和...
    我是文哥哥阅读 3,932评论 0 16
  • 单选题 1. 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?(A) A...
    山的那边是什么_阅读 34,038评论 2 59
  • 文/凉亦歌 你相信吗? 写作这件事儿,是会上瘾的。 就像第一次尝到阿尔卑斯糖,那种甘甜清爽的味道回荡在口腔一隅时,...
    凉亦歌阅读 1,590评论 20 47
  • 今天一早,我们四五个姐妹站完桩,就一起去看医生。哈哈哈,是的,组团去。 每个人的情况不同,有的人腿痛,有的人感冒,...
    小丹Cookie阅读 153评论 0 1
  • 2019.1.12咖啡冥想 财富目标:2019年3月30之前收入5万人民币。 动机:智慧的路上自己成为榜样,我要种...
    冰山轩儿阅读 277评论 0 0

友情链接更多精彩内容