前文链接
unit1 AI的核心是“学习”
阅读难度
unit3 几个重要的定义
你了解了机器学习的基本套路以后,本单元带大家学习几个重要的定义。
1 分类问题与回归问题
根据训练集合中数据Y的不同,我们通常把机器学习要解决的问题分为分类问题与回归问题。
1.1 什么是分类问题
你对面走过来一个人,问你是“男人还是女人?”这就是一个最简单的二分类问题,你自己回想一下,你会发现这个世界充分了二分类问题。你要跳槽,有一个新的职位,你去还是不去?面对一姑娘,你追还是不追?以此类推,你面对“三分offer,在A,B,C公司中选择一家”这就是一个三分类问题。
此类问题有一个共同点:就是结果都是离散。大家可以把这种问题理解成考试中的选择题,结果的选项之间有明显的边界。
1.2 什么是回归问题
你遇到一姑娘,你送花若干次,约饭若干次,看电影若干次,问题是多长时间之后她会答应你的求婚?针对这个问题的结果,你的回答可能是1天,2两天,1年,两年,用一个范围来说就是如果你坚持追下去,可能是你余生中任何一天。
此类问题有问题有一个共同点:就是结果是连续的,是一个范围。
1.3 哪个是分类,哪个是回归?
A 去北京买房,中介提供了平米数,位置等信息,你自己预测价格。
测试集合如下:
这是一个什么问题?
B 去北京买房,中介提供了提供了平米数,位置等信息,你预测一下价位,是3·4w的,5-6w的,还是6w以上的。
测试集合如下:
这是一个什么问题?
2 监督与非监督
根据训练集合中数据是否有Y, 我们通常把机器学习的学习方式分为监督学习,与非监督学习。