瓜书重点记录

在计算机系统中,“经验”通常以“数据”形式存在。

模型model

学习算法learning algorithm

数据集data set

示例instance

样本sample

属性attribute

特征feature

属性值attribute value

属性空间attribute space

样本空间sample space

维数dimensionality

训练集training set

假设hypothesis

“真相”ground-truth

学习器learner

标记label

标记空间/输出空间 label space

是否拥有标记信息分为

监督学习supervised learning[

分类(classification)两个类别二分类(binary classification)通常称一个正类(positive class)另一个反类(negative class)多个类别多分类(multi-class classification)

回归(regression)]

无监督学习unsupervised learning[

聚类(clustering)每个类称为簇(cluster)]


美国《新闻周刊》对谷歌评论:它使任何人离任何问题的答案间的距离变得只有点击一下鼠标这么远。

过拟合overfitting

欠拟合underfitting

模型选择model selection

测试误差testing error

泛化误差generalization error评估方法:留出法,交叉验证法,

留出法(hold-out):直接将数据集划分为两个互斥的集合,测试集,训练集。

交叉验证法(cross validation)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 135,314评论 19 139
  • 机器学习 经验 数据 数据中产生模型model 的算法 学习算法 learning algorithm 数据集 d...
    时待吾阅读 9,459评论 0 3
  • 早早出门,下午五点终于回家了,叫上女儿作了一天作业的女儿出去行走,告诉女儿妈妈独自一人好孤单。嘿嘿,女儿心...
    高山的孔雀阅读 1,040评论 0 0
  • 看了辱母事件,及相关报道之后,让我觉得非常气愤,以及做为普通老百姓,在许多事情上深深的无奈及无力感! 这个事情的细...
    梁言良语阅读 3,051评论 3 2
  • 每一天七早八早的起床铃声响起,那时候很不爽,孩子的暑假学习作业一大堆,我也好想让他痛快的玩乐啊,教育制度的问题还是...
    Sunny672阅读 858评论 0 0