一、 传统分类模型的局限 在之前的文章中(《神经网络(一)》、《神经网络(二)》和《神经网络(三)》),我们讨论的重点是神经网络的理论知识。现在来看一个实际的例子,如何...
一、 传统分类模型的局限 在之前的文章中(《神经网络(一)》、《神经网络(二)》和《神经网络(三)》),我们讨论的重点是神经网络的理论知识。现在来看一个实际的例子,如何...
有可能是膨出。运动的时候一定先咨询医生,不要盲目运动哦
精通数据科学的奥义:腰椎间盘突出防治每个数据工作者都需要一本从入门到腰椎间盘突出的参考书。 或者 再牛逼的技术也需要防治腰椎间盘突出。 一、什么是腰椎间盘突出? 首先看图说话,不专业的定义,腰椎间盘突出就是脊椎...
一、 神经元到神经网络 在之前的文章中(《神经网络(一)》和《神经网络(二)》),我们讨论了如何为神经元搭建模型。虽然搭建模型的过程并不复杂,但得到的神经元模型也没有太...
一、 Softmax函数与多元逻辑回归 为了之后更深入地讨论神经网络,本节将介绍在这个领域里很重要的softmax函数,它常被用来定义神经网络的损失函数(针对分类问题)...
一、仿生学 在经典的机器学习领域,有很多不同类型的模型,它们大致可以分为两类:一类是比较注重模型可解释性的传统统计模型,比如线性回归和逻辑回归;另一类是侧重于从结构上“模仿”...
一、生成式模型 这个系列将讨论人工智能领域非常重要、也十分被看好的一类模型:生成式模型(generative model)。因为这类模型不但能根据特征预测结果,还能“理解”数...
一、 生成式模型 这个系列将讨论人工智能领域非常重要、也十分被看好的一类模型:生成式模型(generative model)。因为这类模型不但能根据特征预测结果,还能“...
分类问题是机器学习的研究重点,而后者在实践中常常碰到非均衡数据集这个难题。非均衡数据集(imbalanced data)又称为非平衡数据集,指的是针对分类问题,数据集中各个类...
每个数据工作者都需要一本从入门到腰椎间盘突出的参考书。 或者 再牛逼的技术也需要防治腰椎间盘突出。 一、什么是腰椎间盘突出? 首先看图说话,不专业的定义,腰椎间盘突出就是脊椎...
虽然,我对数学不怎么懂,但我一直对好的数学教育颇感兴趣,曾经也作为数学学人接受过好几年的数学专业训练,这其中包括国内的,也包括我个人认为全世界最好的法国数学教育。所以一直有念...
在前两篇文章里(《分类模型的评估(一)》和《分类模型的评估(二)》),针对二分类问题,我们分别讨论了 评估某个给定分类结果的指标:查准率(Precision)、查全率(Rec...
在上一篇文章里(《分类模型的评估(一)》),我们讨论了针对某一给定分类结果的评估指标,也就是查准率(Precision)、查全率(Recall)以及综合两者的F-score。...
针对二元分类结果,常用的评估指标有如下三个:查准率(Precision)、查全率(Recall)以及F-score。这篇文章将讨论这些指标的含义、设计初衷以及局限性。 一、二...
之前的《量化投资的利器:隐马尔可夫模型(三)》讨论了如何在监督式学习的场景下使用隐马尔可夫模型。在监督式学习(针对序列数据)里,搭建模型的训练数据为,其中表示事物的状态,它是...
之前几篇有关HMM模型的文章(隐马尔可夫模型(一),隐马尔可夫模型(二))主要讨论了这个模型的理论部分,从这篇文章开始,我们从实际的应用场景入手,看看应该如何使用HMM模型以...
在之前的文章(《量化投资的利器:隐马尔可夫模型(一)》)里,我们比较“文学地”介绍了隐马尔可夫模型(HMM)的基本思想。而这篇文章将深入地从数学上来讨论HMM模型的细节。 一...
在略微枯燥的模型讨论之前,我们先来看一个数学家的故事。 那是一个深秋的傍晚,一位正在过40岁生日的数学家正苦恼地望着远方。40岁对一个数学家来说,是一个悲伤的年龄,因为这个世...
在之前的文章里《数据科学中的陷阱I:变量的数学运算合理吗?》,我们讨论过定性变量,也就是表示类别的变量,比如性别、省份等。对于这类变量,不能在模型里直接使用它们,因为定性变量...
数据科学中有各种各样的模型,有的听起来很简单,比如线性回归;有的呢,听起来就很吓人,比如深度学习。但是不管什么样的模型,从本质上来讲,模型都是对训练数据做数学运算,并以此求得...