现今主流的机器算法都是以大数据作为基础,从数据中获得知识,总结规律。
如贝叶斯分类、决策树分类、支持向量机、k-近邻、聚类、随机森林、神经网络等等。大致可以将它们分为两类:一类是分类,一类是回归拟合。分类即非左即右的概率决策过程;回归即通过数学逻辑运算对数据进行拟合得出模型从而进行模式匹配。
其中贝叶斯分类、决策树分类、支持向量机、k-近邻为非黑盒算法,聚类、随机森林、神经网络等为黑盒算法。非黑盒算法处理能给以数学上的解释,而黑盒算法处理过程则无法进行推算,类似生物过程的秘密。这和人学习的过程类似但又稍有出入。
上帝不可能通过抛骰子来决定这个世界的运转规律,我们的大脑也不可能是通过抛骰子来为我们做决定,小孩子不需要看大量的猫才认识猫,通常只需要几只甚至是一只。学习是个复杂的生物化学反应过程,这是我对目前人工智能机器学习方法论表示怀疑的主要原因。
当然,生物技术是目前人类知之甚少的宝藏之地。若干生物现象与数学之间的联系尚未明确,所以无法做出合理的解释。吾以为的智能应是具备人的智慧。统计学即经验学。这样解释的话倒能说得通,学习即学习经验。在生物技术未取得革命性突破之前,暂且拿经验来用,即使无法给经验以完美的数学解释。
20180901
今天又有新的想法:人之所以不用看很多猫甚至只用看一个猫就能准确的认识猫,这得益于人的记忆和思维。看到猫并将其特征提取学习之后存储到记忆中,到下次再看见猫的时候首先提取特征然后通过搜索记忆存储系统然后进行特征匹配,筛选出最优解输出。这个就是这个完整的学习与应用过程,机器学习的算法正是模拟了这一过程。其中深度学习是最大程度的模拟了整个自主学习过程,其能通过大量的数据总结出规律也就是特征,从而筛选出最优秀也就是最匹配特征的结果,其是目前较优的学习算法。