接前文说述,一篇论文的阅读需要有相当多的背景知识和训练,我们从上文的思维导图不断繁衍细化已经可以看到,这里我直接给出那张枝繁叶茂的图。我们思考的过程已经很详细在上文做了展示,没有捷径可走,沿着每一条知识线索走下去,祝你好运。
如果你仔细对比这张图和上文的图,一个很重要的变化是我把读懂论文需要的数学知识集中放在图的左边,由文章本身发散出来的知识点放在右边,如果你试图去把左边的数学分支继续细化,你会找到描述右边术语的具体技术。比如,神经网络可以在数学上用计算图的方式展现,这就是属于左边组合数学的范畴。
我们用神经网络训练的概念来类比读论文,这个阅读的过程就是一个训练的过程。在阅读的过程中,你遇到的每一个单词都是代表着你掌握了,或者没有掌握的知识点。当未知的部分超过一定的比例,比如说50%,那么这篇论文就很难读懂了。于是,你需要花费大量的时间去学习那些不懂的知识点,将未知的比例降低,才能再次回到论文继续往前。这里我们看到一个很有趣的经验,既适合于人类的阅读理解,也是机器学习调优的挑战之一 ----- 如何知道我们分别去学习未知的知识点足够了,可以回来继续读论文。这好像是深度学习的网络迭代到什么时候可以从一种类型的迭代和循环,进入另一种类型的迭代和循环(深度神经网络的复杂不仅仅是深度本身,还是不同类型神经网络的组合,这也是为什么谷歌的大神们使用了有向计算图作为Tensorflow的理论基础,算子和张量的重复和叠加,可以如同分形一样,每个细节都是简单的张量输入,算子运算,张量输出,但是宏观上表现出异常精细和复杂的图形)。阀值和梯度这些武断的,静态的判断标准已经证明只能适合于特定的计算场景,需要使用算子和张量构造的阀值网络取代静态的数值设定,才能真正做到自适应的判别。更进一步来说,反馈是重要的优化手段,这也是神经网络核心价值(通过网络权重计算后的输出对比训练样本的标签得到学习偏差,由此指导神经网络调整权重,这样的论文不计其数,这里不再累述)。
回到我们的标题,读机器学习的论文到底又多难,比较完整的回答是,一开始会很难,需要你从阅读中找寻未知的知识点,然后再去各个知识点分别学习,学习的深度需要返回到论文阅读,用是否理解了论文的含义来检验是否需要继续学习那些知识点,如此往复循环,才能读懂论文。因此读论文的难度取决于你已经拥有的相关知识(如同神经网络预设权重是否已经训练过,或者优化过),取决于你的阅读速度,理解能力和阅读,学习时间(如同运行神经网络的计算机的性能强悍程度,神经网络本身构造合理性,还有运行网络的时间)。
这些都是我自己学习的体会,学习之路也是有向无环图,祝大家好运。