240 发简信
IP属地:北京
  • 网易公开课爬虫实践

    结果 这次先说结果吧,截止到目前(2019-01-28)位置总共爬了网易公开课4296个订阅号(有的订阅号是没有内容的),409030条内容(视...

  • LaTeX写数学公式

    LaTeX是一种基于TeX的文档排版系统,把大片排版的格式细节隐藏在若干样式之后,以内容的逻辑结构统帅纷繁的格式,遂成为现在最流行的科技写作——...

  • Resize,w 360,h 240
    强大的终端模拟器:Termux

    我们现在使用的主流桌面系统都会自带命令行程序,Windows也不例外(Windows10推出了Bash Shell和powershell),可见...

    0.8 13790 2 10 1
  • Resize,w 360,h 240
    网易有道词典爬虫

    起源 之前在有道词典上的"有道晨读"栏目看过一些连载的双语文章,还有真人朗读,觉得很不错,像<小王子>,<老人与海>,<追风筝的人>等.但是专栏...

  • Linux命令行

    现在,大多数计算机用户只是熟悉图形用户界面(GUI),并且认为命令行界面(CLI)是一种很古老的,很难使用的东西.其实不然,一个良好的命令行界面...

  • k-近邻算法

    算法简介 k-近邻算法可以说是我接触过的最简单的机器学习算法了,其思路非常直白:给定一个训练集,输入一个实例,在训练集中找到和输入实例最近的k个...

  • Resize,w 360,h 240
    新词发现

    参考资料 主要参考了以下两篇文章:互联网时代的社会语言学:基于SNS的文本数据挖掘 基于信息熵和互信息的新词识别 分词依据 对于一个给定的文本,...

  • 机器学习概述

    概念 机器就是计算机,“如果一个系统能够通过执行某个过程改进它的性能,这就是学习” ——赫尔伯特·西蒙(Herbert A. Simon)。所以...