240 发简信
IP属地:上海
  • 120
    LDA主题模型手把手初学者教学

    0. latent dirichlet allocation 前言 最近公司分享了这个topic, 我自己钻研了一下写一下自己对这个模型的理解。因为本人在阅读网上各种资料时,...

  • 进程池Pool的imap方法解析

    Python中,multiprocessing库中Pool类代表进程池,其对象有imap()和imap_unordered()方法。两者都用于对大量数据遍历多进程计算,返回一...

  • Python邮件正文及附件解析

    email邮件解析作为比较基础的模块,用来收取邮件、发送邮件。python的mail模块调用几行代码就能写一个发送/接受邮件的脚本。但是如果要做到持续稳定,能够上生产环境的代...

  • 120
    【爬虫成长之路】(八)【大众点评】APP爬虫

    本系列文章共十篇: 【爬虫成长之路】(一)爬虫系列文章导读[https://www.jianshu.com/p/8e03db02b75b]【爬虫成长之路】(二)各篇需要用到的...

  • 120
    词向量

    自然语言处理问题中,一般以词作为基本单元,例如我们想要分析 "我来自北语" 这句话的情感,一般的做法是先将这句话进行分词,变成我,来自,北语,由于计算机无法处理词,神经网络也...

  • ipynb文件过大导致jupyter notebook打不开的解决办法

    ipynb文件打不开主要原因是输出框输出字符太多,以下是实测成功的解决办法: 打开anaconda promptimage.png 输入命令,清空ipynb文件中的输出框字符...