240 投稿
收录了31篇文章 · 17人关注
  • 4.4MNIST手写体数字图片识别

    下载数据。每个手写体数字图像在两份文件中都被首尾拼接为一个28*28=784维的像素向量,而且每个像素都使用【0,1】之间的灰度值来显示手写笔画...

  • Resize,w 360,h 240
    4.3IMDB影评得分

    下载数据。已经标有情感倾向的训练文件labeledTrainData.tsv,里面有25000条影评以及对应的情感倾向标识;待测试文件testD...

  • Resize,w 360,h 240
    4.2Titanic罹难乘客预测

    0.8081393027203827 0.81824559798311003 提交结果:着重注意的是,在今后的实战中,一定要严格遵守竞赛数据中所...

  • 4.1kaggle平台简介

    kaggle是当前世界上最为流行的,采用众包策略,为科技公司、研究院所乃至高校课程提供数据分析与预测模型的竞赛平台。地址:https://www...

  • 3.2.4Tensorflow框架

    Tensorflow是一个完整的编码框架。就如同我们按照python编程语法设计程序一样。Tensorflow内部也有自己所定义的常量、变量、数...

  • 3.2.3XGBoost

    提升(Boosting)分类器隶属于集成学习模型。它的基本思想是把成百上千个分类准确率低的树模型组合起来,成为一个准确率很高的模型。这个模型的特...

  • Resize,w 360,h 240
    3.2.2词向量(Word2Vec)技术

    词袋法是以每个词汇为特征,向量化表示一个文本;并且提供了几种特征量化的技术,如CountVectorizer和TfidfVectorizer。词...

  • 3.2.1自然语言处理包(NLTK)

    这一节所介绍的NLTK,是时下非常流行的在python解释器环境中用于自然语言处理的工具包。对于NLTK的使用者而言,它就像一名极其高效的语言学...

  • 3.2流行库/模型实践

    (1)安装python,打开terminal. (2)在terminal下运行代码中的bash命令。 安装本书所有python编程库的mac o...

  • 3.1.4.2并行搜索

    尽管采用网格搜索结合交叉验证的方法,来寻找更好超参数组合的过程非常耗时;然而,一旦获取比较好的超参数组合,则可以保持一段时间使用。因此这是值得推...