240 发简信
IP属地:贵州
  • 120
    数据可视化图表——箱形图

    在互联网数据分析的过程中,我们经常需要分析一组数据的离散分布情况以及分析这组数据的最大值、最小值、平均数、四分位数。 有时我们会有如下应用场景:假设一款内容型产品,想要对比分...

  • 120
    代码学习

    通过reset_index()函数可以将groupby()的分组结果转换成DataFrame对象 pop() 函数用于移除列表中的一个元素(默认最后一个元素),并且返回该元素...

  • 120
    iTerm--比Terminal(终端)更好用的命令行工具

    Terminal是Mac自带的命令行工具,对于开发者来说,是不得不使用的开发工具之一。然而Terminal的外观设置功能比较少,这对于每天都得跟它相处很久的我们来说,这是一个...

  • 120
    Mac下spark环境的搭建

    安装前必备的环境: mac操作系统:本人是10.12.6 JDK:1.8.0 软件包管理工具:brew 1、配置ssh 配置ssh就是为了能够实现免密登录,这样方便远程管理H...

  • Elasticsearch 入门: _bulk 批量导入数据

    批量导入数据 使用 Elasticsearch Bulk API /_bulk批量 update 步骤: 需求:我希望批量导入一个 movie type 的名词列表到 wor...

  • Elasticsearch--- mapping是什么

    模拟数据 搜索测试: 为什么会是这样的结果:这和es自动建立的mapping有关 可以看到每个字段的类型 因为es自动建立mapping的时候,设置了不同的field不同的d...

  • 无标题文章

    clean up your own mess

  • 2018-06-23NLP知识体系

    NLP 自然语言处理的大致知识领域如下 语法分析 句法分析 情感分析 句子生成 句子相似度 文本分类/聚类 文本表示 知识库(词库) 语料库