240 发简信
IP属地:北京
  • Resize,w 360,h 240
    Geomesa 索引

    在之前的文章中,已经对Geomesa的基本功能和基本查询与写入操作做了介绍。我们了解到Geomesa是一个分布式地理大数据存储框架,它通过与许多...

  • 使用python matplotlib绘制混淆矩阵

    使用python matplotlib绘制混淆矩阵 今天使用了python matplotlib包,绘制混淆矩阵。基本代码参考官网教程,在此基础...

  • Resize,w 360,h 240
    机器学习中的常用评价指标汇总

    机器学习中的评价指标 简要介绍精度、精确率、召回率、P-R曲线、F1 值、TPR、FPR、ROC、AUC等指标,还有在生物领域常用的敏感性、特异...

  • Resize,w 360,h 240
    使用Spark ML进行数据分析

    Spark版本:2.4.0语言:Scala任务:分类 这里对数据的处理步骤如下: 载入数据 归一化 PCA降维 划分训练/测试集 线性SVM分类...

  • Resize,w 360,h 240
    使用NiFi将数据从Mysql导入至HBase

    1. 启动并登录NiFi 1.1 在本机启动nifi ./bin/nifi.sh start 1.2 登录nifi 打开浏览器,访问xxx.xx...

  • Resize,w 360,h 240
    NiFi的分布式安装与启动

    1 简介 NiFi是一个易用、可靠、功能强大的数据处理与分发系统,是Apache的开源项目。只需在web界面中用拖拽的方式定义数据处理节点,数据...

  • Resize,w 360,h 240
    GeoMesa Java API-写入与查询数据

    1 写入数据 GeoMesa作为空间大数据处理框架,本身是不存储数据的。数据存储依赖于底层的分布式数据库,如HBase,Accumulo等。Ge...

  • Resize,w 360,h 240
    使用Java API远程访问HDFS

    概述 在虚拟机中配置好Hadoop环境,通过本地(宿主机)编写Java程序去访问虚拟机中的HDFS,完成基本的读取文件操作。 方法 1.在mav...

  • Resize,w 360,h 240
    GeoMesa 从GDELT中写入数据

    GDELT介绍 GDELT是国外一个大数据存储项目,它提供了自1979年至今的全球广播、印刷和网络新闻媒体报道的事件,并按时间和位置索引。其数据...