240 发简信
IP属地:上海
  • 不规则表格数据怎么提取成结构化数据

    使用pdfplumber提取pdf中不规则表格

    背景 上市公司年报中,有很多表格,最近公司需要将这些表格结构化到数据库中,第一步就是如何提取这些表格。 难点 1.表格分页,如图12.不规则表格,如图2 表格分页的思路就是判...

  • 120
    oracle压缩和解压dmp.gz

    oracle数据库dmp文件在pc服务器上压缩成gz格式,再ftp到小机,在小机上解压操作步骤 压缩 FTP上传到小机 解压:gzip -d xb.dmp.gz 解压xb.d...

  • 大数据处理/数据分析/分布式工具

    Hadoop:分布式的文件系统,结合其MapReduce编程模型可以用来做海量数据的批处理(Hive,Pig,HBase啥的就不说了),值得介绍的是Cloudera的Hado...

  • 120
    整理一份万字机器学习资料!

    本系列主要根据吴恩达老师的课程、李航老师的统计学习方法以及自己平时的学习资料整理!在本文章中,有些地方写的十分简略,不过详细的介绍我都附上了相应的博客链接,大家可以根据相应的...

  • 120
    Python机器学习及分析工具:Scipy篇

      Scipy是一个用于数学、科学、工程领域的常用软件包,可以处理插值、积分、优化、图像处理、常微分方程数值解的求解、信号处理等问题。它用于有效计算Numpy矩阵,使Nump...

  • docker常用指令

    1.docker启动、暂停、重启 2.docker 镜像操作 3. docker 容器指令 (1)启动和停止容器 (2)查看docker应用 (3)端口映射 (4)删除容器 ...