240 发简信
IP属地:浙江
  • 120
    neo4j下载和安装(一)

    1. 官网下载neo4j安装文件 https://neo4j.com/download-center/#releases 2. 安装Java JDK 3. 将解压后的文件安装...

  • 120
    IntelliJ IDEA The selected directory is not a valid home for JDK 错误解决办法

    问题 最近想学java,安装了IntelliJ IDEA,建立了一个hello world项目。可是说需要我首先配置SDK,那就配吧 可是当我选择了java安装目录时,Int...

  • 120
    想学时间管理,用好这一个工具就够了

    一、最傻如我——做“工具的试验品” 学时间管理会接触到特别多工具,一开始我会去把它们挨个下载下来慢慢体验。 APP层出不穷,遇到“更强大”工具,我会很HAPPY的像发现宝藏一...

  • 120
    揭秘Java网络爬虫程序原理

    随着互联网+时代的来临,越来越多的互联网企业层出不穷,涉及游戏、视频、新闻、社交、电商、房产、旅游等众多行业。如今互联网成为大量信息的载体,如何有效地从中提取有价值的信息并利...

  • 120
    如何构建一个分布式爬虫:理论篇

    前言 本系列文章计划分三个章节进行讲述,分别是理论篇、基础篇和实战篇。理论篇主要为构建分布式爬虫而储备的理论知识,基础篇会基于理论篇的知识写一个简易的分布式爬虫,实战篇则会以...

  • 120
    全程干货 | 解密爬虫抓取、更新网页的策略方法

    抓取策略 在爬虫系统中,待抓取URL是很关键的部分,需要爬虫抓取的网页URL在其中排列,形成一个队列结构,调度程序每次从队列头部取出URL,发送给网页下载器下载页面内容,每个...

  • 120
    网络爬虫 | 你知道分布式爬虫是如何工作的吗?

    对于商业搜索引擎来说,分布式爬虫架构是必须采用的技术。面对海量待抓取网页,只有采用分布式架构,才有可能在较短时间内完成一轮抓取工作。 分布式爬虫可以分为若干个分布式层级,不同...

  • Hive命令

    HDFS命令 HDFS命令 Usage: hdfs [--config confdir] COMMAND where COMMAND is one of: 常用命令 对于HD...