240 发简信
IP属地:安徽
  • 120
    jieba分词介绍

    Python中分分词工具很多,包括盘古分词、Yaha分词、Jieba分词、清华THULAC等。它们的基本用法都大同小异,这里先了解一下结巴分词 一.安装 pip instal...

  • 120
    索引构建

    创建索引 首先在solr目录下建立一个名字为test的core,后面的-force是因为是root账户创建的core,所以要加的,而这个core在solr的./solr-7....

  • 120
    Jieba对龙族4的词云尝试

    Jieba对龙族4的词云尝试 1.前置条件 java环境和安装jieba,即java -version 和pip install jieba,很简单的大家...

  • 120
    TIKA实验报告

    TIKA实验报告 1.tika是什么 Tika 是一个文本内容检测和解析工具,主要功能包括文档类型检测、内容提取、元数据提取、语言检...

  • 120
    实验报告:Dmoz—Business信息爬取

    实验报告:Dmoz—Business信息爬取 一.实验目的和要求 爬取www.dmoz.org网站business分类下所有的网站信息(标题、url和简介)以...