solr基础练习实验报告(我会告诉你全是图嘛)

环境:window7+solr6.5.1

0 启动solr
0.1 通过实现配置好的techproducts示例内核启动Solr搜索服务器:

bin\solr -e techproducts

0.2 解释过程

输入命令之后,先执行的是启动Solr服务器

启动

没有techproducts项目,新建techproducts

新建

post数据,向techproducts上传14个示例文件

post
1 理解索引
1.1 定位techproducts所在目录

F:\solr-6.3.0\solr-6.3.0\example\techproducts

打开该目录,该目录下还有两个子文件夹:logs和solr,logs用来记载内核运行的日志,solr是内核的核心,一切操作都将在这里进行。

1.2 定位techproducts索引数据位置

F:\solr-6.3.0\solr-6.3.0\example\techproducts\solr\techproducts\data

1.3 下载索引数据到本地

由于我是在本地搭建的环境,所以索引数据就存储在本地,无需再下载。

1.4 使用Luke查看索引数据
  • 1.4.1 打开Luke窗口
    双击luke-6.3.0目录下的luke.bat文件,也可以通过命令行运行,先进入luke所在目录,再输入如下命令:
    java -jar luke-with deps.jar
Paste_Image.png
  • 1.4.2 打开techproducts的索引数据
    在上图的path中输入techproducts的索引库目录,就可以索引数据。
    overview选项卡:用来进行索引的一般性查看和操作的,比如索引目录名,索引文件版本。。。等等概要信息,右上角三个按钮分别可以重新打开索引,提交索引更改和关闭当前打开的索引,下面两个list显示词和字段的相关信息。有时一个关键词,对应于多个文档,所以文档数要多于关键字数目。
    Documents选项卡:用来进行文档的操作和查看的,比如文件的删除、添加。下面一个大listview就可以用来查看文档的详细信息。通过Document标签可以查看各个Term,点击show All,会进入search页面,显示使用term查询,匹配的所有记录。 这里的term就相当于查询关键字。Term对应的各个文档,这里也可以show all,这会跳转到Search标签,也可以点击Show Position显示文档的位置信息。 这里的term frequency是指 term在文档中的出现次数。只有Show all,才会触发Search,并跳转到Search标签。
    Search选项卡:在这里进行索引的搜索测试,可以编写lucene搜索语句,然后可以看到语句解析后的query树,这样就可以知道为什么有些查询会查询不到想要的信息,然后还可以选择进行搜索的分词器、默认字段和重复搜索次数的(可以通过多次搜索来获取平均一个搜索过程的耗时长短,这个对查询的性能测试时非常有用的),然后下面的listview中就会列出一个搜索的的文档的所有保存的(store)字段的值,下面可以看到查询花费的时间。在Search标签页里,点击Explain structure,可以看到对查询字符串的分词结果。(在查询输入框)更新查询字符串之后,需要点击update,才会更新下面的字符。
    Commits选项卡:用来查看每个索引相关文件的一些属性的界面,具体的话,可以通过这个界面分析下索引文件的多少,是否需要优化或者合并等等。
    Plugins选项卡:可以看到luke提供的各种插件,我认为比较有用的还是那个分词工具,提供一个分词的类,然后下面文本框输入一段文本,然后就可以让这个工具帮你分词,你可以看到详细的分词信息。然后还有一个Hadoop插件,支持从hadoop节点中获取节点中文件的相关信息。Analyzer Tool,可以使用这个测试Analyzer的工具。
    总而言之,Luke是一个用于Lucene搜索引擎的,方便开发和诊断的第三方工具,它可以访问现有Lucene的索引,并允许用户显示和修改。
  • 1.4.3 search使用
Paste_Image.png

由上图可以看到,第一条搜索结果的score得分为1.4344.

1.5了解schema
1.5.1 定位 techproducts 的 schema 信息(managed-schema 文件),对照之前的索引情况,解读其 schema 内容
图片.png

在techproducts的managed-shema中,定义了所需数据的所有字段,并对这些字段进行了设置,常用的几个设置如下:

  • type 分词器选择
  • indexed 该字段是否可以检索
  • stored 该字段是否需要存储
  • multiValued 该字段的取值是否唯一
1.5.2 定位 techproducts 的被索引文档(原始文档),对照索引和 schema 情况,分析多个原始文档的内容构成

被索引文档中的字段在shema中都有定义,solr通过根据定义字段时的设置,选择对应的分词器对该字段进行分词,然后再对用户输入的词进行分词,两者相互匹配,得出索引结果。

2 掌握Query查询构造#####
2.1

查询请求:


2.1请求

查询结果:


2.1结果
2.2

查询请求:


2.2请求

查询结果:


2.2结果
2.3

查询请求:


2.3请求

查询结果:


2.3结果

这没啥可说的,主要是了解对field范围的限定。
2.4

查询请求:


2.4请求

查询结果:


2.4结果
2.5

查询请求:


2.5请求

查询结果:


2.5结果
2.6

查询请求:


2.6请求

查询结果:


2.6结果
3 创建电影Movie内核#####
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,222评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,455评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,720评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,568评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,696评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,879评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,028评论 3 409
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,773评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,220评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,550评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,697评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,360评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,002评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,782评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,010评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,433评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,587评论 2 350

推荐阅读更多精彩内容