一、轻量搜索Query String Search
搜索全部商品:
took
:耗费了几毫秒。
timed_out
:是否超时,这里是没有。
_shards
:数据拆成了5个分片,所以对于搜索请求,会打到所有的primary shard(或者是它的某个replica shard也可以)。
hits.total
:查询结果的数量,2个document。
hits.max_score
:score的含义,就是document对于一个search的相关度的匹配分数,越相关,就越匹配,分数也高。
hits.hits
:包含了匹配搜索的document的详细数据。
query string search的由来,因为search参数都是以http请求的query string来附带的,搜索商品名称中包含表演服
的商品:GET /goods_index/goods/_search?q=name:表演服
适用于临时的在命令行使用一些工具,比如curl,快速的发出请求,来检索想要的信息;但是如果查询请求很复杂,是很难去构建的。
query string基础语法:
GET /goods_index/goods_type/_search?q=name:\u4e2a\u6027
GET /goods_index/goods_type/_search?q=+name:\u4e2a\u6027
GET /goods_index/goods_type/_search?q=-name:\u4e2a\u6027
+ 表示必须包含
- 表示 不包含
在生产环境中,几乎很少使用 query string search。
关键字查询中文问题:
GET /goods_index/goods_type/_search?q=name:个性
查不出数据,中文请使用Unicode编码
GET /goods_index/goods_type/_search?q=name:\u4e2a\u6027
转换网址:
http://tool.chinaz.com/tools/unicode.aspx
二、查询表达式 Query DSL
DSL
:Domain Specified Language,特定领域的语言。
http request body
:请求体,可以用json的格式来构建查询语法,比较方便,可以构建各种复杂的语法,比query string search肯定强大多了。
- 查询所有:
GET /goods_index/goods_type/_search
{
"query": {
"match_all": {}
}
}
- 查询名称包含
表演服
的商品,同时按照价格降序排序:
# 查询名称包含表演服的商品
GET /goods_index/goods_type/_search
{
"query": {
"match": {
"name": "演出服"
}
}
}
批量添加数据:
POST _bulk
{"index": {"_index": "goods_index","_type":"goods_type","_id": 3}}
{"name": "韩版真皮双肩包 复古潮 演绎时尚范 简约休闲真皮女包","sell_price": 398,"market_price": 500,"cost_price": 320}
{"index": {"_index": "goods_index","_type":"goods_type","_id": 4}}
{"name": "独家专供 大牌原版 莲花纹铂金包35cm头层皮手提包","sell_price": 615,"market_price": 400,"cost_price": 300}
{"index": {"_index": "goods_index","_type":"goods_type","_id": 5}}
{"name": "欧美真皮女包 复古机车包 时尚欧美范单肩手提斜跨包","sell_price": 600,"market_price": 500,"cost_price": 300}
{"index": {"_index": "goods_index","_type":"goods_type","_id": 6}}
{"name": "欧美2014最新款 爆款手袋手提单肩 变色皮 女包","sell_price": 980,"market_price": 400,"cost_price": 100}
注:每条数据第一行为索引及type和id,第二行为数据内容(共两行,不能分开写,否则无法解析,除delete(删除)只有一句之外
# 分页查询商品,总共3条商品,假设每页就显示2条商品,现在显示第1页,所以就查出来第1~2个商品
GET /goods_index/goods_type/_search
{
"query": {
"match_all": {}
},
"from": 1,
"size": 2
}
# 返回结果
{
"took": 0,
"timed_out": false,
"_shards": {
"total": 5,
"successful": 5,
"skipped": 0,
"failed": 0
},
"hits": {
"total": 6,
"max_score": 1,
"hits": [
{
"_index": "goods_index",
"_type": "goods_type",
"_id": "2",
"_score": 1,
"_source": {
"name": "供应藏族成人表演服 个性民族特色藏袍 女性迎宾服舞蹈服可代发",
"sell_price": 860,
"market_price": 860,
"cost_price": 600
}
},
{
"_index": "goods_index",
"_type": "goods_type",
"_id": "4",
"_score": 1,
"_source": {
"name": "独家专供 大牌原版 莲花纹铂金包35cm头层皮手提包",
"sell_price": 615,
"market_price": 400,
"cost_price": 300
}
}
]
}
}
- 指定要查询出来商品的名称和价格
GET /goods_index/goods_type/_search
{
"query": {
"match_all": {}
},
"_source": [
"name","sell_price"
]
}
三、Query Filter (查询过滤)
搜索商品名称包含女包
,而且售价大于900元的商品。
GET /goods_index/goods_type/_search
{
"query": {
"bool": {
"must": {
"match": {
"name": "女包"
}
},
"filter": {
"range": {
"sell_price": {
"gt": 900
}
}
}
}
}
}
这部分与我们之前使用的 match 查询 一样。
这部分是一个 range 过滤器 , 它能找到售价大于900元的文档,其中 gt 表示大于(great than)。
四、Full-Text Search(全文检索)
供应藏族成人表演服 个性民族特色藏袍 女性迎宾服舞蹈服可代发
这个会先被拆解,建立倒排索引,然后匹配度最高的会排第一位。
GET /goods_index/goods_type/_search
{
"query": {
"match": {
"name": "演出服"
}
}
}
五、Phrase Search(短语搜索)
跟全文检索相对应,相反,全文检索会将输入的搜索串拆解开来,去倒排索引里面去一一匹配,只要能匹配上任意一个拆解后的单词,就可以作为结果返回。
phrase search,要求输入的搜索串,必须在指定的字段文本中,完全包含一模一样的,才可以算匹配,才能作为结果返回。
GET /goods_index/goods_type/_search
{
"query": {
"match_phrase": {
"name": "演出服"
}
}
}
六、highlight search(高亮搜索结果)
GET /goods_index/goods_type/_search
{
"query": {
"match": {
"name": "代发"
}
},
"highlight": {
"fields": {
"name": {}
}
}
}