Elasticsearch第9节 mapping 及数据类型

索引的mapping

mapping类似于ddl,创建索引的时候,可以预先指定字段的类型及相关属性。

#索引名/_mapping
GET /lib1/_mapping
{
  "lib1" : {
    "mappings" : {
      "properties" : {
        "age" : {
          "type" : "long"
        },
        "doc" : {
          "properties" : {
            "sex" : {
              "type" : "text",
              "fields" : {
                "keyword" : {
                  "type" : "keyword",
                  "ignore_above" : 256
                }
              }
            }
          }
        },
        "name" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        },
        "sex" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        }
      }
    }
  }
}

1. 核心数据类型

String(text、keyword)
text:
text类型被用来索引长文本,在建立索引前会对这些文本进行分词,转化为词的组合,建立索引。允许es来检索这些词语。text类型不能用来排序和聚合。

keyword:
不需要进行分词。可以被原来检索过滤,排序和聚合。keyword类型字段只能用本身来进行检索。

数字类型:long、integer、short、byte、double、float
日期类型:date
布尔类型:boolean
二进制: binary


2. 复杂数据类型
  • 数组类型:不需要专门指定数组元素的type
    • 字符型数组:["one" , "two"]
    • 整型数组:[1 , 2, 3]
    • 数组型数组:[1 , [2, 3]] 等价于 [1, 2, 3]
    • 对象数组:[{"name" : "xiaochao", "age":22},{"name" : "xiaoyi", "age":20}]

对象类型(object datatype):_ object _ 用于单个json对象
嵌套类型(nested datatype):_ nested _ 用于对象数组


3. 地理位置类型(Geo datatypes)

地理位置类型(Geo-point datatype):_ geo-point _ 用于经纬度坐标
地理位置类型(Geo-shape datatype):_ geo-shape _ 用于类似多边形的复杂形状


1. 创建不同的基本类型字段文档
#老版本在索引后还有一级type
#POST /myindex/article/1
POST /myindex/_doc/article1
{
  "post_date":"2019-05-10",  //注意,日期只能是年-月-日,不能有时分秒
  "tile":"java",
  "content":"java is the best language",
  "id":119,
  "test":["hello","world"]
}
POST /myindex/_doc/article2
{
  "post_date":"2019-06-10",  //注意,日期只能是年-月-日,不能有时分秒
  "tile":"html",
  "content":"I like html",
  "id":120,
  "test":["html","good"]
}
POST /myindex/_doc/article3
{
  "post_date":"2019-06-15",  //注意,日期只能是年-月-日,不能有时分秒
  "tile":"es",
  "content":"es is a new tool",
  "id":121,
  "test":["elasticsearch","very good"]
}
2. 通过映射 _mapping 查看数据类型
#老版本: GET /索引/type/_mapping
GET /myindex/_mapping
{
  "myindex" : {
    "mappings" : {
      "properties" : {
        "content" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        },
        "id" : {
          "type" : "long"
        },
        "post_date" : {
          "type" : "date"
        },
        "test" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        },
        "tile" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        }
      }
    }
  }
}
3. 通过 _search 查看索引下的所有文档
//
#老版本: GET /索引/type/_search
GET /myindex/_search
{
  "took" : 4,  #查询耗时4毫秒
  "timed_out" : false,  # 是否超时
  "_shards" : {
    "total" : 1,    #分片数
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 3,
      "relation" : "eq"
    },
    "max_score" : 1.0,
    "hits" : [
      {
        "_index" : "myindex",
        "_type" : "_doc",
        "_id" : "article1",
        "_score" : 1.0,    # 查出来的文档和查询条件的匹配度
        "_source" : {
          "post_date" : "2019-05-10",
          "tile" : "java",
          "content" : "java is the best language",
          "id" : 119,
          "test" : [
            "hello",
            "world"
          ]
        }
      },
      {
        "_index" : "myindex",
        "_type" : "_doc",
        "_id" : "article2",
        "_score" : 1.0,  # 查出来的文档和查询条件的匹配度
        "_source" : {
          "post_date" : "2019-06-10",
          "tile" : "html",
          "content" : "I like html",
          "id" : 120,
          "test" : [
            "html",
            "good"
          ]
        }
      },
      {
        "_index" : "myindex",
        "_type" : "_doc",
        "_id" : "article3",
        "_score" : 1.0,  # 查出来的文档和查询条件的匹配度
        "_source" : {
          "post_date" : "2019-06-15",
          "tile" : "es",
          "content" : "es is a new tool",
          "id" : 121,
          "test" : [
            "elasticsearch",
            "very good"
          ]
        }
      }
    ]
  }
}
4. 按条件检索:_search?q=column:val
//按条件检索
#查不到数据,因为没有对日期类型数据进行分词
GET /myindex/_search?q=post_date:2019
#能查出数据
GET /myindex/_search?q=post_date:2019-06-15
#能查出数据,因为content是text类型,有进行分词,排序
GET /myindex/_search?q=content:html&sort=post_date:desc
5. object类型及底层存储格式
//
PUT /lib5/_doc/person1
{
  "name":"Tom",
  "age":25,
  "birthday":"1985-12-12",
  "address":{
    "country":"china",
    "province":"guangdong",
    "city":"shenzhen"
  }
}
GET /lib5/_mapping
#底层存储格式
{
  "name":["Tom"],
  "age":[25],
  "birthday":["1985-12-12"],
  "address.country":["china"],
  "address.province":["guangdong"],
  "address.city":["shenzhen"]
  }
}
PUT /lib5/_doc/persons1
{
  "persons":[
      {"name":"lisi","age":27},
      {"name":"wangwu","age":26},
      {"name":"zhaoliu","age":23}
    ]
}
GET /lib5/_mapping
#底层存储
{
  "persons.name":["lisi","wangwu","zhaoliu"],
  "persons.age"[27,26,23]
}
6. 手动创建mapping
//手动创建mapping
DELETE lib5
#手动创建mapping
PUT /lib5
{
  "settings": {
    "number_of_shards": 3,
    "number_of_replicas": 0
  },
  "mappings": {
    "properties": {
      "age" : {"type" : "long"},
      "birthday" : {"type" : "date","index": false},  #不希望建立倒排索引
      "name" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        },
        "content":{"type":"text","analyzer": "standard"},
        "price":{"type": "double"},
        "number":{"type": "integer"}
    }
  }
}
GET /lib5/_mapping
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,277评论 6 503
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,689评论 3 393
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,624评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,356评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,402评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,292评论 1 301
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,135评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,992评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,429评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,636评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,785评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,492评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,092评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,723评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,858评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,891评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,713评论 2 354

推荐阅读更多精彩内容

  • Mapping 类似于数据库中的表结构定义,主要作用如下: 定义Index下字段名(Field Name) 定义字...
    小旋锋的简书阅读 18,043评论 0 14
  • [TOC] 索引是映射类型的容器。ES的索引中存储数据和索引(反向索引)。索引实质上只是逻辑单元,实际的存储单元是...
    0x70e8阅读 204评论 0 0
  • mapping是类似于数据库中的表结构定义,主要作用如下: 定义index下的字段名定义字段类型,比如数值型、浮点...
    Grey____阅读 2,267评论 0 0
  • 1. 啥是映射   ES中的映射(Mapping)实质上就是对文档对象结构的定义,也即对文档中各元素的描述。...
    简单是美美阅读 1,705评论 0 51
  • 第3章 映射 映射是定义存储和索引的文档类型以及字段的过程。索引中的每一个文档都有一个类型,每种类型都有它自己的映...
    MR_ChanHwang阅读 2,305评论 0 1