搜索引擎 / 日志 / 大数据方向的加分项
ES 基本原理
基于 Lucene 做的分布式搜索引擎。
数据结构是 文档(Document),类似 JSON。
核心是 倒排索引 —— 先找关键词,再找文档。
支持 分词,所以中文、模糊搜索都很强。
分布式架构:索引分成多个 分片(shard),提高并发和容错。
ES 核心特点
分布式、高可用,天然支持分片和副本,扩容很方便。
全文检索能力极强,支持分词、模糊、高亮、聚合统计。
读写性能高,特别适合大量数据写入 + 复杂查询。
面对深度分页比 MySQL 强很多,可以用 search_after 做到高效翻页。
常用于 ELK 日志体系、商品搜索、内容检索、用户行为分析。
业务场景
海量日志聚合(ELK)
全站搜索、商品搜索
大量数据模糊查询、高亮、聚合
千万、亿级数据深度分页
日志检索、APM 系统