ElasticSearch官网:https://www.elastic.co/cn/downloads/
RelaxHeart官网:https://relaxheart.cn
原文:ES(入门一):走进ElasticSearch
ElasticSearch是什么?
ES(ElasticSearch)是一款非常强大的开源搜索引擎,可以帮助我们从海量数据中快速的找到相应的内容。
例如说我们在github上进行搜索的时候,它不仅可以帮我们快速找到对应的仓库,还可以帮我们实现代码级的搜索及高亮的显示;当我们在网上购物的时候,ES可以帮我们做商品的推荐;当我们下班打车的时候,ES可以帮我们定位附近的乘客及司机,帮助平台实现优化调度。
那除了搜索,结合Kibana Logstash Beats,Elastic stack还被广泛使用在大数据、近实时分析的领域,包括日志分析、指标监控、信息安全等多个领域。可以帮助我们探索海量的、结构化的、非结构化的数据,按需创建可视化报表、对监控数据设置报警阈值、甚至使用机器学习的技术自动识别异常和状况,及时发出警报。
场景一:淘宝的搜索、喜好推荐/猜你喜欢等
场景二:GitHub的仓库搜索及代码高亮
场景三:高德打车附近车辆定位
我为什么要学习ElasticSearch?
在DBRanking2019年5月的数据库评测中,ES在Search Engine(搜索引擎)分类中名列第一。国内也有大量公司在使用ES,包括滴滴、今日头条、饿了么、小米、360安全、VIVO等知名公司。
今天ES在全球的下载量已经超过3.5亿次,阿里、google、微软等云计算巨头也在云平台上提供了ES的托管服务。开发人员、运维工程师、架构师都值得去学习这门优秀的Search Engine,因为在大数据时代掌握近实时的搜索和分析能力才能掌握核心竞争力,共建未来。
主要功能及产品特性
主要功能:
- 分布式搜索引擎
- 大数据近实时分析引擎
产品特性:
- 高性能,远离T+1
- 容易使用,容易扩展
学习的背景
通过一些了解,我自己以最新的7.1的版本进行学习,相信可以对ES的新特性有更全面直观了解,例如使用机器学习进行异常监测,使用Canvas进行展示我的数据,使用索引的生命周期管理工具对我的索引数据进行优化等。
学习计划或目标
从最基本的概念入手,逐步探索更加高级的搜索技术,进而了解的底层的细节,工作原理等。比如集群安装部署等注意细节?Query-then-fatch的工作机制是怎样的?它会对搜索的算分产生怎样的影响?再比如ES的统计结果在什么样的情况下会不准,又如何才能避免这种情况的发生?数据建模先关的最佳实践等?运维及性能优化等?
最终目标:学以致用,构建自己的搜索和数据分析产品。
学习大体可以分为这几块:
开发
产品的基本功能,底层工作原理及数据建模实践运维
容量规划;性能优化;问题诊断;滚动升级方案
- 搜索与如何解决搜索的相关性问题
- 大数据分析实践与项目实战,理论知识如何运用到实际场景
欢迎大家关注个人博客网站:RelaxHeart网 - Tec博客