目标:
- 了解什么是全文索引技术?
想明白字典的出现是为什么?
结构化数据:指固定格式或有限长度的数据;如数据库,元数据等。
非结构化数据: 指不定长或无固定的数据; 如 互联网数据,邮件,word文档等。
非结构化数据又叫全文数据。 - 全文索引技术可以用来做什么?
搜索引擎:百度,谷歌,搜狗等
站内搜索: 小说网站,电商网站,论坛等。
文件系统搜索: Windows 文件系统搜索
先建立索引,再对索引进行搜索文档的过程就叫 全文索引(full-text Search) - 有哪些主流的JAVA全文检索技术?
Lucene: Java 语言去全文检索技术的底层实现(开山鼻祖)
Solr: 基于 Lucene, 简化开发,同时提升性能和扩展性。也能通过 solrCloud 实现分布式搜索
ElasticSearch(ES): 基于 Lucene, 更倾向于实现实时搜索。 - 这些技术如何选择?
清楚每个技术的特点及缺点。