江明涛的博客
Elasticsearch
Elasticsearch

《Elasticsearch篇 十八》Elasticsearch 对于大数据量(上亿量级)的聚合如何实现?

对于大数据量(如上亿量级)的聚合,Elasticsearch 提供了一些策略和方法来优化性能和资源消耗。以下是针对大数据量进行聚合时的一些建议:

《Elasticsearch篇 十七》对于 GC 方面,在使用 Elasticsearch 时要注意什么?

在使用 Elasticsearch 时,关注垃圾回收(Garbage Collection, GC)是很重要的。GC 对于内存管理和查询性能有重要影响。以下是在使用 Elasticsearch 时需要注意的一些 GC 方面的事项:

《Elasticsearch篇 十六》Elasticsearch 在部署时,对 Linux 的设置有哪些优化方法?

针对 Linux 系统进行优化设置可以帮助提高 Elasticsearch 集群的性能和稳定性。优化主要包括系统资源限制、硬件配置、网络优化、安全性、监控和日志等方面。通过综合考虑各种因素,可以为 Elasticsearch 集群打造一个高性能、可靠的运行环境。

《Elasticsearch篇 十五》在 Elasticsearch 中,是怎么根据一个词找到对应的倒排索引的?

在 Elasticsearch 中,查询一个词时,会使用倒排索引(Inverted Index)来查找包含该词的文档。倒排索引是一种数据结构,用于存储词汇与文档之间的映射关系。以下是 Elasticsearch 根据一个词找到对应倒排索引的过程:

《Elasticsearch篇 十二》拼写纠错是如何实现的

Elasticsearch 是一个分布式的、可扩展的搜索引擎,它具有强大的文本分析和搜索功能。拼写纠错(也称为 “fuzzy search” 或 “fuzzy matching”)是其中一个功能,主要用于处理查询中的拼写错误或误差。

《Elasticsearch篇 十一》 字典树

Elasticsearch 是一个分布式搜索和分析引擎,广泛应用于各种场景,如全文检索、日志分析和大数据处理。在 Elasticsearch 的底层实现中,字典树(Trie)发挥了关键作用,帮助提高搜索性能和相关性。本文将深入解析 Elasticsearch 中的字典树,以帮助您更好地理解这个重要数据结构。