Please enable JavaScript.
Coggle requires JavaScript to display documents.
Elasticsearch核心组件 - Coggle Diagram
Elasticsearch核心组件
Cluster
定义:包含多个节点的服务器集群,提高服务的负载和可用性, 支持横向扩展.
高可用性架构
模式1: 灾备模式(PRD->DR)
模式2: 本地化模式(一个Central DC->多个local DC)
模式3: 聚合模式(多个local DC->一个central DC)
跨集群数据同步: Cross-cluster replication
跨集群数据查询: Cross-cluster search
-
-
-
Node
-
角色
master
--职责:主节点候选节点,一个集群至少有一个主节点,负责轻量级的集群范围的操作,比如索引的创建和删除,节点跟踪,分片分配。
--数据:index metadata, cluster-wide metadata
data
--职责:数据节点,负责CRUD,search,aggregation操作,每个集群至少包含一个data_content&data_host或data节点
--数据:shard data, index metadata, cluster-wide metadata
--data_content:特殊数据节点,负责数据CRUD,搜索聚合操作
--data_hot:特殊数据节点,适合时间序列数据,频繁读写
--data_warm:特殊数据节点,不被频繁读写
--data_cold:特殊数据节点,只读,很少的读操作
--data_frozen:特殊数据节点,适用于部分被加载的索引
-
-
-
-
-
Index
-
-
设置模块
--索引分片设置
--操作锁:读写锁或元数据锁
--Mapping:数据类型识别设置
--Merge:Lucene索引的segement合并设置
--Similarity:socring/ranking设置
--slowlog:log slow search相关设置
--store:low-level,数据如何存到文件系统
--translog:事务日志,用于lucene commit之前
--Sorting:分片内segement排序
--indexing pressure:索引操作的设置
-
-
Lifecycle
-
生命周期管理
生命周期Policy:条件包括索引大小,文档数量,索引年龄,在index template中指定
datastream:适用于时间序列数据,需要借助index template,自动管理生命周期
-
Shard
-
操作:
--Sharding Strategy:数据大小,硬件资源,分片效率,分片大小,分片数量
--Replication: 主分片和副本分片
--Allocation:分片在节点间如何分配, 主节点和副本节点不应在同一节点, 同一索引的不同主分片尽可能不放在同一节点
--Re-balance:分片在节点间如何平衡,各节点的分片数量保持均衡