ES集群操作
1、启动/停止ES
启动:
注意,不能使用root账号启动,单为ES建立一个账号进行控制
su ela
ela-7.10/bin/elasticsearch -d
停止:
kill -9 $ESpid
注意,重启集群时要先停掉普通节点的再停掉master节点的
2、查看集群属性类别
curl -XGET http://192.168.88.142:19200/_cat
3、查看集群健康状态
curl -XGET http://192.168.88.142:19200/_cluster/health?pretty
指标解释:
cluster_name:集群名称
status:表示集群健康状态,分为red,yellow,green,如果显示为green,则表明集群运行正常,无问题。
(1)red:不是所有的主要分片都可用,表示该集群中存在不可用的主分片,可以理解为某个或者某几个索引存在主分片丢失的情况。
(2)yellow:所有主要分片可用,但不是所有副本分片都可用,表示该集群中某个或者某几个索引存在副本分片存在丢失的情况。造成yellow状态的原因是索引存在副本分片丢失的情况,需要使用_cat/indices 查找并修复集群中有问题的索引。
(3)green:所有主要分片和副本分片都可用,表示集群中所有的索引都很健康,不存在丢失的分片。
number_of_nodes:表示集群在线节点数
number_of_data_nodes:表示集群在线数据节点数
active_primary_shards:存活的主分片数量
active_shards:活动主分区和副本分区的总数
relocating_shards:正在重定位的分片的数量
initializing_shards:正在初始化的分片数
unassigned_shards:未分配的分片数
delayed_unassigned_shards:其分配因超时设置而延迟的分片数
number_of_pending_tasks:尚未执行的集群级别更改的数量
number_of_in_flight_fetch:未完成的访存数量
task_max_waiting_in_queue_millis:自最早的初始化任务等待执行以来的时间(以毫秒为单位)
active_shards_percent_as_number:集群集中活动碎片的比率,以百分比表示
4、查看集群节点状态
curl -XGET http://192.168.88.142:19200/_cat/nodes
指标依次是:
ip地址;堆内存占用百分比;机器内存占用百分比;cpu占用百分比;1分钟负载;5分钟负载;15分钟负载;节点角色;是否为master节点(带*号为master节点);节点名称
5、增加/删除节点
增加:
在所有节点上的elasticsearch.yml文件中添加新节点ip:192.168.88.132及名称:node4
vim /opt/ela/ela-7.10/config/elasticsearch.yml
discovery.seed_hosts: ["192.168.88.142", "192.168.88.143", "192.168.88.144", "192.168.88.132"]
cluster.initial_master_nodes: ["node1", "node2", "node3", "node4"]
将原有的ES目录下所有的文件、目录拷贝到新节点上,注意elasticsearch.yml和jvm.options文件中的配置要进行修改
在新节点(192.168.88.132)上启动ES
/opt/ela/ela-7.10/bin/elasticsearch -d
查看集群状态:
curl -XGET http://192.168.88.132:19200/_cluster/health?pretty
curl -XGET http://192.168.88.132:19200/_cat/nodes
添加成功
删除:
在集群所有机器的elasticsearch.yml文件中去掉要删除节点的信息
直接在要删除的节点上kill掉es的pid
查看集群状态: