Elasticsearch 运维手册

type
Post
status
Published
date
Jan 22, 2026
slug
summary
tags
运维
Windows server
category
技术分享
icon
password

📘 概述

Elasticsearch 是一个分布式、RESTful 风格的搜索和分析引擎,能够实现海量数据的近实时搜索、分析和可视化。本手册涵盖安装、配置、备份恢复、性能优化及日常运维。

🔧 安装与配置

1.1 Windows 安装

1.1.1 手动安装

1.1.2 MSI 安装器

1.2 Docker 安装(推荐开发环境)

1.3 关键配置文件(elasticsearch.yml)

1.3.1 集群与节点配置

1.3.2 网络与发现配置

1.3.3 内存与JVM配置(jvm.options)

1.3.4 安全配置(X-Pack)

1.3.5 性能优化配置


💾 备份与恢复

2.1 快照与恢复

2.1.1 配置快照仓库

2.1.2 S3 仓库(AWS/Aliyun)

2.1.3 创建快照

2.1.4 查看和管理快照

2.1.5 恢复快照

2.2 备份策略

2.2.1 Windows 备份脚本

2.2.2 定时备份(Windows 任务计划)

  1. 创建 PowerShell 脚本
  1. 打开"任务计划程序"
  1. 创建基本任务
  1. 设置每日执行时间
  1. 操作:启动程序 powershell.exe
  1. 参数:ExecutionPolicy Bypass -File "C:\\scripts\\backup_elasticsearch.ps1"

2.2.3 冷热备份策略


📊 监控与性能优化

3.1 集群监控

3.1.1 集群健康状态

3.1.2 节点状态

3.1.3 索引状态

3.2 性能监控指标

3.2.1 JVM 监控

3.2.2 查询性能监控

3.2.3 磁盘监控

3.3 性能优化

3.3.1 内存优化

3.3.2 索引优化

3.3.3 查询优化

3.3.4 分片优化


🔄 集群管理

4.1 节点管理

4.1.1 节点角色配置

4.1.2 节点维护

4.2 索引生命周期管理(ILM)

4.2.1 创建ILM策略

4.2.2 应用ILM策略

4.3 安全配置

4.3.1 用户和角色管理

4.3.2 SSL/TLS配置

4.3.3 审计日志


🚨 故障排除

5.1 常见问题

5.1.1 集群红色状态

5.1.2 内存问题

5.1.3 写入性能问题

5.1.4 查询性能问题

5.2 日志分析

5.2.1 日志文件位置

5.2.2 关键错误日志

5.2.3 日志分析命令


📋 日常运维检查清单

每日检查:

集群健康状态:GET /_cluster/health
节点状态:GET /_cat/nodes?v
磁盘使用率:GET /_cat/allocation?v
JVM堆内存:GET /_nodes/stats/jvm
索引状态:GET /_cat/indices?v
备份状态:GET /_snapshot/my_backup/_all
慢查询日志:GET /_search/slowlog

每周检查:

分片分布均衡性:GET /_cat/shards?v
索引增长趋势
清理过期索引
验证备份文件完整性
分析慢查询,优化索引
检查操作系统和Elasticsearch日志

每月检查:

执行完整的性能测试
检查并优化集群配置
审查安全设置和用户权限
测试灾难恢复流程
更新Elasticsearch版本(如有需要)
清理磁盘空间,删除旧快照

🛠️ Windows 特定运维

6.1 Windows 服务管理

6.2 Windows 性能优化

6.3 Windows 监控脚本


Loading...