Contents
📋 常用工具(汇总简略不全版)
功能分类 | 主要命令 | 验证状态 | 使用频率 | 适用场景 | 风险级别 |
---|---|---|---|---|---|
集群监控 | ceph -s , ceph health(detail) , ceph df , ceph -w |
✅ 已验证 | ⭐⭐⭐⭐⭐ | 日常监控、故障诊断 | 🟢 无风险 |
I/O监控 | ceph iostat (版本相关,N以上), ceph -w , ceph status |
✅ 已验证 | ⭐⭐⭐⭐ | 性能监控 | 🟢 无风险 |
OSD管理 | ceph osd tree , ceph osd status , ceph osd out/in |
✅ 已验证 | ⭐⭐⭐⭐ | OSD维护、容量管理 | 🟡 中等风险 (查询无风险) |
Monitor管理 | ceph mon stat , ceph quorum_status , ceph mon add/remove |
✅ 已验证 | ⭐⭐⭐ | 集群管理、高可用 | 🔴 高风险 (查询无风险) |
Manager管理 | ceph mgr module enable/disable , ceph mgr stat |
✅ 已验证 | ⭐⭐⭐ | 功能管理、仪表板 | 🟡 中等风险 (查询无风险) |
存储池管理 | ceph osd pool create/delete , ceph osd pool set |
✅ 已验证 | ⭐⭐⭐⭐ | 存储规划、配额管理 | 🔴 高风险 (查询无风险) |
PG管理 | ceph pg stat , ceph pg repair , ceph pg scrub |
✅ 已验证 | ⭐⭐⭐⭐ | 数据完整性、故障修复 | 🟡 中等风险 (查询无风险) |
认证管理 | ceph auth list/create/del |
✅ 已验证 | ⭐⭐⭐ | 安全管理、权限控制 | 🔴 高风险 (查询无风险) |
CRUSH管理 | ceph osd crush tree , crushtool , ceph osd crush rule |
✅ 已验证 | ⭐⭐ | 数据分布、故障域 | 🔴 高风险 (查询无风险) |
RBD管理 | rbd create/rm , rbd snap create , rbd map/unmap |
✅ 已验证 | ⭐⭐⭐⭐ | 块存储、快照管理 | 🟡 中等风险 |
CephFS管理 | ceph fs status , ceph mds stat , ceph fs dump , ceph mds fail |
✅ 已验证 | ⭐⭐⭐ | 文件系统、元数据 | 🟡 中等风险 (查询无风险) |
RGW管理 | radosgw-admin user create , radosgw-admin bucket |
✅ 已验证 | ⭐⭐⭐ | 对象存储、用户管理 | 🟡 中等风险 (查询无风险) |
配置管理 | ceph config set/get , ceph tell |
未验证 | ⭐⭐⭐⭐ | 参数调优、故障处理 | 🟡 中等风险 (查询无风险) |
性能分析 | ceph osd perf ,rbd perf image iostat , cephfs-top |
✅ 已验证 | ⭐⭐⭐ | 性能测试、瓶颈分析 | 🟢 无风险 |
专用工具 | ceph-objectstore-tool , ceph-bluestore-tool |
✅ 已验证 | ⭐⭐ | 数据恢复、深度诊断 | 🔴 高风险 (查询无风险) |
故障排查 | journalctl , ceph daemon dump , 日志分析 |
✅ 已验证 | ⭐⭐⭐⭐ | 问题诊断、根因分析 | 🟢 无风险 |
备份恢复 | ceph mon getmap , ceph auth export , 数据导出 |
✅ 已验证 | ⭐⭐ | 灾难恢复、迁移 | 🟡 中等风险 (查询无风险) |
🔧 1. 集群状态监控
1.1 集群整体状态
|
|
1.2 集群性能监控
|
|
🗄️ 2. OSD 管理
2.1 OSD 基本操作
|
|
2.2 OSD 维护操作
|
|
2.3 OSD 故障排查
|
|
🏛️ 3. Monitor 管理
3.1 Monitor 基本操作
|
|
3.2 Monitor 维护
|
|
👨💼 4. Manager 管理
4.1 Manager 基本操作
|
|
4.2 常用 Manager 模块
|
|
🗂️ 5. 存储池管理
5.1 Pool 基本操作
|
|
5.2 Pool 参数配置
|
|
📄 6. 放置组 (PG) 管理
6.1 PG 状态查看
|
|
6.2 PG 修复操作
|
|
🔐 7. 认证管理
7.1 用户管理
|
|
7.2 权限管理
|
|
🏗️ 8. CRUSH Map 管理
8.1 CRUSH 基本操作
|
|
8.2 CRUSH 规则管理
|
|
🎯 9. RBD 管理
9.1 RBD 基本操作
|
|
9.2 RBD 高级操作
|
|
🌐 10. CephFS 管理
10.1 CephFS 基本操作
|
|
10.2 CephFS 客户端
|
|
10.3 CephFS 高级管理
|
|
☁️ 11. RGW 管理
11.1 RGW 基本操作
|
|
11.2 RGW 密钥管理
|
|
11.3 RGW 维护
|
|
🔧 12. 配置管理
12.1 运行时配置
|
|
12.2 临时配置调整
|
|
📈 13. 性能分析专项
13.1 RBD 性能分析
RBD 性能测试工具
|
|
RBD 性能监控
|
|
RBD 性能调优参数
|
|
13.2 CephFS 性能分析
CephFS 性能测试
|
|
CephFS 性能监控
|
|
13.3 OSD 性能分析
OSD 性能基准测试
|
|
OSD 详细性能监控
|
|
13.4 整体集群性能分析
集群级性能监控
|
|
🛠️ 14. Ceph 专用工具集
14.1 数据恢复和诊断工具
ceph-objectstore-tool (对象存储工具)
|
|
ceph-kvstore-tool (键值存储工具)
|
|
ceph-bluestore-tool (BlueStore 专用工具)
|
|
14.2 监控和管理工具
crushtool (CRUSH 映射工具)
|
|
monmaptool (Monitor 映射工具)
|
|
osdmaptool (OSD 映射工具)
|
|
14.3 数据迁移和同步工具
rados (对象存储客户端)
|
|
rbd-mirror (RBD 镜像工具)
|
|
ceph-crash (崩溃报告工具)
|
|
ceph-volume (卷管理工具)
|
|
🚨 15. 故障排查
15.1 日志查看
|
|
15.2 常见问题排查
|
|
🔄 16. 备份恢复
16.1 数据备份
|
|
16.2 灾难恢复
|
|
16.3 RBD 备份恢复
|
|
本文档持续更新,建议定期检查最新版本。如有任何问题或建议,欢迎反馈。
最后更新时间:2025年06月
Author ceph-deep-dive
LastMod 0001-01-01