前几天整理文档时,无意间发现了这篇文章,全篇讲的都是关于灾备演练的,从初级的基本演练,到数据异常报错的解决方法,洋洋洒洒有好几页,但总体看来却是杂乱无章,并且也不慎详细。冬天天太冷,又没有暖气,所以我就忍着冻把初级的基础演练整理成了一篇可以看的文章,里面都是一些简单的示例,大家应该都经历过,发出来给大家也做个记录。
大家都知道数据重要,所以大家都努力的去做数据的备份,去开发各种各样新的备份策略,尝试各种各样的备份工具,但却很少有人去主动的做灾备演练。我曾经见过数据异常时,想要使用备份时,发现备份数据异常,甚至某些人竟然不知道如何进行数据恢复,然后再各种百度恢复命令。所以在我看来,灾备演练应该包含到备份流程中,既是为了验证数据的正常性,也为了让员工在数据异常时能够淡定的处理故障,恢复数据,而不至于在环境的压力下手忙脚乱。
Redis灾备演练
说明: Redis主从架构, 主库不开启持久化,从库开启aof和rdb持久化。数据均未设置过期时间。
场景一: 主Redis进程异常退出,从Redis进程正常
分析
由于主Redis未做任何持久化,所以在Redis异常退出之后,主Redis数据完全丢失。但从库Redis不受影响,为完全数据。所以我们恢复的目的是把从Redis数据重新导致主Redis中
恢复流程:
- 登录从库命令行,执行save操作,确保从库 rdb文件为最新快照
- 记录从库 key的数量,用于主库恢复之后数据的比对;
- 在从库上执行stop操作,将从库 redis 关闭;
- 获取从库在步骤一中保存的最新的快照放入主库 RDB 文件存放路径下,并修改成相应的名称;
- 启动主库 Redis 服务,获取Key数量,对比步骤二获得的Redis key 数值,验证数据是否一致;
- 验证一致后,启动从库 Redis 服务;
注意事项: 严禁直接启动主库Redis, 否则会导致从库Redis数据完全丢失。
场景二: 主Redis进程正常,从Redis进程异常退出
分析
因Redis主丛架构中,从Redis每次重新连接主Redis时,均会从主Redis获取一份完整的数据,所以,在主Redis正常情况下,我们只需要直接启动从Redis即可。
恢复流程
- 直接启动从Redis即可
MySQL灾备演练
说明 : MySQL主从架构,从库进行数据备份
场景一: MySQL主库异常退出,数据异常,实例损坏,无法正常重启,Mysql 从库正常:
分析
虽然主库已经无法修复,但从库正常,所以我们先准备一个新的MySQL主库,然后将从库数据完整的备份,导致主库即可
恢复流程:
- 在从库中停止 mysql 主从同步功能
- 将从库数据进行一个完整的备份,并将备份同步到主库服务器内
- 在主服务器上重新启动一个全新的实例,并导入步骤二同步进来的数据
- 在从库上重新进行主从的配置,并确认主从成功
场景二: Mysql 主库正常,Mysql 从库实例损坏,数据异常,无法正常重启
分析
因为从库数据异常,所以需要重新做主从,这时候我们需要从备份上下载最新的备份快照,导入从库,然后重新做主从即可
恢复流程:
- 从备份中下载最新的备份数据快照至从服务器
- 在从服务器上启动一个全新的MySQL服务,并导入下载的备份快照
- 在从库上重新进行主从的配置,并确认主从成功
注意: 在非必要条件下,不要在主数据库进行备份操作