【私货】MongoDB 副本集的运维部署
副本集介绍
什么是副本集? 副本集是 MongoDB 的复制系统,用于将数据同步到各个服务器的过程。
单节点在测试环境还行,但是在线上生产环境就不合适了,因为如果单节点出问题了,会导致应用宕机。
所以这个时候我们可以 MongoDB 的复制功能,使用多节点进行部署,其中一台服务器节点宕机了,还有其他节点运行,进行故障转移,让应用不会受到影响,从而更为高可用。
说到故障转移,MongoDB 最初支持一种叫「主从模式」(master-slave) 这种模式下 MongoDB 不会做自动故障转移的。这种模式现在已经不推荐使用了,这里就不过多介绍了。
由于副本集新增节点或者删除节点都非常方便,建议即使你一开始是单节点也以副本集的方式启动,方便后续进行节点添加。
成员介绍
副本集成员这里主要介绍仲裁者 arbiter, 延迟备份节点这两种成员。
说到仲裁者,这里需要说一个副本集成员之间选举主节点过程有一个满足「大多数」原则 即 n/2 + 1 。仲裁者作用就是「参与选举」,不保存数据。解决在一开始我们应用程序量很小的时候,没有资源,不想保存三分及以上数据副本。
rs.add({“_id”: 3, “host”: “server-3:27017”, “arbiterOnly”: true})
这里注意:
最多只能使用一个仲裁者
奇数节点不需要仲裁者
尽可能使用奇数个数据节点,不使用仲裁者
说完仲裁者,我们说一下「延迟备份节点」,在给团队内部做分享的时候,我们公司的运维大神专门强调要讲这个,这个是有历史血泪的。
延迟备份节点主要作用避免有人不小心删除了主数据库,或者应用程序有一个严重 Bug 导致把所有数据玩坏了。为了避免这一类问题,设置一个延迟备份节点。强烈建议线上配置,这是有血泪史的。
rs.add({ _id:4, host: “server-4:27020”, priority: 0, hidden:true, slaveDelay:7200, votes:0, buildIndexes:true, arbiterOnly:false} )
其实这也算是一个备份方式之一,保底计划。
副本集初始化
副本集成员启动之后,配置这里我放在最后一节来说,这里我们直接说副本集启动后的初始化操作。
成员初始化操作主要有 4 个步奏:
成员在 local.me 自己创建标志符,删除本地已存在的数据,进行数据同步
将同步源的所有记录数据克隆到本地,这一步是最耗时的
将第一个 oplog 同步中操作记录下来。
创建索引,同步创建索引期间的所有操作
通过上面的 4 个步奏,就完成了副本集初始化。
副本集备份
备份的方式简单小结有以下四种方式:
一、 文件系统快照:其中文件系统快照需要文件系统本身支持,mongod 开启日记系统,后面我配置会说。
二、 复制数据目录:就是复制数据目录所有文件,在备份我们需要防止数据文件不能发生改变,否则将不可用。
保证数据不变,可以通过
db.fsyncLock() 进行锁定所有数据库,运行之后后续操作会加入队列等待。
cp -R /data/db/* /backup/
db.fsyncUnlock() # 解锁数据库能再次进行写操作
三、mongodump:备份恢复速度较慢,不推荐
四、延迟备份节点: 原则上不算备份策略,但是比较重要通过它来延迟防止数据误操作。
副本集部署
最后我们终于说到了副本集配置,这里我们配置好 mongod.conf 配置,replaSetName 设置为 test_rs 名,配置如下:
storage:
dbPath: /test/mongodb/rs1 # 配置路径
journal:
enabled: true # 开启日记系统
systemLog:
destination: file
logAppend: true
path: /test/log/mongodb/rs1.log # 日志
processManagement:
pidFilePath: /var/run/mongodb/rs1.pid
net:
port: 27018
bindIp: 1.2.3.4 # 绑定固定 IP
replication:
replSetName: “test_rs” # 选定配置名
security:
authorization: enabled
keyFile: /test/mongodb/key/test_rs.key
除了上面的配置外,我们可以通过配置 init.d 的启动脚本,大家可以去 github 上面进行搜索一下,有很多启动脚本通过 sudo service mongodb.rs1 start 进行启动处理,通过多个节点进行启动加入到副本集。
由于 mongo 默认是没有密码的,对于数据库的配置,除了配置帐号密码以外,如果我们是在腾讯云或者阿里云服务器上,需要配置安全组,只允许内网固定几台机器 IP,固定端口访问。
配置优化
除了 MongoDB 配置启动好了,我们还需要对服务器做一些配置调整,主要有以下几点:
禁止内存过度分配:overcommit_memory=2
禁用大内存页面 HugePage:
修改文件描述符 > 20000 或者无限制
关闭定期任务,比如软件包自动更新,消耗 CPU 及内存资源,造成服务抖动异常 (类似 Redis 异步任务 hgetall)
其中 vercommit_memory 设置 1,满足所有内存分配请求 (redis 部署),设置 2 分配虚拟空间不超过 swap 与一小部分过度分配的和,设置 0,让内核猜测过度分配大小。
禁止大内存:如果不能全部存进内存,不考虑超过内存容量情况,就可以用大内存,但是不能全部存进去的话,那么大块数据会导致更多 IO,而且「脏数据」落地到硬盘可能从 KB 到 MB。
至此我们服务部署上线结束,由于个人经验所限,难免有些疏忽遗漏甚至错误,欢迎留言指出,非常感谢。
天哪