运维之道

一. 简述

运维是公司的润滑剂,是连接业务和基台的枢纽。通常互联网公司有 30 个开发,才可能需要一个运维,这时就需要运维负责各种杂事,从网络,办公设备维护到服务器维护,自动化运维开发。运维的工作不是很难,也不累,就是繁杂。

30 个开发,1 个运维,5 个项目。开发是 10 个人维护 1-3 个项目,运维是维护所有项目。所以要记得哪个项目部署在哪台服务器上,理清楚服务,服务器,网络之间是如何搭配的。可能要写多个表格来记录这些信息,

二. 学习

学习一个东西大致分为几个步骤,可以让学习进度加快,更容易学会。

1. 先了解它大致是做什么的,基本的使用,再自己模拟结合实际做一些简单的实验。
例如 mysql 是一个数据库,可以存取数据。模拟做一个表格,记录班里同学的信息,从中再查某个同学信息,这样会很有意思。

2. 了解它的基本原理和结构,它是如何应用与工作的。
例如 mysql 会将进来的请求分配到空闲的线程中,线程对请求进行格式检查,检查完成后对请求进行处理,然后返回结果。

这里说的比较简单,实际上要有更为详细的步骤,了解原理有助于定位问题和学习。如果了解自己的工资是如何计算的,那你才能发现自己是不是被少给钱了。

3. 熟悉它的各种功能
例如 mysql 有存储引擎,存储引擎是干啥的?为何要有存储引擎?不同存储引擎有啥异同?什么情况下用这种存储引擎?

三. 谨慎

部署一个服务,写出了部署文档,照着文档做 3 次还失败 1 次,最后发现是自己因为看的太草率,导致的失败,实际照着文档做是很难出错的。

看东西和敲打命令不要太快,尤其是在操作多个服务器的时候,很可能在其它服务器上敲打了命令导致损失。

在操作和命令回车前,要多次思考命令下去会造成什么结果,起到什么作用,命令是否打错了。

四. 解决问题

遇到问题先将报错复制到百度翻译,看看是什么意思,结合百度搜到的报错解决方案进行综合分析,对问题进行解决。

如果是突然出现的问题,没有报错,要看日志和问题出现时做了哪些操作,看看正确的操作是什么样的。

当部署服务时出现问题,无法启动服务且无报错,可以精简配置文件,除去必要参数其它参数注释,或者使用默认配置文件启动,找到错误选项。

遇到问题先自己解决,如果在一小时内解决不了就要求助其它人了,防止钻牛角尖和思维盲区。