怎样才能把运维工作做好
- 2025-10-09 22:29:00
- 丁国栋
- 原创 73
我是2012年实习开始就一直做运维工作至今也有13年了。因为没有去过什么大厂,不是给大佬当小弟就是一个人负责所有,所以接下来的文字都是一些小微企业的运维经验或者知识,仅供参考,欢迎讨论。
2012~2015
- 学无止境,所有职业生涯的开始阶段最重要的就是积累,一步一个脚印,学习需要扎实的基础;
- 人外有人,天外有天,学会谦虚、学会低调;
- 多向高手学习,向高手学习思路、思想、思考轨迹等,而不只是一个解决方案;
- 学习是一种习惯,贵在思想、重在坚持;
- 做好笔记、学会分享,一个好习惯坚持一辈子;
- 多读书和动手做实验是快速学习进步的手段,要好好利用所有可用的资源,包括身边的所有人(领导、客户都算);
- 听人劝吃饱饭,不听老人言吃亏在眼前,别人好心告诉你的经验和教训需要认真听着、学着、做着,因为可能在不远的将来就会后悔当初为什么没有如何如何;
- 不要害怕和人打交道,站在别人的位置以更高的角度思考解决问题;
- 创建资产库,做好监控告警,定期查看性能数据;
2015~2021
- 运维和开发有冲突、纠纷时,作为运维应该去深入学习公司业务,深入学习开发的知识,包括编程语言、数据库、公司业务等,这样才会少背锅,且对日后高效运维、自动化运维、云服务打下坚实基础;
- 工作注意细节,资源的创建、变更有记录,做一件成一件;
- 让自动化解放双手,能用程序解决的就不要人工重复操作;
- 狠抓业务和系统安全,不要为了节约成本而放低安全的标准,省钱不省安全;
- 融入当地或互联网的圈子,建立互学互助的关系,例如加入一些好的技术群,加一些可以互学互助的网友;
- 积极主动地做事情,将职责范围内的事情做好、做细、做规范;
2021~2025
- 遵循运维标准规范和最佳实践;
- 做好风险管理,监控采用预警机制,提前预防问题发生;
- 重视和做好文档管理,团队建设,定期培训;
- 做好巡检机制,告警必看,有苗头必抓,避免小概率事件的发生;
- 重视性能问题,节约成本;
- 做好系统规划,让服务、数据等更容易迁移,控制迁移成本;
- 可以复用的功能、系统、服务尽量复用(注意不是耦合,而是降低维护成本);
- 对已有的系统、服务、功能进行检查和优化,及时发现问题和优化;
- 对关键业务指标进行监控和定时发送报告给自己和相关人员,及时发现问题和预测可能要发生的问题,例如错误数、失败数等等;
- 提升自己的设计能力,特别是复杂架构的设计,比如流水线、Kubernetes等;
- 培养自己的沟通能力、文字表达能力;
- 能够认清自己,知道和正视自己的优缺点,锻炼和培养抗压和自愈能力;
- ...
--
发表评论