故障反思 安全问题 最近看了很多运营事故的复盘,让我有种后背发凉的感觉。因为自己在公司实习的时候,在线上环境的操作都是很随意的。并没有每一步按照流程进行执行,试过了很多的危险操作,至今还没出事属实是侥幸。 案例一:生产环境中执行危险脚本 这是最近学校工作室发生的一起事故。事故的北京是这样的,工作室的师弟,手滑在正式环境上面误跑了“重新部署”的脚本。导致了,重要数据以及日志全部被删除。而且,对 2021-11-19 笔记
读论文《the google file system》 最近读了谷歌的分布式文件系统,感觉收获很大。这篇文章啃下来还有点费解的,还有一些具体的设计不是很明白,欢迎大家来讨论~ 论文地址 2021-11-13 数据库 分布式