服务器上的 4 块盘做了 raid10,突然有块盘亮红灯了,心里咯噔一下 —— 这还能再坏几块?会不会一坏就丢数据?小编前阵子帮朋友的小公司处理过这事,他那技术员啥也不懂,我俩对着服务器研究半天,总算弄明白了。今天就把 4 块盘的 raid10 到底能坏几块、为啥有的情况能扛住有的不行、遇到坏盘该咋办,全跟你说透,新手看完也能心里有谱,别再瞎紧张了。
先搞懂:4 块盘的 raid10,是咋组队干活的?
raid10 这东西,说复杂也简单。4 块盘它不是胡乱凑一起的,会先分成 2 组,每组 2 块盘,就像俩小组,每组里的两块盘是 “双胞胎”—— 一块记东西,另一块就跟着抄一份(这叫 raid1 镜像)。然后这俩小组再手拉手一起跑(这叫 raid0 条带),速度就快了。
打个比方,就像俩快递点,每个点有俩快递员,甲点的快递员 A 和 A’,乙点的 B 和 B’。A 记的件,A’ 也记一份;B 记的件,B’ 也记一份。要是 A 请假了,A’ 能顶上;B 请假了,B’ 能顶上。但要是甲点的 A 和 A’ 都请假,那甲点的件就没人管了,直接乱套。
所以啊,4 块盘的 raid10,分组就是(盘 1 + 盘 2)一组,(盘 3 + 盘 4)一组,每组里的盘是 “互相备份” 的。
答案来了:最多能坏 2 块,但有个死规矩
不少人说 “raid10 能坏 2 块盘”,对 4 块盘的情况来说,这话对,但有个前提 ——不能是同一组里的 2 块。
咱分情况说:
- 坏 1 块:没事。不管是盘 1 坏了,还是盘 3 坏了,只要就 1 块,服务器照跑,数据啥都不缺。小编朋友公司那次就是盘 2 坏了,服务器该存数据存数据,一点不耽误。
- 坏 2 块,分属不同组:比如盘 1 坏了,盘 3 也坏了(一组坏 1 块),没事。这时候每组还有 1 块好盘顶着,数据安全,就是读写速度会慢点,赶紧换盘就行。
- 坏 2 块,同属一组:比如盘 1 和盘 2 都坏了,完了。这组的备份彻底没了,数据直接丢,神仙也救不回来。有个做监控的老板就吃过这亏,4 块盘的 raid10,同组坏了 2 块,半个月的监控录像没了,悔得直拍大腿。
所以记住:4 块盘的 raid10,最多能坏 2 块,但必须是两组各坏 1 块。超过这个数,或者同组坏 2 块,都是死局。
坏盘之后,服务器还能撑多久?别拖!
有人说 “坏 1 块盘没事,先凑合用着”,这话别全信。4 块盘的 raid10,坏 1 块之后,剩下的 3 块盘里,跟坏盘同组的那块,负载会翻倍 —— 原来俩盘干的活,现在它一个干,累啊。
小编朋友那回,坏了 1 块盘没当回事,拖了 5 天,结果同组的另一块盘也开始报警(没彻底坏,但快了),吓得赶紧买新盘换上。后来问工程师,人家说:“4 块盘的 raid10,坏 1 块后,72 小时内必须换盘,超过这时间,同组盘再坏的概率能涨 3 倍。”
换盘也简单,断电,把坏盘拔下来(看指示灯,红的那个就是),新盘插上,开机进阵列卡界面(一般按 Ctrl+R),选 “重建”,等着进度条跑完就行,4 块盘的话,差不多 2 小时能好。
自问自答:这些情况,你可能也碰到过
问:4 块盘的 raid10,坏了 1 块,服务器还能正常用吗?
答:能!读写数据、跑程序都不耽误,就是速度比平时慢一点(毕竟少了一块盘帮忙)。小编朋友公司坏盘那几天,他们的财务软件照样用,就是导报表的时候比平时多等 10 秒,不影响干活。
问:新盘换上之后,原来的数据还在吗?
答:在!raid10 的好处就是,只要没丢数据,新盘插上重建的时候,会自动从同组的好盘里抄数据,抄完跟原来一模一样。小编换完盘检查过,朋友公司的客户资料、合同文档,全在,一点没少。
问:4 块盘的 raid10,比 4 块盘的 raid5 好在哪?
答:raid5 最多只能坏 1 块盘,4 块盘的 raid10 能坏 2 块(不同组),容错性更强。但 raid5 省空间(4 块盘当 3 块用),raid10 得浪费一半空间(4 块盘当 2 块用)。要是数据值钱,比如客户信息,选 raid10;要是存些不重要的日志,raid5 也行,看你咋选。
小编的一点想法
4 块盘的 raid10,说扛造也扛造,说娇气也娇气 —— 关键在 “别让同组坏 2 块”。真遇到坏盘,别拖,72 小时内赶紧换,新盘换上重建就行,没那么复杂。
要是你那服务器存的是特重要的数据(比如客户订单、财务记录),别光靠 raid10,最好每天备份一次,双保险总没错。小编朋友现在就养成了备份的习惯,他说:“多花 10 分钟备份,比丢数据哭半天强。”