最近墨菲定律一直在生效,在唯一的硬盘坏了之后,我的群晖机器宣布机器上的存储池已损坏,硬盘进入只读状态。这块希捷酷狼4T硬盘才用3年半居然就坏了,刚过3年的质保期。从未遇见过机械硬盘损坏的我暗自怀疑厂商是不是在偷工减料,但是网上搜索了一番后,发现nas硬盘容易坏是共识,普通PC里的电脑不是24小时通电的,而nas硬盘一般是24小时不断电。生产环境里的企业级硬盘都要3、5年定期更换的,更别提我这个Nas硬盘了。看了下硬盘通电时间约31000小时,默默给厂商摘掉奸商的帽子。
接下来是备份恢复数据的过程。
1.联系客服。买正版群晖机器的好处就是出了问题可以直接开工单联系客服,虽然可以网上搜索和去论坛上发帖问,但是只有客服的技术工程师才可以快速给出相对准确、负责的解决方案。在10来天的沟通中,群晖的客服从回复速度和处理请求的态度两方面来看都还是很不错的。官方客服也有不好的地方,比如新买的硬盘不是机器兼容列表里的硬盘型号,出现插上硬盘(热插拔)后机器无法识别硬盘的问题,客服就会表示无能为力,没法排查原因。在请教迁移mariadb套件数据的时候客服也以非官方套件为由表示爱莫能助。总之就是客服其实也只是打工人罢了,不会干超出职责的事情。
2.买新硬盘。我的群晖机器是ds220+,明明京东页面上的参数写的是支持热插拔,但是无论是不在兼容列表里的东芝n300新型号硬盘还是在兼容列表里的希捷酷狼硬盘,通过第二个硬盘位不关机直接插入后,机器都无法识别新插入的硬盘。具体表现就是新硬盘插入后机器上相应的硬盘灯会亮,而且是正常的绿色,群晖系统也会在插入后提升检测到新硬盘,但是通过提示消息进入存储管理器又提示没有可用的硬盘。咨询过客服能否关机重启,客服建议是为了数据安全避免重启后旧硬盘的文件系统挂载不上不要重启机器。在多次尝试插入新硬盘的操作依然无法让新硬盘被识别的情况下,我在某次插入取出新硬盘的操作中无意(其实心理上可能就是有意)把群晖机器搞断电了,这下机器不得不重启了。幸运的是机器重启后识别到了新硬盘,而且旧硬盘上的文件系统也正常挂载了,没有出现客服担心的情况。
3.备份与恢复数据。数据分两部分,一部分是照片视频类的文件数据,一部分是机器上装的套件数据。文件数据备份相对简单,在存储管理器里新建存储池,存储池的硬盘选择新买的硬盘,在控制面板里再新建一个共享文件夹,新建的共享文件夹的存储池要选择刚才新建的这个存储池,然后把旧硬盘里的文件数据拷贝到新建的共享文件里就可以了。也就是这个时候我才搞明白群晖控制面板里的这个共享文件夹是一个什么东西,大致就是一个类似软链接的东西,可以通过/var/services目录看到所有的共享文件夹,也可以通过/volumexxx看到与存储池xxx对应的共享文件夹。如果旧硬盘没坏支持读写,还可以直接修改旧存储池里的共享文件的设置,将存储池修改为新存储池就可以实现数据从旧硬盘向新硬盘的迁移。
4.套件数据的迁移。dsm7及以上系统的套件迁移可以尝试使用github上的synology_app_mover这个工具。该工具可以识别出机器上所有已安装的套件以及这些套件分别都是使用的哪个存储池。使用方法也很简单,参照github上的说明文档,下载repo后,以sudo模式运行syno_app_mover.sh脚本后输入数字选择要迁移的套件编号和目标存储池编号即可。但是需要注意的是,这个工具也只是迁移了套件存储位置而已,如果套件里的配置文件里写了绝对路径,还是需要手动去更正的。非常感谢这个工具的作者,让我不用花时间去倒腾通过mariadb恢复我的wordpress数据!
从这件事情中学到的教训,
1.重要的数据不能只存一份,要拷贝多份多处存放,这次实在是太幸运了,差点就把10年的照片丢了,还有写了三四年的比较丢了(虽然东西很少)。后续可以考虑往网盘和PC上的硬盘都同步一份。
2.组RAID0。如果当初组了RAID0,那么我就可以直接通过替换硬盘就恢复数据了,而不用如此这般折腾复制文件和恢复套件数据了。该花的钱还是得花的。
3.玩Nas还挺贵的,按3年坏1张盘的速度来看,3年硬盘消耗成本就1000块了,都可以随便开百度网盘的超级会员了。当然玩Nas多了一份diy的乐趣。
近期评论