[NAS] 浅谈家庭数据的备份

发布时间:2023年06月20日 阅读:191 次

https://www.chiphell.com/thread-2524635-1-1.html


基础原则
首先,对数据有一个最基础的认识:


数据分级
分级的目的,是为了对自己的数据有一个基础的认识,进而选择不同的策略。
首先,根据对数据的读写频次,可大致分为两类:


接下来,按数据重要程度,对数据进行分类


备份策略
经常提到的“321备份”,指的是:3份数据、2种介质、1个异地。
具体来说:


数据的持久性
我们去折腾数据备份的目的,是提升数据的“持久性durability”。也就是,数据不会丢失。即便发生各种意外,我们也能找回数据。所以,这里再次强调下:

RAID不是备份

很多人把RAID1当成备份来用,这是一种片面的理解。实际是混淆了数据的“持久性”和“可用性”。RAID1或RAID5、RAID6、RAID10,提升的是“可用性availability”,它能保障在硬盘出现问题时,数据依然可被访问、服务依然能被提供,也就是很多人提到的服务在线率。

举个简单的例子,就很好理解。假设,你的数据目前都放在一台设备上,甭管你这设备上的磁盘做的什么RAID,RAID1也好,RAID6也好,然后有一天:


这些情况,都是有真实例子的,不是我在杞人忧天。

闭上眼想一下,如果你遭遇这种事儿,你存了二十几年的照片、你工作十几年的文档,还能不能保得住?

这种情况下,唯一能救回自己数据的,只有备份。所以,再次提醒自己,RAID不是备份。

那,有那么多人在搞RAID还有意义吗?当然有意义了。人家搞RAID有人家的需求,你搞RAID得好好想想自己是什么场景,如果你搞了个服务,要给全公司员工用,或者有几百上千用户在用,7*24服务不能断,那RAID就很有意义。如果,你在家里搞了个影视中心,全家就你和老婆孩子在用,服务断了就断了,这种情况搞RAID还真就没啥意义。

你说,你搞RAID是为了管理方便,一个存储池,我可以挂上好多个盘。对,既然你用RAID把多个盘弄成一个盘来用,那这一堆盘,它现在就是一个盘了。既然数据都在一个盘上,那就不能当作有备份。当你搞RAID时,系统告诉你你有“冗余”了,实际上,是你的数据可访问性有冗余了,你的数据提供的服务有冗余了,是有“冗余”了,不是有“备份”了。

啰啰嗦嗦说这么多,借用下这个图,我们折腾备份,是为了提升数据的“持久性”


数据的备份
在有了上面的基础理解后,终于可以开始谈谈关于数据的备份了。

1. 数据梳理
第一步:自然是梳理自己的数据,并制定相应的策略。比如我自己梳理的:

1级数据


2级数据


3级数据



热数据


2. 盘位规划

DS920有4个HDD盘位,2个M2盘位。M2位默认是用作缓存的,通过SSH进入系统设置后,可以重新挂载成基础的存储池来使用。

首先,不使用RAID或SHR模式,所有盘位都使用Basic模式。

然后,根据上面的数据梳理,可以对盘位进行如下规划:


云存储

云存储,或者说网盘,一直是一个不错的方案。就当前来说,其实还是在处于一个发展阶段。可选的厂家目前也不少。

网盘这个东西。消费端的早期产品,最早应该是QQ和不少邮箱提供的。我最早接触的第一个真正意义上的网盘,应该是大概2010年时盛大提供的,有15G容量,我把自己的当时资料,大概几个G,都上传上去了。然后,没多久,这个网盘宣布关闭,让1个月内导出自己的资料(记不清了,反正我一个文件也没导出来)。然后,它就没了。再后来,国内出现了网盘大战,涌现出很多网盘产品,狂送容量拉新,后来活下来的没几个,为了活下来,有的搞限速,有的卖容量,还有的偷偷把送出去的容量收回去。

经历过这些乱象,对网盘的态度,需要有一些谨慎。当然,除了消费端的网盘,还有面向企业端的云存储也可以考虑,比如AWS的S3、阿里云的OSS、腾讯云的COS,这些我用的不多,暂不展开。不过,在考虑不同云端存储的特点时,我也会把这些考虑进来。

云存储,或者网盘,可以用,但需要选择可靠的厂商,同时,不能把鸡蛋都放在一个篮子里。可以考虑根据不同云存储的特点,选择不同的策略。以下是我根据自己的经验和理解,进行的整理,仅代表我自己的观点:

iCloud


Google Photos


Microsoft Onedrive


阿里云盘


微云/百度云/115等


云厂商提供的云存储服务


云存储总结
基于以上特点,针对网盘的使用,可以有一些简单的结论(仅代表我自己的情况):


Tag:
相关文章

发表评论: