https://www.chiphell.com/thread-2524635-1-1.html
基础原则
首先,对数据有一个最基础的认识:
磁盘,总会坏的。
数据,必须有备份。
数据分级
分级的目的,是为了对自己的数据有一个基础的认识,进而选择不同的策略。
首先,根据对数据的读写频次,可大致分为两类:
冷数据。也就是低频读写的数据,这类数据,对磁盘的读写性能要求不高,就家用环境来说,我们大部分的数据资料,比如照片、视频、软件包、旧的工作文档等等,都属于这类。这个是我们关注的重点。这类数据,更关注磁盘容量,就当下环境来说,HDD依然是最适合存储这类数据的。
热数据。需要频繁读写的数据。家用环境下,对数据读操作较多的,应该是系统本身的各类软件,而高频写入的场景,比如下载、监控等。这类数据,几乎每时每刻都在进行写入,适合使用SSD进行存储。同时,这类数据另一个特点是:具有临时性。
接下来,按数据重要程度,对数据进行分类
1级。个人生产的数据。是个人劳动的成果,具备全网唯一性,一旦丢失,无法重现。比如:个人拍摄的照片、视频,工作生产的文档等。这类数据,最好有多种方式进行备份,比如321备份。
2级。稀缺资源。找起来麻烦,或具有较高获取成本,可替代性低。丢失后可恢复,需要花费一定精力。比如一些被禁的书影音、小范围公开的内容。这类数据,可以做简单备份。
3级。非稀缺,公开网络上容易获得。比如:主流网站上的影音资源。这类数据,可以不备份。
备份策略
经常提到的“321备份”,指的是:3份数据、2种介质、1个异地。
具体来说:
3份数据。指的是:“原件、副本1,副本2”。关于原件,就家庭来说,应当指的是多个人、多种设备共同产生的第一份数据。你可以通过各种方式先汇总起来,比如都汇总到NAS里,或者都汇总到iCloud里,然后再考虑之后的副本。当然,也可以不汇总,直接生成副本。这是一个管理问题。暂且不谈。
2种介质。指的是不同的存储方式,比如:NAS、移动硬盘、工作电脑,“云存储”也能算一种,后面会专门谈一下“云”。
1个异地。这个好理解,比如:家、公司、老家。
数据的持久性
我们去折腾数据备份的目的,是提升数据的“持久性durability”。也就是,数据不会丢失。即便发生各种意外,我们也能找回数据。所以,这里再次强调下:
RAID不是备份。
很多人把RAID1当成备份来用,这是一种片面的理解。实际是混淆了数据的“持久性”和“可用性”。RAID1或RAID5、RAID6、RAID10,提升的是“可用性availability”,它能保障在硬盘出现问题时,数据依然可被访问、服务依然能被提供,也就是很多人提到的服务在线率。
举个简单的例子,就很好理解。假设,你的数据目前都放在一台设备上,甭管你这设备上的磁盘做的什么RAID,RAID1也好,RAID6也好,然后有一天:
你家遭贼了,这台设备直接被小偷搬走了。
或者,家里突然发生火灾,你只穿个裤衩逃了出来,等回去时,家里一片焦土。
设备被入侵/中毒了,所有文件全被加密,你需要往指定账户上打入一笔巨款才能解除
这些情况,都是有真实例子的,不是我在杞人忧天。
闭上眼想一下,如果你遭遇这种事儿,你存了二十几年的照片、你工作十几年的文档,还能不能保得住?
这种情况下,唯一能救回自己数据的,只有备份。所以,再次提醒自己,RAID不是备份。
那,有那么多人在搞RAID还有意义吗?当然有意义了。人家搞RAID有人家的需求,你搞RAID得好好想想自己是什么场景,如果你搞了个服务,要给全公司员工用,或者有几百上千用户在用,7*24服务不能断,那RAID就很有意义。如果,你在家里搞了个影视中心,全家就你和老婆孩子在用,服务断了就断了,这种情况搞RAID还真就没啥意义。
你说,你搞RAID是为了管理方便,一个存储池,我可以挂上好多个盘。对,既然你用RAID把多个盘弄成一个盘来用,那这一堆盘,它现在就是一个盘了。既然数据都在一个盘上,那就不能当作有备份。当你搞RAID时,系统告诉你你有“冗余”了,实际上,是你的数据可访问性有冗余了,你的数据提供的服务有冗余了,是有“冗余”了,不是有“备份”了。
啰啰嗦嗦说这么多,借用下这个图,我们折腾备份,是为了提升数据的“持久性”
数据的备份
在有了上面的基础理解后,终于可以开始谈谈关于数据的备份了。
1. 数据梳理
第一步:自然是梳理自己的数据,并制定相应的策略。比如我自己梳理的:
1级数据
数据类型:照片视频、工作文档
数据量:目前不超过1T
介质选择:尽量用正规渠道的新硬盘来存储。比如各家的企业级磁盘,8T以上的。我目前用的HC320
备份策略:321备份
原件:本地NAS上一份。
副本1:本地NAS之外,用硬盘再存一份(我目前用的)。未来计划:公司里再放一台机器,把数据备份到公司一份。
副本2:云端一份
2级数据
数据类型:稀缺书影音资料、软件。
数据量:目前不超过2T
介质选择:尽量用正规渠道的新硬盘来存储。比如各家的企业级磁盘,8T以上的。我目前用的HC320
备份策略:简单备份
原件:本地NAS一份
副本1:本地NAS之外,用硬盘再存一份(我目前用的)。未来计划:公司里再放一台机器,把数据备份到公司一份。
3级数据
数据类型:当下热门音视频、大型游戏/软件等。
数据量:10T以上
介质选择:大容量的便宜磁盘,可接受k盘,不接受清零盘。
备份策略:不备份
定期巡视,如果发现某些资源开始变得稀缺,升级成2级数据。
如果某些资源内容较差,定期清理。
热数据
数据类型:下载、摄像头监控视频、系统软件
数据量:不超过2T
介质选择:SSD
备份策略:不备份
下载的数据,定期转移
监控视频,新数据做简单备份,旧数据定期清理
2. 盘位规划
DS920有4个HDD盘位,2个M2盘位。M2位默认是用作缓存的,通过SSH进入系统设置后,可以重新挂载成基础的存储池来使用。
首先,不使用RAID或SHR模式,所有盘位都使用Basic模式。
然后,根据上面的数据梳理,可以对盘位进行如下规划:
HDD 1,8T,存储1级数据、2级数据
HDD 2,8T,仅用于数据备份,使用Cloudsync把2级数据同步到此硬盘,(也可以顺带把1级数据备份了),此硬盘可随时拔出来。
HDD 3,16T,存储3级数据。暂时够用
HDD 4,空。后续补充硬盘,或升级硬盘用。
M2-1,2T SSD,存储热数据。
M2-2,2T SSD,暂时没存东西,后续考虑搞一个TimeMachine文件夹,备份工作电脑。
云存储
云存储,或者说网盘,一直是一个不错的方案。就当前来说,其实还是在处于一个发展阶段。可选的厂家目前也不少。
网盘这个东西。消费端的早期产品,最早应该是QQ和不少邮箱提供的。我最早接触的第一个真正意义上的网盘,应该是大概2010年时盛大提供的,有15G容量,我把自己的当时资料,大概几个G,都上传上去了。然后,没多久,这个网盘宣布关闭,让1个月内导出自己的资料(记不清了,反正我一个文件也没导出来)。然后,它就没了。再后来,国内出现了网盘大战,涌现出很多网盘产品,狂送容量拉新,后来活下来的没几个,为了活下来,有的搞限速,有的卖容量,还有的偷偷把送出去的容量收回去。
经历过这些乱象,对网盘的态度,需要有一些谨慎。当然,除了消费端的网盘,还有面向企业端的云存储也可以考虑,比如AWS的S3、阿里云的OSS、腾讯云的COS,这些我用的不多,暂不展开。不过,在考虑不同云端存储的特点时,我也会把这些考虑进来。
云存储,或者网盘,可以用,但需要选择可靠的厂商,同时,不能把鸡蛋都放在一个篮子里。可以考虑根据不同云存储的特点,选择不同的策略。以下是我根据自己的经验和理解,进行的整理,仅代表我自己的观点:
iCloud
最大2T,国区¥816/年
可家庭共享,备份照片、整机备份,可微信记录
Google Photos
通过Pixel设备可免费无限制备份原片,照片智能分类
风险点:需要梯子,后续Google政策可能发生变化,或Pixel设备老化导致无法继续使用
Microsoft Onedrive
可以申请开发者账户E5,免费5T容量
风险点:免费90天有效期,不保证一定能续期成功,微软政策不保证一直不变
阿里云盘
免费账户差不多能有1T永久容量
风险点:国内网盘对文件内容敏感,免费账户后续有限速的可能
微云/百度云/115等
免费账户要么容量小要么限速,较低月付可以获得很大容量
风险点:国内网盘对文件内容敏感
云厂商提供的云存储服务
这部分费用比较复杂,有不同的存储类型,以及不同收费项目
以腾讯云的COS为例,100G的数据,其低频存储费用大概是¥64/年,下载下来的流量费用大概¥30+。其他还有一些请求费用、管理费用。
云存储总结
基于以上特点,针对网盘的使用,可以有一些简单的结论(仅代表我自己的情况):
iCloud,可以考虑付费订阅,家人共享,手机数据备份
Google Photos,对自己的照片备份,作为其中一种备份途径
Onedrive,可以考虑用E5作临时的网络备份
阿里云盘,用作Alist挂载,不用作备份
其他国内网盘,不用作备份
云厂商的云存储。1级数据,整理后打包压缩,进行低频存储。(群晖支持不少厂商)