aliyun 服务器本地磁盘损坏导致数据丢失问题
2019 年初采购的一台带 GPU 的 aliyun 服务器,年费用 3-4 万,当时可能是为了高 io 的性能,数据盘选择了本地磁盘,没选择云磁盘,为这次事故埋下了巨大隐患
昨天 22:11 收到 aliyun 短信报警,磁盘故障,ssh 已无法连接,部分应用还在跑,部分无响应,控制台重启后自动停止,损坏的磁盘挂载目录是 /home,数据众多,出于对大厂的信任,没有太多备份
与工单客服交涉,本地磁盘无备份,损坏了数据丢失无法找回,且在用户协议里写了本地磁盘损坏导致的损失不赔偿
教训:数据无价,定时多重异地备份,不能嫌麻烦,即便是大厂服务器
请教:现在该咋办,工单客服重复表示数据丢失无法找回,请重置示例,是否可以要求提供磁盘自行取出数据?客服确认那是一块单独的物理磁盘,磁盘损坏了
磁盘 损坏 aliyun 备份25 条回复 • 2021-07-05 13:04:27 +08:00
xmumiffy 1
xmumiffy 1 天前 via Android
快照也没开?那就没救了啊
echo1937 2
echo1937 1 天前 via iPhone
如果没记错的话,虚拟机实例的本地磁盘,一旦重启数据就丢失的,这是多心大才会在本地盘上放数据啊?
出于对大厂的信任就更没道理了,云服务商的磁盘也是地球科技,也会坏掉啊。
cucldk 3
cucldk 1 天前
@xmumiffy 本地磁盘不支持快照
cucldk 4
cucldk 1 天前
@echo1937 重启没事,当年买的时候没有重点关注本地磁盘和云磁盘的区别,后来慢慢忘了这茬了
eason1874 5
eason1874 1 天前
本地盘就是物理机,不算云,单点故障是迟早的事,指南都会提示不要单盘存储长期数据,这点是你们大意了,没办法了。
找阿里云看他们能不能帮忙从物理盘恢复数据吧。如果他们不提供这项服务,或者商量能不能直接把硬盘寄给你,你自己找人搞
yitingbai 6
yitingbai 1 天前 ❤️ 15
我要杠一下, 我认为没有备份的数据不算重要数据
CEBBCAT 7
CEBBCAT 1 天前 via Android
@yitingbai 杠到马肚脐眼上了,更常见的是楼主这样的数据备份意识不高的普通用户
love 8
love 1 天前
本地盘 RAID 都没有的吗?
yuguorui96 9
yuguorui96 1 天前
2l 说的没毛病
fredcc 10
fredcc 1 天前 ❤️ 1
就 1 楼和 4 楼回复的使用习惯,不看官方文档的用法。可能不久以后会再来发一帖又丢数据了
lhx2008 11
lhx2008 1 天前
云硬盘都是三副本,基本没啥问题,本地盘一般都做了 RAID,也还行,本地单盘还是挺危险的
opengps 12
opengps 1 天前
这似乎是没办法的结果,本地盘如果要追求*限性能,就不适合多副本。
虽然会有 raid 方案,但是其配置追求*限性能往往采用 raid0 这种顶级的高效率优先方案。
楼主尝试下一个方案:跟阿里云索要这块物理磁盘,看看能否得到支持,如果能拿到物理磁盘,说不定某些高级修复技术可以实现大部分数据的恢复
wtks1 13
wtks1 1 天前 via Android
还是要靠备份,云硬盘也不靠谱啊,我记得上次哪家公司不就被坑了
Showfom 14
Showfom 1 天前
巨大隐患?自己不备份怪谁呢,不备份的数据一律都默认是不重要的数据
villivateur 15
villivateur 1 天前 via Android ❤️ 1
云服务我觉得知道得有一个 raid1 吧?阿里云没有?
villivateur 16
villivateur 1 天前 via Android
@villivateur 至少得有
leafre 17
leafre 1 天前
警告
使用本地盘存储数据有丢失数据的风险,例如 ECS 实例所在物理机发生硬件故障时。请勿在本地盘上存储需要长期保存的业务数据。
建议您在应用层做数据冗余,保证数据的可用性。您可以使用部署集将业务涉及到的几台 ECS 实例分散部署在不同的物理服务器上,保证业务的高可用性和底层容灾能力。具体操作,请参见创建部署集。
如果您的应用无数据可靠性架构设计,强烈建议您在 ECS 实例中同时使用云盘或者备份服务,提高数据可靠性。更多信息,请参见云盘概述或什么是混合云备份。
cucldk 18
cucldk 1 天前
@villivateur 客服答复没有
cucldk 19
cucldk 1 天前
@opengps 嗯,正在工单索要,客服在跟后台申请,等答复,不知道会不会给
salmon5 20
salmon5 1 天前
这个真心不怪阿里云,用户协议已经说的很清楚了;
想保险省事用云盘,3 副本;
想便宜+保险本地盘+主从或者副本集;
想便宜就本地盘裸奔;
RAID 就是个不伦不类的东西;
salmon5 21
salmon5 1 天前
RAID 需要依托硬件结合,这个和云的理念是背道而驰的。
云上很简单:云盘 3 副本;本地盘用户自己做冗余;就这么简单。
salmon5 22
salmon5 23 小时 2 分钟前
我再强调下,免得楼主的标题误导别人:是云使用不当,导致数据丢失;并不是云的问题;
lesismal 23
lesismal 22 小时 33 分钟前
即使使用云盘,重要数据也应当自己备份。
并不是云的问题+1
YaakovZiv 24
YaakovZiv 18 小时 38 分钟前
如果是我,我就不取数据了。
1 、硬盘申请来回邮寄需要花钱和走阿里内部的申请流程。坏盘是否可以留在客户手里。
2 、数据恢复是找专业公司还是自己尝试,这里有费用,时间,也有二次损坏的风险。
3 、不知道数据有多大容量。如果超过 1T,早些部署新的业务开始跑服务。减少业务暂停带来的损失。
现在是两部分损失。即将产生的业务需求无法响应的损失。已经发生的硬盘损坏的损失。我会考虑先减小其中一个损失,避免俩损失加一起,被公司内有心人直接把我干走了。
guo4224 25
guo4224 50 分钟前
连阿里的硬盘都想要,你是有法院判决还是啥…