分类

安卓应用安卓游戏攻略资讯

首页>资讯教程>应用软件

腾讯qq云盘复数据损坏技术原因

作者:佚名   来源: JZ5U整理   日期:2019/10/24 14:52:10

腾讯qq云盘再发声明,盘复了前沿数控文件系统元数据损坏的技术缘由,腾讯称该毛病缘起于因磁盘静默错误招致的单副本数据错误,再加上数据迁移过程中的两次不标准的操作,招致云盘的三副本平安机制失效,并最终招致数据完好性受损,这种受损也是很费事的,那么要怎样处理这个难题呢?下面小编就来带大家看看把!

腾讯qq云盘复数据损坏技术缘由 倡议开快照功用图一

关于客户“前沿数控”数据完好性受损的技术复盘:

近日,腾讯云客户北京清博数控科技有限公司所属“前沿数控”平台一块操作系统云盘发作毛病,招致该客户的文件系统元数据损坏,我们对客户业务所受影响表示诚挚歉意。同时,我们也对此次毛病过程停止了深化的技术复盘。

腾讯qq云盘复数据损坏技术缘由 倡议开快照功用图二

复盘发现,该毛病缘起于因磁盘静默错误招致的单副本数据错误,再加上数据迁移过程中的两次不标准的操作,招致云盘的三副本平安机制失效,并最终招致客户数据完好性受损。

痛定思痛,腾讯云希望在尽力协助客户处理本次问题的同时,也经过相关机制的优化防止相似状况的再度发作。

毛病过程复盘:

当天上午11:57,我们的运维人员收到仓库Ⅰ空间运用率过高告警,准备发起搬迁扩容;在14:05时,运维人员从仓库Ⅰ选择了一批云盘搬迁至新仓库Ⅱ,为了加速搬迁,手动关闭了迁移过程中的数据校验;在20:27搬迁完成之后,运维人员将客户的云盘访问切至仓库Ⅱ,同时为了释放空间,对仓库Ⅰ中的源数据发起了回收操作;到20:30监控发现仓库Ⅱ局部云盘呈现IO异常。

毛病缘由复盘:

本次事故来源自因磁盘静默错误招致的单副本数据错误,再由于数据迁移过程中的不标准操作,招致异常数据扩散至三副本,进而招致客户数据完好性受损。

数据搬迁过程中的违规操作主要如下两点:

第一是正常数据搬迁流程默许开启数据校验,开启之后能够有效发现并躲避源端数据异常,保证搬迁数据正确性,但是运维人员为了加速完成搬迁任务,违规关闭了数据校验;

第二是正常数据搬迁完成之后,源仓库数据应保存24小时,用于搬迁异常状况下的数据恢复,但是运维人员为了尽快降低仓库运用率,违规对源仓库停止了数据回收。

因这些错误操作的连续影响,招致该客户数据完好性受损,给客户的正常业务运转形成影响,腾讯云对此再次表示最诚恳的歉意。

改良措施:

经过技术复盘,腾讯云技术团队深化到每个环节,经过义务到人与流程闭环的左右开弓,相应作出如下的增强和改良措施:

首先,我们将全面审视一切的数据流程,触及数据平安的流程自动化闭环,进一步提升我们常规运维自动化和流程化,降低人工干预。同时把全流程的数据平安校验作为系统的常开功用,不允许被关闭。

腾讯qq云盘复数据损坏技术缘由 倡议开快照功用图三

其次,针对物理硬盘静默数据错误,在当前用户访问途径数据校验自愈的根底上,我们优化现有巡检机制,经过优先巡检主副本数据块、跳过近期用户访问过的正确数据块等办法,加速发现该类错误,停止数据修复。

进一步倡议:

腾讯qq云盘自2016年3月以来不断在提供免费的快照功用,能够对重要数据停止定期备份。同时出于对客户数据隐私性和平安性的思索,客户能够自在选择开启或者不开启这一免费功用。腾讯云在这里也呼吁客户开启这一功用,进一步提升本身数据的平安性。

文章推荐

应用推荐

网友评论