×
高级产品搜索菜单

内置硬盘盒‍存储系统有哪几个要求
日期: 2021.12.02

在实际的大型数据中心部署内置硬盘盒‍故障预测模型,为大规模存储系统引入“故障预测——预警处理”的主动容错机制,可以提高存储系统的可靠性,并保持系统的高可用性,降低系统的成本,应把主动容错机制应用到实际的大规模存储系统中。

内置硬盘盒3.png

1、模型更新和预警处理

为存储系统引入主动容错机制,首先需要保证硬盘故障预测模型的高准确率。为了使模型更加准确地学习当前集群的硬盘的故障特性,进而提高模型的预测准确率,需要对模型进行定时的更新。也就是说,每隔一段时间加入新收集的样本,重新训练故障预测模型。在训练新的模型期间,仍然采用旧的模型来预测故障。对于每一块内置硬盘盒‍,可以每隔一个小时采集它的数据,并且需要在内存中保存当前时刻之前个小时内的数据,求得变化率特征,然后用模型预测硬盘是否即将发生故障。

2、兼容故障预测模型

由于机器每隔一个小时才会采集一次数据并运行一次硬盘故障预测模型,因此可以认为对硬盘所在机器的性能影响不大。对于每条收集的样本,还需要保存起来,把这些新的硬盘样木及它们是否发生故障的信息加入到原来的训练集中重新学习,更新预测模型。一段时间以后,将新收集的正、负样本添加到旧的训练集中,重新训练新的故障预测模型,并用该模型替换旧的模型用于预测硬盘故障。系统经过长时间运行后,模型的训练样本量可能变得太大,导致模型训练过程太慢。

应丢弃内置硬盘盒‍部分旧的训练样本,一来可以提高模型的训练速度,降低训练模型的开销;二来可以提高训练集中新样本的比例,使得模型更专注于学习新的样本的特性,提高新的模型与系统当前故障行为特性的匹配度,提升模型的预测性能。

高级产品搜索菜单
提交 清除 取消
找不到合适的产品?提交您的请求HERE
ICY DOCK使用cookies来确保您在我们的网站上为您提供最佳体验。了解更多
我同意