新闻与活动

鸿翼最新动态,最热活动

立即咨询
感知数据温度,聚焦海量冷数据存储难题
发布时间:2023-02-21     点击数:2660

在信息科技高速发展的背景之下,海量数据已经让拥有者和管理者应接不暇,根据IDC发布的《数据时代2025》预测,全球数据圈(数据圈代表每年被创建、采集或是复制的数据集合)将从2018 年的32ZB增至2025年的175ZB。2018年,中国数据圈为7.6ZB,占全球的23.4%,预计2025年中国数据圈将增至48.6ZB,占全球27.8%,成为全球最大的数据圈。

image.png

海量数据是有“温度”的,按照被访问频率从高到低进行分类,可以将数据为热数据、温数据、冷数据。经常被访问的称为热数据,较少被访问的数据称为冷数据,处于中间状态的称为温数据。


热数据

热数据需要被计算节点频繁访问的在线类数据。

热数据因为访问频次需求大,效率要求高,所以就近计算和部署,数据缓存、在线存储、近线备份,以实现数据快速访问及高速处理。


温数据

温数据是非即时的状态和行为数据。如果整体数据量不大,也可以不区分温数据和热数据。


冷数据

一般很少变化的、长时间固定的数据或者属性,如:

· 过时的项目

· 日常记录和维护的数据

· 有关法律政策的数据

· 其他需要记录的数据


随着数据量的飞速增长,数据由“热”变“冷”现象也日益凸显,按照“二八定律”,经过一段时间的使用,80%以上的数据都会变成冷数据。从存储形式来说,热数据采取在线存储,温数据采取近线存储,而安全性高、保存时间长、维护成本低、不可篡改的离线存储最适合海量冷数据。

image.png


冷热数据的分层是根据访问的频次来划分的,而不是数据的价值。一方面,冷数据的价值并不一定比热数据低,而且还会随着时间的推移变得更为重要,因此对于海量冷数据也需要确保其长期安全存储;另一方面,不经常访问的冷数据运用了“冷数据热存储”的方式显然不符合“双碳”要求,严重浪费存储资源,需要及时转移到离线存储中。


国家发改委发布的发改高技〔2021〕1742号《贯彻落实碳达峰碳中和目标要求推动数据中心和5G等新型基础设施绿色高质量发展实施方案》指出,有序推动以数据中心、5G为代表的新型基础设施绿色高质量发展,助力实现碳达峰碳中和目标。立足新发展阶段,贯彻新发展理念,构建新发展格局,统筹处理好发展和减排、整体和局部、短期和中长期的关系,加强数据、算力和能源之间的协同联动,加快技术创新和模式创新, 坚定不移走绿色低碳发展之路。


※ 强化统筹布局,优化数据中心建设布局;

※ 提高算力能效,加快建设绿色数据中心;

※ 创新节能技术,高效节能技术攻关降低基站设备能耗;

※ 优化节能模式,加强自动化、智能化能耗管理,降低节能能耗;

※ 利用绿色能源,提升可再生能源在数据中心能源供应中的比重;

※ 促进转型升级,促进传统行业数字化转型。


那么,如何在双碳经济的要求下做好冷数据的长期安全存储工作?按照数据的热、冷分层,相对应的可以采用在线、近线、离线分级存储方式,并配备合适的存储载体,才是符合绿色低碳发展之路的正确做法。


数字罗塞塔计划立足冷数据存储领域,聚焦数字资源长期保存,研发合适的数字资源长期保存载体(数字胶片、蓝光存储、玻璃存储等)用于国家战略性数字资源的长期保存,同时研发配套的写入、存储、读取设备实现技术成果转化进而实现工程化、产业化。


数字胶片和蓝光存储是数字罗塞塔计划目前正处于研发阶段的存储载体,数字胶片可以用于珍贵重要数字资源的长期保存和异质备份,蓝光存储用于海量冷数据的近线或离线存储;玻璃存储是数字时代的罗塞塔石碑,数字罗塞塔计划跟踪的前沿存储技术,未来有望真正解决重要冷数据的永久保存问题。

image.png

数字罗塞塔计划是由杨安荣博士联合国内知名投资机构发起的一项利用蓝光存储、数字胶片、玻璃存储等技术,旨在解决电子档案乃至数字信息长期保存的国产化替代科技攻关工程项目,以实现“保存社会记忆,传承人类文明”的最终目标。


立即领取免费试用名额,开启内容管理新体验

立即咨询申请试用
在线咨询 400电话 微信咨询 售后服务
400-886-1516

微信二维码

021-64182907