浪潮信息李博乐:释放闪存力量在数据密集型时代遨游
admin
2022-07-28 17:50:25
0

  背景:大海里,鱼类可以毫不费力地做到兼具速度与优雅于一身,最快游速达每小时 70 英里,而人类甚至难以达到每小时 4 英里,即便潜艇也只能达到每小时 50 英里。鱼类为何能获得如此快的速度,这个问题令物理学家、生物学家和工程师们着迷;如今面对“数据密集型”新范式,为了帮助企业在数据海洋里游出加速度,各家存储厂商也纷纷放出大招。

  正文:

  7月28日,2022全球闪存峰会线上召开,汇聚了国内外专家学者,共同论道全球闪存与存储半导体产业发展趋势。浪潮信息存储产品线副总经理李博乐表示,随着云、大数据、AI等新技术快速发展,数据成为数字经济时代的关键要素和核心引擎。浪潮存储的使命是秉承浪潮信息智慧计算战略,为企业构建以存储平台为核心的业界领先的数据基础设施,基于盘控协同充分释放闪存力量。

  数据密集型新范式考验数据处理能力

  模拟脑神经网络,探索人脑上千亿个神经元之间是如何连接与工作的,带来每秒百TB级数据高吞吐量;1000辆自动驾驶汽车每天产生数十PB的实时数据,用来训练AI视觉识别算法;油气勘探,一次三维勘探会产生PB级原始实时数据,后期数据分析和处理中还会生成15倍体量的次生数据……

  数字经济时代,在“数据密集型”的新范式驱动下,传统数据中心正在向云化数据中心快速演进。这是因为在传统数据中心中,应用与基础设施紧耦合,IT架构呈现孤岛状,数据不流动、不共享,如同一潭死水。而在云化数据中心中,计算资源实现了虚拟化,信息孤岛被打通,涓涓数据河流汇聚成汪洋大海,各个行业可以基于海量数据间的相关性分析加速业务创新,创造新商业、新业态。

  例如,在当前非常热门的类脑科学研究,有一个重要的方向就是多模态多尺度数据分析理论与应用。首先建立脑成像中心,全套磁共振成像设备对小动物或者人体进行脑成像,不断采集和分析脑科学数据,构建起多模态多尺度脑数据库;然后,再利用模式识别、深度学习等类脑智能方法寻找基因、脑影像和认知功能的诊断指标,以揭示脑疾病致病机制、提升脑疾病临床诊断以及药物疗效评估的准确性和效率。这个例子只是冰山一角,“数据密集型”新范式已经成为驱动各行各业创新型发展、高质量增长的加速器。

  然而,正如硬币的AB面,数据密集型新范式、数据中心云化在为大数据挖掘带来利好的同时,也使得数据基础设施需要面对海量的客户端、应用,爆炸式增长的海量多模态数据,对数据基础设施的处理能力提出了更高要求。

  以盘控协同为核心释放闪存潜能

  面对海量新数据、新应用挑战,浪潮存储如何释放闪存的性能呢?对此,李博乐表示,浪潮提出新存储之道,坚持存储即平台理念,以盘控协同策略为核心,充分发挥闪存性能,打造极致性价比。

  首先,存储系统要想发挥出闪存的性能,需要闯过三道关。

  第一,随着NAND介质、NVMe协议、SCM等新介质的出现,存储系统性能的瓶颈已经不在盘上,而在于软件栈,要想用好性能较高的闪存盘,就需要优化存储系统软件栈,解决系统性能瓶颈。第二,过去的若干年CPU的发展一直遵循摩尔定律,性能飞跃式发展,但最近几年,CPU性能的发展进入瓶颈期,性能提升缓慢,如果想进一步提升存储系统性能,就需要借助DPU、FPGA、数据压缩卡等额外的硬件做协处理,对系统进行加速。第三,数据存储需要优化元数据和数据的写入策略,减少不必要的垃圾回收,提升系统性能。

  其次,存储系统如何降低闪存的使用成本。虽然闪存的成本在趋势上不断下降,会替代2.5寸机械盘,但成本仍高于3.5寸大容量机械盘。另外,不同闪存介质,对应的可擦写次数或者说使用寿命是不同的,而且差异很大,比如当前主流的TLC和QLC介质可擦写次数就相差5倍。所以根据数据热度的不同,合理使用介质,以及提升介质寿命和空间利用率,可以有效降低使用成本。

  对于上面两个难题,李博乐认为,盘控协同是最优解。

  比如在提升性能方面,浪潮存储是业界唯一具备存储软件栈和闪存盘全栈的技术研发能力的厂商,可以通过盘控协同,推进闪存盘面向特定场景的定向调优,存储系统性能;还能基于元数据与数据的写入优化,降低写放大,让系统性能再上一个台阶。在SPC-1国际基准测试中,浪潮存储六次刷新存储性能世界记录。

  李博乐表示,今年IPF上,浪潮存储还出新一代PCIe 4.0 NVMe 企业级SSD.我们通过拓展NAND与控制器之间的通道,大幅提升SSD性能,实现业界领先的性能水平,其中顺序写性能超过5GB/s,随机写性能超过45万IOPS,超越所有主流厂商。

  又如围绕降低闪存使用成本这个难题,浪潮存储采用介质分层技术,将不同热度的数据存在不同的介质中,避免介质性能瓶颈和介质“大材小用”,此外,像浪潮这样拥有介质研发能力的厂商,通过不断优化数据管理算法和容错算法,能够提升SSD盘本体寿命,降低客户TCO;并且通过盘控协同,通过合理的数据组织减少写放大缩减闪存盘的OP,提升SSD的空间利用率。

  李博乐表示,目前,浪潮信息聚焦智慧计算战略,以算力、算法、数据、网络四大支柱,为客户构建开放、敏捷、集约、高效的数字信息基础设施。浪潮存储近几年表现非常亮眼,市场增速中国第一,存储装机容量已经位居全球前三、中国前一。今后,浪潮存储希望借助新一代G6存储平台、企业级SSD,以全栈技术创新加速存储业务增长,释放数据价值加速数实相融。

(文章来源:中国能源网)

相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...