加入收藏 | 设为首页 | 会员中心 | 我要投稿 辽源站长网 (https://www.0437zz.com/)- 云专线、云连接、智能数据、边缘计算、数据安全!
当前位置: 首页 > 创业 > 模式 > 正文

范承工:谈基于持续性内存的分布式融合数据平台

发布时间:2019-09-23 02:39:14 所属栏目:模式 来源:DOIT
导读:副标题#e# 8月22日-8月23日,2019全球闪存峰会(Flash Memory World)在杭州召开。在8月23日下午举行的全闪存应用论坛上,MemVerge公司CEO、联合创始人范承工应邀出席并发表了《基于持续性内存的分布式融合数据平台》的演讲,就基于持久性内存和非易失性内存
副标题[/!--empirenews.page--]

8月22日-8月23日,2019全球闪存峰会(Flash Memory World)在杭州召开。在8月23日下午举行的全闪存应用论坛上,MemVerge公司CEO、联合创始人范承工应邀出席并发表了《基于持续性内存的分布式融合数据平台》的演讲,就基于持久性内存和非易失性内存开发新的系统等相关内容进行介绍。

以下内容根据速记整理, 未经本人审定。

范承工:谢谢谢长生老师。听谢老师的报告,学习到了很多,又让我回忆到研究生时候的生活。华中科技大学存储方面的研究特别强,我们公司也有谢老师、吴非老师的学生在参与新的工作。今天把我们公司做的事,我们在基于持久性内存或者非易失性内存开发新的系统跟大家分享一下。

什么是非易失性内存呢?待会儿会做一个详细的介绍。

我们都知道,在数据时代,数据的量和数据的速度越来越高,这对于我们做基础架构、基础系统的公司来说,要帮助客户解决的主要是两个痛点、两个非常根本的痛点,一个是作为存储来说I/O速度太慢,因为这个量可以靠堆积器来解决,100台机器不够堆1000台机器,1000台机器不够堆1万台机器。但是从速度来说,无论是IOPS每秒钟IO的数量,还是latency,完成读、写需要多少毫秒、微妙,甚至纳秒,在过去几年中很难进行提升,因为受到物理介质的影响。

因此,越来越多的软件用越来越多的内存来完成存储工作,无论是大数据分析的软件,或者是机器学习AI的软件,都是越来越以DRAM为核心的软件系统。

在这个时候就给DRAM加了很大的压力,但它也有它的特色,它的速度非常快,速度比起闪存大约要快1000倍,但是密度要低很多,所以量要小很多,价格要贵不少,同时是一个易失性的。所谓易失性就是你断了电数据就不存在了,这时候无法用它做长久保存的工作。

对于普通的用户来说是介于两块石头中间,一块是存储不够快,另外一个是内存不够大,怎么办呢?大家一直在寻找解决方案,能不能给客户带来更大的内存或者更快的存储,或者把两者同时提供给客户。

这个问题一直在困惑着大家。

一个非常重要的转折点——存储级内存(SCM)在今年正式商用化诞生了,这个概念大家说了很久,过去20年在不同的大学不同的研究机构进行研发,但是真的要大规模商用真的非常困难。

今年的第二季度英特尔作为第一家厂商把第一个商用的、作为普通服务器就可以插的、而且是非易失性的持久性内存问世了,这个内存的名字叫做傲腾持久性内存,其实是两年前就发布了介于同样介质的SSD的产品,今年刚刚推出内存型的产品。

基于的技术是3DXpoint,这个技术是SCM的一种,与其竞争的可能还有其他的技术,但这个技术是率先能够问世。它的特点是速度接近于DRAM的速度,DRAM的延迟是20-50纳秒。平时的NVF SSD基本上在快的Flash也是在10到几十微妙的级别,所以两者之间差了1000倍。这种技术大约是100-250纳秒的延迟,它比DRAM慢一些,大约慢五倍左右,但是比NVflash快100倍,作为持久性的存储第一次进入了纳秒的时代。

同时,它的密度比DRAM要高,目前密度比DRAM高十倍,因为现在3D只有两层,随着层数的上升它的密度会比DRAM高出更多。因为密度高,所以价格会比DRAM低,但第一代出来的价格还是相对比较贵的,大约是DRAM一半左右。随着密度的上升,相信它和DRAM价格之间的差异也会越来越大,它最主要的差别是持久性的和非易失性的。速度接近于DRAM,但数据写进去关机再重开机,数据还会在那儿,而且写的次数要高不少,能够有10的6次方到10的8次方的重写。

这是非常有特色的介质,它第一次融合了内存和存储,这两个不同概念的特征在一个物理介质上得到了体现。对于计算机专业写应用程序的人来说,过去内存当内存用,存储当存储用,现在第一次提供了一个可能性,这两个不同的概念有可能融合成一个。这是一个非常革命性的、跨时代的技术。

任何一个新的技术被大众所采用有不少的障碍,这个技术现在大家预估到2023年会成为36亿美元的硬件市场,我们也知道,除了英特尔之外还有一些其他的内存厂商也在研发这个技术,预计在2022年会有4-5家主流的内存厂商会有竞争的技术问世。相信在那时候开始逐渐成为一个主流市场。

随着应用的采用,预估是2025年大约能产生百亿美元的市场。

百亿美元是什么概念呢?现在的内存市场大约是1000亿美元,我们预计在2025年大约至少能够占领现有内存市场的10%,或者说10%的应用能够把这个内存当新内存而取代,这样子就能产生百亿。

我觉得这还是非常保守的预估,上升空间还有可能远远不止于此。

达到这个目标最主要的关键因素是软件如何把这个硬件使用起来,怎么样建立一个很好的软件生态,能够把透明的,甚至对现有的无需改动,就可以把新的介质特点使用出来,这个工作也是我们公司现在专注做的工作。

MemVerge大约两年多前开始的,现在还很小,大概就30来号人,在美国的湾区是我们的总部,但是在上海、北京也有一个非常核心的研发团队。

我们的技术其实主要是有三个组成部分:

第一个SCM的内存虚拟化。如果你是傲腾SCM的硬件,如果没有我们的软件,有几种使用它的方法。第一种是叫做AppDirect直接使用它的方法,有一个新的API。

这个新的API把硬件所有好的功能都向软件展示,它又可以做字节程度的访问,同时又可以把它所有的优点用出来。

但这个缺点是必须要修改已有的APP,如果写一个新的软件没问题,但如果已经有一个软件无法直接在上面跑出来,需要把软件的逻辑重新写。过去是内存当内存用,存储当存储用,现在比如你要写一个数据库,可以直接放在这种内存里面,不需要存到存储,因为这个内存是可以持久保存的。但这样需要重新设计数据库。

当然,我觉得这也是一个很大的机会,但是现有的数据库不是很容易把这个介质使用上去。

第二个用它来做内存,这时候就是一个易失性的内存,好处是不需要改APP,内存同时变大了,一台服务器现在可以6个T的内存。

第三个变成快存储,就像SSD一样,这个时候让它做比较快的SSD,但是不能做字节性的访问,不能直接当内存来用。

这三种模式都有各自的缺陷,或者要改程序,或者不能够内存和存储的功能都用上。我们内存虚拟化就解决这个问题,因为我们这层软件对傲腾内存用AppDirect的模式来访问,我们展示的API还兼容过去的API,这样不需要修改直接在软件上跑起来。

第二个技术和第三个技术等于在内存虚拟化的基础之上,在这两个API之后做了分布式的基于SCM的分布式的文件系统和内存系统,先说文件系统。

(编辑:辽源站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读