浅谈VAST DATA公司

2023-10-12 19:50
文章标签 浅谈 data 公司 vast

本文主要是介绍浅谈VAST DATA公司,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

浅谈VAST DATA公司

    • 1. 概述
    • 2. White Paper
      • 2.1 Why Universal Storage
      • 2.2 Defining Universal Storage
      • 2.3 New Tech Lay A New Storage Fondation
      • 2.4 DASE(DisAggregated Shared Everything)

导师让了解一下VAST DATA这家企业,不知道要干嘛,看了一下它的白皮书,很多东西还是不太了解。不过总体架构还是能够基本理解,这里简单记录一下。

请添加图片描述

1. 概述

  • 理念:全闪存消灭机械硬盘

  • 思路:Universal Storage避免存储分层,采用最便宜的QLC介质(四层存储单元,Quad-Level Cell),利用独特的数据保护和缩减技术,成本可以做到硬盘的水平

  • 架构:控制器采用容器技术部署,全部都是无状态的,可以扩充到1000个节点,后端通过NVMe-oF网状连接闪存框,闪存框里面有少量的SCM做写Cache,后面插大量的QLC盘。这种架构的好处就是容量和性能可以单独扩展,有分布式存储的好处,但是和一般的SDS不同的就是,控制框可以看到所有的SSD盘,这得依赖NVMe-oF。
    请添加图片描述

  • 关键技术:回答以下问题

    • QLC的写寿命那么差,如何支持生产系统?

      寿命方面:系统通过NVMe-oF可以看到所有QLC Flash,做全局磨损均衡。

      保护方面:使用长条带,分组生成额外冗余位减少坏盘重构时间。在SCM里面做快速构建。

    • 还有,QLC的介质虽然可以采用消费级颗粒,但单位成本还是要比硬盘高啊?

      长条带实现高达98%的得盘率

    • 如何在数据缩减上下功夫,使得有效成本低于硬盘?

      传统重删和压缩:传统重删一般是KB粒度,不能基于Byte做重删;传统压缩基于Byte,但不是全局的

      VAST提出的数据缩减方案:全局去重、算指纹,相似指纹做压缩。

2. White Paper

2.1 Why Universal Storage

  • 用户需要把数据拷贝到相应的存储层去,用户不友好;
  • 自动化数据管理框架也不能简化“Where is my data ?”这个问题,频繁地移动数据对资源、性能都是一种损耗;
  • 数据全局化才更好,特别是对于AI训练来说,而不是局限在某个Flash层上;

2.2 Defining Universal Storage

  • 速度快,可以达到传统或现代应用需求
  • 可拓展
  • 成本低
  • 易访问

2.3 New Tech Lay A New Storage Fondation

  • Hyperscal Flash

请添加图片描述

  • Stateless Containers

    无状态容器通过NVMe-oF网络连接到存储设备上,使得① 部署方便② 可靠性更强;

  • Storage Class Memory(SCM,3D-XPoint)

    SCM以其低写入延迟、较长的持久能力,而被作为写缓冲、全局元数据存储的存储介质,优势在于:

    • 写延时优化:在SCM种可以做数据缩减、全局磨损均衡,避免高QLC写入延迟
    • 写寿命优化:SCM具有长期存储能力,避免temp数据对QLC造成不必要的磨损
    • 数据保护性能优化:合并写入,一次性写到QLC中,避免QLC
    • 数据缩减索引优化:作为元数据存储容器,提供全局压缩字典,避免将索引数据拷贝到DRAM中
  • NVMe-over-Fabric(NVMe-oF)

    高速,可实现存算分离

    为什么要实现存算分离?因为存算一体不容易扩展,不灵活,且不容易做到全局数据缩减,以及数据保护(RAID)。

2.4 DASE(DisAggregated Shared Everything)

请添加图片描述
DASE结构是VAST的架构,它依靠NVMe-oF连接实现存算分离,如上图。这是一种全局结构,其各个技术点在前文已基本描述,不再赘述。

这篇关于浅谈VAST DATA公司的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/198064

相关文章

浅谈mysql的not exists走不走索引

《浅谈mysql的notexists走不走索引》在MySQL中,​NOTEXISTS子句是否使用索引取决于子查询中关联字段是否建立了合适的索引,下面就来介绍一下mysql的notexists走不走索... 在mysql中,​NOT EXISTS子句是否使用索引取决于子查询中关联字段是否建立了合适的索引。以下

浅谈Redis Key 命名规范文档

《浅谈RedisKey命名规范文档》本文介绍了Redis键名命名规范,包括命名格式、具体规范、数据类型扩展命名、时间敏感型键名、规范总结以及实际应用示例,感兴趣的可以了解一下... 目录1. 命名格式格式模板:示例:2. 具体规范2.1 小写命名2.2 使用冒号分隔层级2.3 标识符命名3. 数据类型扩展命

浅谈配置MMCV环境,解决报错,版本不匹配问题

《浅谈配置MMCV环境,解决报错,版本不匹配问题》:本文主要介绍浅谈配置MMCV环境,解决报错,版本不匹配问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录配置MMCV环境,解决报错,版本不匹配错误示例正确示例总结配置MMCV环境,解决报错,版本不匹配在col

浅谈mysql的sql_mode可能会限制你的查询

《浅谈mysql的sql_mode可能会限制你的查询》本文主要介绍了浅谈mysql的sql_mode可能会限制你的查询,这个问题主要说明的是,我们写的sql查询语句违背了聚合函数groupby的规则... 目录场景:问题描述原因分析:解决方案:第一种:修改后,只有当前生效,若是mysql服务重启,就会失效;

HTML5 data-*自定义数据属性的示例代码

《HTML5data-*自定义数据属性的示例代码》HTML5的自定义数据属性(data-*)提供了一种标准化的方法在HTML元素上存储额外信息,可以通过JavaScript访问、修改和在CSS中使用... 目录引言基本概念使用自定义数据属性1. 在 html 中定义2. 通过 JavaScript 访问3.

Spring核心思想之浅谈IoC容器与依赖倒置(DI)

《Spring核心思想之浅谈IoC容器与依赖倒置(DI)》文章介绍了Spring的IoC和DI机制,以及MyBatis的动态代理,通过注解和反射,Spring能够自动管理对象的创建和依赖注入,而MyB... 目录一、控制反转 IoC二、依赖倒置 DI1. 详细概念2. Spring 中 DI 的实现原理三、

浅谈主机加固,六种有效的主机加固方法

在数字化时代,数据的价值不言而喻,但随之而来的安全威胁也日益严峻。从勒索病毒到内部泄露,企业的数据安全面临着前所未有的挑战。为了应对这些挑战,一种全新的主机加固解决方案应运而生。 MCK主机加固解决方案,采用先进的安全容器中间件技术,构建起一套内核级的纵深立体防护体系。这一体系突破了传统安全防护的局限,即使在管理员权限被恶意利用的情况下,也能确保服务器的安全稳定运行。 普适主机加固措施:

论文翻译:arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染:一项综述 文章目录 大规模语言模型的基准数据污染:一项综述摘要1 引言 摘要 大规模语言模型(LLMs),如GPT-4、Claude-3和Gemini的快

CentOS下mysql数据库data目录迁移

https://my.oschina.net/u/873762/blog/180388        公司新上线一个资讯网站,独立主机,raid5,lamp架构。由于资讯网是面向小行业,初步估计一两年内访问量压力不大,故,在做服务器系统搭建的时候,只是简单分出一个独立的data区作为数据库和网站程序的专区,其他按照linux的默认分区。apache,mysql,php均使用yum安装(也尝试

创业者该如何设计公司的股权架构

本文来自七八点联合IT橘子和车库咖啡的一系列关于设计公司股权结构的讲座。 主讲人何德文: 在公司发展的不同阶段,创业者都会面临公司股权架构设计问题: 1.合伙人合伙创业第一天,就会面临股权架构设计问题(合伙人股权设计); 2.公司早期要引入天使资金,会面临股权架构设计问题(天使融资); 3.公司有三五十号人,要激励中层管理与重要技术人员和公司长期走下去,会面临股权架构设计问题(员工股权激