【金猿投融展】HashData ——致力于降低企业进行大数据分析的门槛,推动数据民主化...

本文主要是介绍【金猿投融展】HashData ——致力于降低企业进行大数据分析的门槛,推动数据民主化...,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!


aa1f0e850886e5359e8b017b7bab995c.png

a02bd4d7c68019c33556383e1429f41c.png

投融资项目·HashData

本项目由HashData投递并参与“数据猿年度金猿策划活动——《2022大数据产业年度创新服务企业》榜单/奖项”评选。

1bdea2b1a8df0b30e55cc44cd54b8c53.png




‍数据智能产业创新服务媒体

——聚焦数智 · 改变商业


HashData成立于 2016 年 2 月,是一家专注于云端数据仓库的初创公司,是数字经济和实体经济融合发展的典型代表。核心团队主要由 Pivotal、Teradata、IBM、Yahoo!、Oracle和华为等公司资深的云计算、分布式数据库和大数据专家组成,目前公司规模约100人。凭借深厚的技术积累以及极具前瞻性的产品理念,HashData自创立之初就获得了包括经纬创投、国科嘉和、金沙江创投、五源资本等知名投资机构的多轮融资,累积融资额数亿元。

重要产品及服务能力

随着信息技术的迅速发展,各行各业正产生和积累爆炸式增长的数据。如何通过分析这些规模和复杂度不断增长的数据、挖掘数据的价值来为公司提供商业决策支持,已经成为了企业是否能成功的关键要素。HashData 依托成熟开源的数据库生态并充分利用云原生架构的强大功能研发了HashData云端数据仓库 —— 一个能够提供近乎无限规模、并发性和性能的分析型数据库。

HashData可以帮助企业整合内部的数据孤岛,轻松共享这些受监管的数据,并执行各种数据分析负载。同时能够跨多个公共云和私有云提供无缝的数据分析体验。作为企业数据分析的核心引擎,为数据仓库、数据湖、数据工程、数据科学、数据应用程序开发和数据共享提供整体的解决方案。

HashData产品设计理念:

1、创新性的云原生架构

HashData云端数据仓库采用了元数据、计算和存储完全分离的架构设计,能够充分发挥云原生架构的优点,能够高效响应高并发复杂查询,同时体系架构能够随业务需求在各个维度上动态伸缩,在提供高性能数据仓库服务的同时实现了资源的最优配置。

b7eff50f51b77f21f2c31afa8829fe1d.png

2、开源开放的云生态

HashData云端数据仓库源自主流开源数据库Postgres和Greenplum,分析接口100%兼容,并且支持流式计算、全文检索、机器学习和科学计算等数据分析功能,能够无缝集成市场上主流ETL及BI工具。同时能够无缝对接主流公有云和私有云平台,为用户提供最大便利。

dee00b0562a53582d1f30979a43daacc.png

a531cd9efb2289a91519cdb09bc6166c.png

3、完善的管理工具

HashData云端数据仓库的设计初衷就是要为用户提供完全托管的数据分析服务,通过功能完善的管理控制台,帮助企业能够轻松部署包含几十个甚至上百个节点的数据仓库集群,加载数据后能够快速开始数据分析任务。而集群资源配置、数据备份、监控审计、 错误恢复、高可用和升级等纷繁复杂、极易出错的运维工作则由产品自身来完成,实现“零运维”。

5d3de6abc169e2b3657dc2f5e686c3f4.png

HashData目前已经有超过50家企业客户,在金融行业, HashData为包括国有大型银行、政策性银行、股份制商业银行和监管部门在内的近10家客户提供服务, 支撑着数百个大数据分析应用。从信用卡、 电子银行到反洗钱、风控、对公信贷、监管报送等。在电信、能源、交通和互联网等领域,HashData为运营商、中石油、大型航空公司和港口、跨国环保集团、大型远程教育机构和互联网医疗企业等数十家头部客户提供数据计算、分析服务,助力合作伙伴数字化转型。  

技术能力说明

HashData始终坚持技术为本,持续投入创新研发,技术团队占比超过70%。

目前HashData拥有自主知识产权20余项,产品通过了ISO9001等国际质量管理体系认证。公司是国家高新技术企业、北京市高新技术企业,产品与所有国产化软硬件环境流畅适配。

公司产品率先实现了元数据、存储和计算资源分离和全云化全弹性扩展。目前支撑了超过2.5万个节点集群的运行,支持千万级的数据库对象,100+PB数据量,数千个并发应用,每天1亿条以上的复杂SQL查询,实现了全球范围内领先的集群规模与数据存储量。

近年营收及未来预期

近3年来HashData营收以每年100-200%的速度增长,预计2022年实现营收数千万元,2023年营收目标增速100%以上,实现过亿元。

企业负责人

·简丽荣 HashData联合创始人兼CEO

简丽荣,联合创始人兼CEO。毕业于清华大学与香港科技大学,Apache HAWQ committer,Greenplum Database contributor,目前是酷克数据联合创始人兼CEO。曾先后在IBM中国研究院,雅虎北京研发中心,和Pivotal中国研发中心从事分布式计算研发工作,发表了多篇国际会议期刊论文(包括SIGMOD和INFOCOM)并获得10多个国际专利,涉及无线网络、云计算、Hadoop和分布式数据库等领域,保持对数据库行业的深刻思考和前瞻实践。

融资情况


2020 年 12 月,A++ 轮,五源资本 - 近亿元。

2019 年 12 月,A+ 轮,金沙江创投 - 数千万元。

2017年 10 月,A 轮,国科嘉和 - 数千万元。

2016年 2 月,天使轮,经纬创投 - 数千万元。

投资人评价


云原生的数据仓库技术应用必将是大数据发展的未来趋势,经纬多年前即看到这个潜在的巨大市场,成为HashData最早的机构投资股东。一直以来,我们非常看好HashData的长期发展主义,公司自创业之日起,始终专注于技术本身与产品打磨。6年的陪伴,我们见证了HashData产品在这个领域的不断成熟、技术的先进发展、服务质量的体系化以及得到诸多行业客户、合作伙伴的认可。期待HashData早日实现伟大愿景!

——经纬创投合伙人 熊飞

相比于美国,国内的云原生数仓市场才刚刚开始。随着企业数字化转型的加速,大量的业务数据从线下迁移到线上,对于数据分析的需求也从离线转为实时,基于云基础设施的弹性计算就变得尤其重要。HashData的分布式系统架构与美国代表性数仓公司Snowflake一样,实现了管理、计算和存储的三者分离,为企业客户提供更优性能、更低成本的数据分析服务。除此之外,它还100%兼容标准SQL语法,方便客户迁移和整合系统。HashData由深耕数据仓库领域十余年的行业顶尖技术专家创办,我们完全相信这个团队会成为一家世界级的云原生数仓厂商。

——金沙江创投管理合伙人 张予彤

客户评价

我们联合HashData打造的产品,采用元数据、计算、存储三层分离的架构,在确保高性能计算能力的同时,还具备高并发性、高扩展性,以及灵活的资源动态调度和故障自愈能力。强大、稳定、高效的数据处理功能,为集团蓬勃发展的数据分析业务提供了灵活高效的核心数据仓库支持。

——某大型国有银行科技子公司产品负责人 陈总

HashData以创新性的元数据、计算和存储三者分离的云原生架构,提供了传统数据库解决方案难以实现的高并发、高可用性和扩展性。成熟稳定的产品加上专业的服务团队,为此次系统平稳、顺利上线提供了有力保障,得到了我们技术团队的一致认可。

——某股份制银行IT副主任 张总

2c9be35c554a2f37be1d85cb48db08fd.jpeg

a622e6eda801061355ae7291dcd64347.jpeg

dfde08186ce75a0731bf83f431ba70c4.png

f107f6c6214a6d438d70397ef52a8d5a.png

《2022中国企业数智化转型升级服务全景图/产业图谱2.0版》

08a634d80f1403c0a3eb6d317f8a19ee.png

《2022中国数据智能产业图谱2.0版》

d686e366c10252ae8e81be8aceabf834.png

‍❷ 创新服务企业榜‍‍‍

❸ 创新服务产品榜

❸ 最具投资价值榜

❺ 创新技术突破榜

9591af98cf96a051f1e1d9b988b19f39.png

条漫:《看过大佬们发的朋友圈之后,我相信:明天会更好!》

联系数据猿

5183bac128e19b5a7e796416684098d5.png

8233f27355bfe6cf17259cca0961045f.png

a192d3c4743c9802c6532af7696935ac.png

b579b89d62a0a5436802dd0dc4df00de.png

这篇关于【金猿投融展】HashData ——致力于降低企业进行大数据分析的门槛,推动数据民主化...的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/840750

相关文章

Linux下利用select实现串口数据读取过程

《Linux下利用select实现串口数据读取过程》文章介绍Linux中使用select、poll或epoll实现串口数据读取,通过I/O多路复用机制在数据到达时触发读取,避免持续轮询,示例代码展示设... 目录示例代码(使用select实现)代码解释总结在 linux 系统里,我们可以借助 select、

C#使用iText获取PDF的trailer数据的代码示例

《C#使用iText获取PDF的trailer数据的代码示例》开发程序debug的时候,看到了PDF有个trailer数据,挺有意思,于是考虑用代码把它读出来,那么就用到我们常用的iText框架了,所... 目录引言iText 核心概念C# 代码示例步骤 1: 确保已安装 iText步骤 2: C# 代码程

Pandas处理缺失数据的方式汇总

《Pandas处理缺失数据的方式汇总》许多教程中的数据与现实世界中的数据有很大不同,现实世界中的数据很少是干净且同质的,本文我们将讨论处理缺失数据的一些常规注意事项,了解Pandas如何表示缺失数据,... 目录缺失数据约定的权衡Pandas 中的缺失数据None 作为哨兵值NaN:缺失的数值数据Panda

C++中处理文本数据char与string的终极对比指南

《C++中处理文本数据char与string的终极对比指南》在C++编程中char和string是两种用于处理字符数据的类型,但它们在使用方式和功能上有显著的不同,:本文主要介绍C++中处理文本数... 目录1. 基本定义与本质2. 内存管理3. 操作与功能4. 性能特点5. 使用场景6. 相互转换核心区别

Python进行word模板内容替换的实现示例

《Python进行word模板内容替换的实现示例》本文介绍了使用Python自动化处理Word模板文档的常用方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友... 目录技术背景与需求场景核心工具库介绍1.获取你的word模板内容2.正常文本内容的替换3.表格内容的

python库pydantic数据验证和设置管理库的用途

《python库pydantic数据验证和设置管理库的用途》pydantic是一个用于数据验证和设置管理的Python库,它主要利用Python类型注解来定义数据模型的结构和验证规则,本文给大家介绍p... 目录主要特点和用途:Field数值验证参数总结pydantic 是一个让你能够 confidentl

Git进行版本控制的实战指南

《Git进行版本控制的实战指南》Git是一种分布式版本控制系统,广泛应用于软件开发中,它可以记录和管理项目的历史修改,并支持多人协作开发,通过Git,开发者可以轻松地跟踪代码变更、合并分支、回退版本等... 目录一、Git核心概念解析二、环境搭建与配置1. 安装Git(Windows示例)2. 基础配置(必

JAVA实现亿级千万级数据顺序导出的示例代码

《JAVA实现亿级千万级数据顺序导出的示例代码》本文主要介绍了JAVA实现亿级千万级数据顺序导出的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 前提:主要考虑控制内存占用空间,避免出现同时导出,导致主程序OOM问题。实现思路:A.启用线程池

SpringBoot分段处理List集合多线程批量插入数据方式

《SpringBoot分段处理List集合多线程批量插入数据方式》文章介绍如何处理大数据量List批量插入数据库的优化方案:通过拆分List并分配独立线程处理,结合Spring线程池与异步方法提升效率... 目录项目场景解决方案1.实体类2.Mapper3.spring容器注入线程池bejsan对象4.创建

PHP轻松处理千万行数据的方法详解

《PHP轻松处理千万行数据的方法详解》说到处理大数据集,PHP通常不是第一个想到的语言,但如果你曾经需要处理数百万行数据而不让服务器崩溃或内存耗尽,你就会知道PHP用对了工具有多强大,下面小编就... 目录问题的本质php 中的数据流处理:为什么必不可少生成器:内存高效的迭代方式流量控制:避免系统过载一次性