Hadoop是大数据应用落地难的罪魁祸首?

2024-04-25 13:18

本文主要是介绍Hadoop是大数据应用落地难的罪魁祸首?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

为什么大数据应用落地难?很大一部分原因在于Hadoop,用户对于开源总有兴趣亲自尝试一下。但无论Map Reduce,还是YARN都不是那么简单易用,数据建模就像一座山,横亘在用户的前面,让应用不容易落地。

大数据落地难,业内对此广有共识。“我们在全球有7900家用户,在亚太有1000家以上的用户,在中国有150家用户,这些用户的应用都是落地的。” Splunk 中国区销售总监侯海龙说。

为什么大数据应用落地难?

很大一部分原因在于Hadoop,用户对于开源总有兴趣亲自尝试一下。但无论Map/Reduce,还是YARN都不是那么简单易用,数据建模就像一座山,横亘在用户的前面,让应用不容易落地。对于互联网企业,由于人才上的优势,尚有能力克服困难,但对于行业/企业等商用用户来说,技术上的瓶颈不是那么容易跨越的。

Splunk北亚区经理麦永光指出,很多行业/企业用户对于大数据非常重视,他们会首先成立一个大数据的部门,研究大数据应用。他表示,在这种情况下,应用常常难以落地。Splunk大数据的角度有所不同,不是从大数据入手,而是从用户面临的问题着手,用Splunk大数据的方式解决问题。

“国内对大数据的认识,还是停留在数据大的初级阶段。” 侯海龙说。

根据介绍,大数据应用和数据从哪里来、数据大小、格式等没有太多的关心。大数据的重点应该集中在给需要数据的人,提供重要的可见度,快速找到答案。在过去的30年,人们一直使用关系型数据库,采用SQL进行检索和查找;但随着大数据应用的模式,新的分布式数据库的数据组织模式替代了关系型数据库,搜索引擎技术取代了SQL,从而让数据分析和使用的能力有了非常大的进步。

 

数据分析走出关系型数据库阶段

通过对机器大数据地分析,人们可以迅速定位故障,从而减少MTTR(Mean Time To Restoration, 平均恢复前时间)时间;提高系统的在线时间和能力;整合工具;通过数据分析驱动创新,同时也可以使用数据服务商业用户。通过机器大数据分析,可以增强用户对于业务的实时洞察力,从而让系统管理从被动走向主动应对。

 

大数据应用给我们带来了什么

据了解,Splunk提供了专业的数据存储和处理方式,通过检索手段,用户就可以对数据之间的关联性进行挖掘和探索。用户不需要建模,也不需要关心Map/Reduce,检索让用户直接上手,查找数据,发觉数据背后所蕴藏的价值。

 

 

大数据分析让维护从被动到主动

大数据其实很简单,关键是要找到好的工具,运用工具挖掘数据的价值;价值在于数据,而不是工具本身。侯海龙表示,国内大数据应用急需走出初级应用阶段,需要走出对技术关注,将注意力集中在数据上,让数据产生价值。

 

 

看不懂的机器大数据潜藏价值

强力推荐阅读文章

大数据工程师必须了解的七大概念

云计算和大数据未来五大趋势

如何快速建立自己的大数据知识体系

 

这篇关于Hadoop是大数据应用落地难的罪魁祸首?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/934785

相关文章

使用Python开发一个Ditto剪贴板数据导出工具

《使用Python开发一个Ditto剪贴板数据导出工具》在日常工作中,我们经常需要处理大量的剪贴板数据,下面将介绍如何使用Python的wxPython库开发一个图形化工具,实现从Ditto数据库中读... 目录前言运行结果项目需求分析技术选型核心功能实现1. Ditto数据库结构分析2. 数据库自动定位3

pandas数据的合并concat()和merge()方式

《pandas数据的合并concat()和merge()方式》Pandas中concat沿轴合并数据框(行或列),merge基于键连接(内/外/左/右),concat用于纵向或横向拼接,merge用于... 目录concat() 轴向连接合并(1) join='outer',axis=0(2)join='o

批量导入txt数据到的redis过程

《批量导入txt数据到的redis过程》用户通过将Redis命令逐行写入txt文件,利用管道模式运行客户端,成功执行批量删除以Product*匹配的Key操作,提高了数据清理效率... 目录批量导入txt数据到Redisjs把redis命令按一条 一行写到txt中管道命令运行redis客户端成功了批量删除k

分布式锁在Spring Boot应用中的实现过程

《分布式锁在SpringBoot应用中的实现过程》文章介绍在SpringBoot中通过自定义Lock注解、LockAspect切面和RedisLockUtils工具类实现分布式锁,确保多实例并发操作... 目录Lock注解LockASPect切面RedisLockUtils工具类总结在现代微服务架构中,分布

SpringBoot多环境配置数据读取方式

《SpringBoot多环境配置数据读取方式》SpringBoot通过环境隔离机制,支持properties/yaml/yml多格式配置,结合@Value、Environment和@Configura... 目录一、多环境配置的核心思路二、3种配置文件格式详解2.1 properties格式(传统格式)1.

Python标准库之数据压缩和存档的应用详解

《Python标准库之数据压缩和存档的应用详解》在数据处理与存储领域,压缩和存档是提升效率的关键技术,Python标准库提供了一套完整的工具链,下面小编就来和大家简单介绍一下吧... 目录一、核心模块架构与设计哲学二、关键模块深度解析1.tarfile:专业级归档工具2.zipfile:跨平台归档首选3.

使用IDEA部署Docker应用指南分享

《使用IDEA部署Docker应用指南分享》本文介绍了使用IDEA部署Docker应用的四步流程:创建Dockerfile、配置IDEADocker连接、设置运行调试环境、构建运行镜像,并强调需准备本... 目录一、创建 dockerfile 配置文件二、配置 IDEA 的 Docker 连接三、配置 Do

解决pandas无法读取csv文件数据的问题

《解决pandas无法读取csv文件数据的问题》本文讲述作者用Pandas读取CSV文件时因参数设置不当导致数据错位,通过调整delimiter和on_bad_lines参数最终解决问题,并强调正确参... 目录一、前言二、问题复现1. 问题2. 通过 on_bad_lines=‘warn’ 跳过异常数据3

深入浅出SpringBoot WebSocket构建实时应用全面指南

《深入浅出SpringBootWebSocket构建实时应用全面指南》WebSocket是一种在单个TCP连接上进行全双工通信的协议,这篇文章主要为大家详细介绍了SpringBoot如何集成WebS... 目录前言为什么需要 WebSocketWebSocket 是什么Spring Boot 如何简化 We

Java Stream流之GroupBy的用法及应用场景

《JavaStream流之GroupBy的用法及应用场景》本教程将详细介绍如何在Java中使用Stream流的groupby方法,包括基本用法和一些常见的实际应用场景,感兴趣的朋友一起看看吧... 目录Java Stream流之GroupBy的用法1. 前言2. 基础概念什么是 GroupBy?Stream