01_Apache Flink是什么,Apache Flink的优势,Apache Flink用户,Flink介绍(流场景使用案例、正确性保证、API分层体系、Operational Focus等)

本文主要是介绍01_Apache Flink是什么,Apache Flink的优势,Apache Flink用户,Flink介绍(流场景使用案例、正确性保证、API分层体系、Operational Focus等),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1.1. Apache Flink是什么?
1.1.1. Apache Flink的优势
1.1.2. Apache Flink用户
1.1.3. Flink介绍
1.1.3.1.流场景使用案例
1.1.3.2.正确性保证
1.1.3.3. API分层体系
1.1.3.4. Operational Focus
1.1.3.5. 适用于各种应用场景Scales to any use case
1.1.3.6.高性能

1.1.Apache Flink是什么?

作为没有接触过Flink的人,当听到外界说的Flink的时候,就想知道它能做什么,作为笔者,同样有这样的疑问,为了消除疑问,我也迫不及待的在下班后开始了看官网的学习历程。

Apache Flink官网:https://flink.apache.org/

Apache Flinke是一个”统一的大数据分析和机器学习引擎”、”统一的大数据分析和流计算引擎”、”统一的大数据分析和批计算引擎”

Flink说自己是”下一代大数据处理引擎”,看来海口夸的很大啊,称自己是”下一代”。作为Apache Flink小白的我是不明觉厉啊。好吧,我到底要看看它是多么牛逼。以下是Apache Flink的一段介绍:
“Apache Flink是一个分布式大数据处理引擎,可对有限数据流和无线数据流进行状态计算。可部署在各种集群环境,对各种大小的数据规模进行快速计算”。

盗用它的一张图,来瞅瞅它:
在这里插入图片描述

1.1.1.Apache Flink的优势

Apache Flink 为用户提供了更强大的计算能力和更易用的编程接口。优势项有:

批流统一:Runtime 和 SQL层批流统一,提供高吞吐延迟计算能力和更强大的SQL支持。
生态兼容:与Hadoop Yarn / Apache Mesos / Kubernetes集成,并且支持单机模式运行。
性能卓越:性能卓越的批处理与流处理支持。
规模计算:作业可被分解成上千个任务,分布在集群中并发执行。

1.1.2.Apache Flink用户

Apache Flink的用户有:阿里巴巴,腾讯,华为,网易,滴滴,饿了么,携程,360,顺丰科技,爱奇艺,美团,唯品会,ebay,ERICSSON.

1.1.3.Flink介绍

1.1.3.1.流场景使用案例

数据驱动的应用
批流数据分析
数据通道和ETL (更多:https://flink.apache.org/usecases.html)

1.1.3.2.正确性保证

Exactly-once状态一致性保证
事件时间处理
复杂的late date处理(更多:https://flink.apache.org/flink-applications.html#building-blocks-for-streaming-applications)

1.1.3.3. API分层体系

统一SQL支持Stream和Batch数据处理
DataSteam API & DataSet API
ProcessFunction(Time & State)(更多:https://flink.apache.org/flink-applications.html#layered-apis)

1.1.3.4. Operational Focus

部署灵活
高可用配置
Savepoint (更多:https://flink.apache.org/flink-operations.html)

1.1.3.5. 适用于各种应用场景Scales to any use case

架构可扩展
超大state支持
增量checkpointing (更多:https://flink.apache.org/flink-architecture.html#run-applications-at-any-scale)

1.1.3.6.高性能

低延时
高吞吐
内存计算(更多:https://flink.apache.org/flink-architecture.html#leverage-in-memory-performance)

这篇关于01_Apache Flink是什么,Apache Flink的优势,Apache Flink用户,Flink介绍(流场景使用案例、正确性保证、API分层体系、Operational Focus等)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/918148

相关文章

Spring Boot整合Redis注解实现增删改查功能(Redis注解使用)

《SpringBoot整合Redis注解实现增删改查功能(Redis注解使用)》文章介绍了如何使用SpringBoot整合Redis注解实现增删改查功能,包括配置、实体类、Repository、Se... 目录配置Redis连接定义实体类创建Repository接口增删改查操作示例插入数据查询数据删除数据更

使用python生成固定格式序号的方法详解

《使用python生成固定格式序号的方法详解》这篇文章主要为大家详细介绍了如何使用python生成固定格式序号,文中的示例代码讲解详细,具有一定的借鉴价值,有需要的小伙伴可以参考一下... 目录生成结果验证完整生成代码扩展说明1. 保存到文本文件2. 转换为jsON格式3. 处理特殊序号格式(如带圈数字)4

Java使用Swing生成一个最大公约数计算器

《Java使用Swing生成一个最大公约数计算器》这篇文章主要为大家详细介绍了Java使用Swing生成一个最大公约数计算器的相关知识,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一下... 目录第一步:利用欧几里得算法计算最大公约数欧几里得算法的证明情形 1:b=0情形 2:b>0完成相关代码第二步:加

Java中流式并行操作parallelStream的原理和使用方法

《Java中流式并行操作parallelStream的原理和使用方法》本文详细介绍了Java中的并行流(parallelStream)的原理、正确使用方法以及在实际业务中的应用案例,并指出在使用并行流... 目录Java中流式并行操作parallelStream0. 问题的产生1. 什么是parallelS

Linux join命令的使用及说明

《Linuxjoin命令的使用及说明》`join`命令用于在Linux中按字段将两个文件进行连接,类似于SQL的JOIN,它需要两个文件按用于匹配的字段排序,并且第一个文件的换行符必须是LF,`jo... 目录一. 基本语法二. 数据准备三. 指定文件的连接key四.-a输出指定文件的所有行五.-o指定输出

Linux jq命令的使用解读

《Linuxjq命令的使用解读》jq是一个强大的命令行工具,用于处理JSON数据,它可以用来查看、过滤、修改、格式化JSON数据,通过使用各种选项和过滤器,可以实现复杂的JSON处理任务... 目录一. 简介二. 选项2.1.2.2-c2.3-r2.4-R三. 字段提取3.1 普通字段3.2 数组字段四.

Linux kill正在执行的后台任务 kill进程组使用详解

《Linuxkill正在执行的后台任务kill进程组使用详解》文章介绍了两个脚本的功能和区别,以及执行这些脚本时遇到的进程管理问题,通过查看进程树、使用`kill`命令和`lsof`命令,分析了子... 目录零. 用到的命令一. 待执行的脚本二. 执行含子进程的脚本,并kill2.1 进程查看2.2 遇到的

详解SpringBoot+Ehcache使用示例

《详解SpringBoot+Ehcache使用示例》本文介绍了SpringBoot中配置Ehcache、自定义get/set方式,并实际使用缓存的过程,文中通过示例代码介绍的非常详细,对大家的学习或者... 目录摘要概念内存与磁盘持久化存储:配置灵活性:编码示例引入依赖:配置ehcache.XML文件:配置

Java 虚拟线程的创建与使用深度解析

《Java虚拟线程的创建与使用深度解析》虚拟线程是Java19中以预览特性形式引入,Java21起正式发布的轻量级线程,本文给大家介绍Java虚拟线程的创建与使用,感兴趣的朋友一起看看吧... 目录一、虚拟线程简介1.1 什么是虚拟线程?1.2 为什么需要虚拟线程?二、虚拟线程与平台线程对比代码对比示例:三

k8s按需创建PV和使用PVC详解

《k8s按需创建PV和使用PVC详解》Kubernetes中,PV和PVC用于管理持久存储,StorageClass实现动态PV分配,PVC声明存储需求并绑定PV,通过kubectl验证状态,注意回收... 目录1.按需创建 PV(使用 StorageClass)创建 StorageClass2.创建 PV