Tachyon源码结构分析(一)

2024-06-20 17:58
文章标签 分析 源码 结构 tachyon

本文主要是介绍Tachyon源码结构分析(一),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

发布人:南京大学PASA大数据实验室舒鹏


前言

在上一篇博客中,我们介绍了Tachyon的安装、配置和使用,用户已经对Tachyon有了初步的了解。从本篇开始,我们将对Tachyon的源码结构进行分析,让用户进一步更深入的了解Tachyon的工作机制。由于源码分析的内容比较多,我们将分成多篇来详细阐述。

 

版本选择

Tachyon目前的最新发布版为0.6.0,最新开发版为0.7.0-SNAPSHOT。本篇我们选择的Tachyon版本为0.6.0。

官方链接:Tachyon-0.6.0

 

概述

Tachyon在系统架构上由Client、Master、Worker三个核心部分组成,对应在Tachyon源码中的一个或多个包(package)中。为了方便分析,我们将Tachyon源码按主要功能分为Client、Master、Worker以及Common模块。每个模块在Tachyon中各司其职,发挥着各自的作用。

  • Client模块:Client模块是Tachyon向用户提供的一扇大门,用户只能在Client模块获取对Tachyon的访问接口,从而对Tachyon文件系统进行各种操作,包括文件的创建、删除、读取、写入等。
  • Master模块:Master模块向Client和Worker提供远程调用接口,负责管理和协调Client与Worker的正常工作,保存了Tachyon文件系统的元数据信息、文件结构、日志和镜像文件以及Workers的信息列表等,同时Master向Client提供了关于元数据的处理操作,包括创建文件、创建表格、删除文件等。Worker向Master注册自己的信息加入到Master的管理,然后和Client一样通过心跳保持其与Master的联系并传递必要的数据信息。Client和Worker通过该模块的MasterClient类远程调用MasterServiceHandler类提供的方法。
  • Worker模块:向Client提供远程调用接口,负责管理本地存储(Storage),在0.6.0版本中就是以层次存储(HierarchyStorage)的方式来管理本地数据。数据在Worker中以数据块为基本单位进行存储和管理,向用户提供以数据块为单位的操作。Client通过该模块的WorkClient类远程调用WorkerServiceHandler类提供的方法。
  • Common模块:向Client、Master、Worker提供本地调用接口,定义了三个模块的通用操作,包括网络访问、数据格式、底层文件系统、用户信息、系统配置等。

下面的表格精确的列出了各个模块所包含的源码文件,具体对各个源码文件的分析在后面的博客中会详细介绍。





四个模块之间相互调用的关系如图1所示,Common向各个模块提供直接调用接口,Master向Client和Worker提供远程调用接口,Worker向Client提供远程调用接口(PS:这里需要注意的是Tachyon远程调用是通过thrift-0.91自动生成的,即tachyon.thrift包。thrift是RPC(RemoteProcedure Call)的一种Java实现,tachyon.thrift中的代码都是根据’tachyon/core/src/thrift/tachyon.thrift’文件由thrift工具自动生成的,在源码分析部分我们不会讨论thrift相关的内容,也不把tachyon.thrift归为上述任何一个模块中)。



图1. Client、Master、Worker、Common模块关系图

这篇关于Tachyon源码结构分析(一)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1078852

相关文章

Linux中的more 和 less区别对比分析

《Linux中的more和less区别对比分析》在Linux/Unix系统中,more和less都是用于分页查看文本文件的命令,但less是more的增强版,功能更强大,:本文主要介绍Linu... 目录1. 基础功能对比2. 常用操作对比less 的操作3. 实际使用示例4. 为什么推荐 less?5.

spring-gateway filters添加自定义过滤器实现流程分析(可插拔)

《spring-gatewayfilters添加自定义过滤器实现流程分析(可插拔)》:本文主要介绍spring-gatewayfilters添加自定义过滤器实现流程分析(可插拔),本文通过实例图... 目录需求背景需求拆解设计流程及作用域逻辑处理代码逻辑需求背景公司要求,通过公司网络代理访问的请求需要做请

Java集成Onlyoffice的示例代码及场景分析

《Java集成Onlyoffice的示例代码及场景分析》:本文主要介绍Java集成Onlyoffice的示例代码及场景分析,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要... 需求场景:实现文档的在线编辑,团队协作总结:两个接口 + 前端页面 + 配置项接口1:一个接口,将o

IDEA下"File is read-only"可能原因分析及"找不到或无法加载主类"的问题

《IDEA下Fileisread-only可能原因分析及找不到或无法加载主类的问题》:本文主要介绍IDEA下Fileisread-only可能原因分析及找不到或无法加载主类的问题,具有很好的参... 目录1.File is read-only”可能原因2.“找不到或无法加载主类”问题的解决总结1.File

8种快速易用的Python Matplotlib数据可视化方法汇总(附源码)

《8种快速易用的PythonMatplotlib数据可视化方法汇总(附源码)》你是否曾经面对一堆复杂的数据,却不知道如何让它们变得直观易懂?别慌,Python的Matplotlib库是你数据可视化的... 目录引言1. 折线图(Line Plot)——趋势分析2. 柱状图(Bar Chart)——对比分析3

Dubbo之SPI机制的实现原理和优势分析

《Dubbo之SPI机制的实现原理和优势分析》:本文主要介绍Dubbo之SPI机制的实现原理和优势,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Dubbo中SPI机制的实现原理和优势JDK 中的 SPI 机制解析Dubbo 中的 SPI 机制解析总结Dubbo中

C#继承之里氏替换原则分析

《C#继承之里氏替换原则分析》:本文主要介绍C#继承之里氏替换原则,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录C#里氏替换原则一.概念二.语法表现三.类型检查与转换总结C#里氏替换原则一.概念里氏替换原则是面向对象设计的基本原则之一:核心思想:所有引py

Python+PyQt5实现文件夹结构映射工具

《Python+PyQt5实现文件夹结构映射工具》在日常工作中,我们经常需要对文件夹结构进行复制和备份,本文将带来一款基于PyQt5开发的文件夹结构映射工具,感兴趣的小伙伴可以跟随小编一起学习一下... 目录概述功能亮点展示效果软件使用步骤代码解析1. 主窗口设计(FolderCopyApp)2. 拖拽路径

基于Go语言实现Base62编码的三种方式以及对比分析

《基于Go语言实现Base62编码的三种方式以及对比分析》Base62编码是一种在字符编码中使用62个字符的编码方式,在计算机科学中,,Go语言是一种静态类型、编译型语言,它由Google开发并开源,... 目录一、标准库现状与解决方案1. 标准库对比表2. 解决方案完整实现代码(含边界处理)二、关键实现细

PostgreSQL 序列(Sequence) 与 Oracle 序列对比差异分析

《PostgreSQL序列(Sequence)与Oracle序列对比差异分析》PostgreSQL和Oracle都提供了序列(Sequence)功能,但在实现细节和使用方式上存在一些重要差异,... 目录PostgreSQL 序列(Sequence) 与 oracle 序列对比一 基本语法对比1.1 创建序