导师男团来袭 | 开源之夏2022,与Alluxio一起探索数据编排的奇妙世界

本文主要是介绍导师男团来袭 | 开源之夏2022,与Alluxio一起探索数据编排的奇妙世界,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

活动简介

开源之夏(英文简称 OSPP)是由“开源软件供应链点亮计划”发起并长期支持的一项暑期开源活动,今年是第三届,由中国科学院软件研究所与 openEuler 社区共同举办,旨在鼓励在校学生积极参与开源软件的开发维护,促进优秀开源软件社区的蓬勃发展,培养和发掘更多优秀的开发者。

 

 活动联合国内外各大开源社区,针对重要开源软件的开发与维护提供项目任务,并面向全球高校学生开放报名

学生可在本活动中自主选择感兴趣的项目任务进行申请,并在中选后获得该开源项目资深维护者(社区导师)亲自指导的机会,完成项目并贡献给社区后,参与学生还将获得开源之夏活动奖金和结项证书


 社区介绍

Alluxio系统是全球首个分布式超大规模数据编排系统,孵化于加州大学伯克利分校AMP实验室。自项目开源以来,已有超过来自300多个组织机构的1200多位贡献者参与开发,包括全球最头部科技公司、最顶尖的计算机科研院所等,现已成为发展最快的开源大数据项目之一。目前,全球十大互联网公司中已有包括Facebook、Airbnb、Uber、阿里巴巴、腾讯和字节跳动在内的八家企业部署了Alluxio,还有更多大型企业在生产中运行 Alluxio。

社区GitHub:https://github.com/Alluxio

Slack:https://alluxio-community.slack.com/

网站:https://www.alluxio.io/

除了了解Alluxio系统背景之外,Alluxio为本次“开源之夏”配备的导师男团也不容错过:

下面有请 Alluxio导师男团(自带BGM)

 如需入群与以上导师沟通,请添加Alluxio小助手(VX:Alluxio_Tianyu),请备注“开源之夏”


项目介绍

【项目一】:优化和完善Alluxio数据编排开源项目的单元测试功能

【项目导师】:刘嘉承(jiacheng@alluxio.com),Alluxio 核心开发工程师,硕士毕业于哥伦比亚大学,目前就职于Alluxio公司研发团队核心组。发布了Alluxio K8s Helm Chart。参与并主导了一些Alluxio的RPC和内核优化工作。

 

【难度】:基础

【项目描述】:众所周知,一套设计良好的单元测试保证了开源项目的质量和可维护性。本项目重点在于加强Alluxio应用客户端的测试覆盖率和关键功能的正确性保障。我们希望通过本项目的任务,使得Alluxio开源项目的单元测试(unit test)质量得到进一步补充、完善和加强,通过单元测试保障已有功能,为未来的优化和拓展铺平道路。

【产出要求】:

  1. 针对Alluxio数据编排开源项目的单元测试功能进行优化和完善
  2. 至少包含三个以上优化和完善点

【技术要求】:

熟悉Java编程,分布式系统以及单元测试

更多项目信息:https://summer-ospp.ac.cn/#/org/prodetail/226ea0337

【项目】二:Alluxio数据编排系统的分布式缓存管理机制优化

【项目导师】:范斌(binfan@alluxio.com),Alluxio公司创始成员&开源社区副总裁。本科毕业于中科大计算机系,随后取得卡内基梅隆大学计算机博士学位。博士期间在分布式系统算法和系统实现等方向发表多篇包括SIGCOMM, SOSP, NSDI等顶级国际会议论文以及多篇专利。加入Alluxio前, 范斌在Google从事下一代大规模分布式存储系统的研究与开发,曾获得谷歌年度技术奖。

 【项目描述】:分布式缓存是Alluxio数据编排开源项目的重要特性之一。而如何有效利用和管理各个worker上的缓存空间则成为了影响分布式缓存性能的关键因素。我们在本项目中希望针对现有的缓存清空机制进行功能上的拓展,分两个维度:(1)在现有默认的异步清空操作的基础上,增加支持“同步”清空操作的功能可选项;(2)在现有默认针对所有worker统一执行清空操作的基础上,增加“可指定”若干特定worker实施清空操作。

【难度】:进阶

【产出要求】:

针对Alluxio数据编排系统现有的缓存清空机制从两个维度进行功能上的拓展:

  1. 增加支持“同步”清空操作的功能;
  2. 增加“可指定”若干特定worker实施清空操作。

【技术要求】:

熟悉Java编程,分布式缓存

更多项目信息:https://summer-ospp.ac.cn/#/org/prodetail/226ea0340

针对以上2个学生项目,我们除了配备专门导师,还会有男团其他成员全程助力,同时社区的其他专家也会给予项目辅导与支持。


参与方式

学生自由选择项目,与社区导师沟通实现方案并撰写项目计划书。被选中的学生将在社区导师指导下,按计划完成开发工作,并将成果贡献给社区。社区评估学生的完成度,主办方根据评估结果发放活动奖金给学生


活动日程

课题项目将于 5 月 21 日开始正式接受学生申请,当前正处于「学生与社区项目沟通期」,欢迎大家进群咨询相关事宜,与项目导师线上交流沟通。


与导师沟通

目前Alluxio的2个项目已经成功发布,正式进入学生与导师沟通阶段,各位学生如果对上述项目感兴趣,欢迎你加入Alluxio开源社区的开源之夏项目交流群,与对应导师及社区专家进行沟通交流。

【群聊加入方式】:

方式一:扫描下方二维码(如二维码失效,请采用第二种方式)

方式二:请添加Alluxio小助手(VX:Alluxio_Tianyu),请备注“开源之夏”

这篇关于导师男团来袭 | 开源之夏2022,与Alluxio一起探索数据编排的奇妙世界的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/493858

相关文章

SQL Server修改数据库名及物理数据文件名操作步骤

《SQLServer修改数据库名及物理数据文件名操作步骤》在SQLServer中重命名数据库是一个常见的操作,但需要确保用户具有足够的权限来执行此操作,:本文主要介绍SQLServer修改数据... 目录一、背景介绍二、操作步骤2.1 设置为单用户模式(断开连接)2.2 修改数据库名称2.3 查找逻辑文件名

canal实现mysql数据同步的详细过程

《canal实现mysql数据同步的详细过程》:本文主要介绍canal实现mysql数据同步的详细过程,本文通过实例图文相结合给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的... 目录1、canal下载2、mysql同步用户创建和授权3、canal admin安装和启动4、canal

使用SpringBoot整合Sharding Sphere实现数据脱敏的示例

《使用SpringBoot整合ShardingSphere实现数据脱敏的示例》ApacheShardingSphere数据脱敏模块,通过SQL拦截与改写实现敏感信息加密存储,解决手动处理繁琐及系统改... 目录痛点一:痛点二:脱敏配置Quick Start——Spring 显示配置:1.引入依赖2.创建脱敏

详解如何使用Python构建从数据到文档的自动化工作流

《详解如何使用Python构建从数据到文档的自动化工作流》这篇文章将通过真实工作场景拆解,为大家展示如何用Python构建自动化工作流,让工具代替人力完成这些数字苦力活,感兴趣的小伙伴可以跟随小编一起... 目录一、Excel处理:从数据搬运工到智能分析师二、PDF处理:文档工厂的智能生产线三、邮件自动化:

Python数据分析与可视化的全面指南(从数据清洗到图表呈现)

《Python数据分析与可视化的全面指南(从数据清洗到图表呈现)》Python是数据分析与可视化领域中最受欢迎的编程语言之一,凭借其丰富的库和工具,Python能够帮助我们快速处理、分析数据并生成高质... 目录一、数据采集与初步探索二、数据清洗的七种武器1. 缺失值处理策略2. 异常值检测与修正3. 数据

pandas实现数据concat拼接的示例代码

《pandas实现数据concat拼接的示例代码》pandas.concat用于合并DataFrame或Series,本文主要介绍了pandas实现数据concat拼接的示例代码,具有一定的参考价值,... 目录语法示例:使用pandas.concat合并数据默认的concat:参数axis=0,join=

C#代码实现解析WTGPS和BD数据

《C#代码实现解析WTGPS和BD数据》在现代的导航与定位应用中,准确解析GPS和北斗(BD)等卫星定位数据至关重要,本文将使用C#语言实现解析WTGPS和BD数据,需要的可以了解下... 目录一、代码结构概览1. 核心解析方法2. 位置信息解析3. 经纬度转换方法4. 日期和时间戳解析5. 辅助方法二、L

使用Python和Matplotlib实现可视化字体轮廓(从路径数据到矢量图形)

《使用Python和Matplotlib实现可视化字体轮廓(从路径数据到矢量图形)》字体设计和矢量图形处理是编程中一个有趣且实用的领域,通过Python的matplotlib库,我们可以轻松将字体轮廓... 目录背景知识字体轮廓的表示实现步骤1. 安装依赖库2. 准备数据3. 解析路径指令4. 绘制图形关键

解决mysql插入数据锁等待超时报错:Lock wait timeout exceeded;try restarting transaction

《解决mysql插入数据锁等待超时报错:Lockwaittimeoutexceeded;tryrestartingtransaction》:本文主要介绍解决mysql插入数据锁等待超时报... 目录报错信息解决办法1、数据库中执行如下sql2、再到 INNODB_TRX 事务表中查看总结报错信息Lock

使用C#删除Excel表格中的重复行数据的代码详解

《使用C#删除Excel表格中的重复行数据的代码详解》重复行是指在Excel表格中完全相同的多行数据,删除这些重复行至关重要,因为它们不仅会干扰数据分析,还可能导致错误的决策和结论,所以本文给大家介绍... 目录简介使用工具C# 删除Excel工作表中的重复行语法工作原理实现代码C# 删除指定Excel单元