大数据、数据架构、推荐冷启动...小红书的 AI 数据新方案都在这个会

2024-04-16 19:52

本文主要是介绍大数据、数据架构、推荐冷启动...小红书的 AI 数据新方案都在这个会,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

伴随着行业数据持续积累,人工智能正加速渗透各类场景,大数据、数据架构和推荐系统等领域,依然是各行各业目之所聚。4 月 19  至 20 日,「DataFunCon 2024 · 上海站」来袭!大会以“数聚垂域,智领未来”为主题,将在上海龙之梦大酒店举行。

小红书技术副总裁风笛出任大会专家团,携手上海市数据科学重点实验室,以及阿里巴巴、百度、京东等多家行业领军代表,共同策划 60 余场精彩议题,深入探讨“ 大数据 + AI ”在各个行业中的落地应用。

小红书存储和数据库团队负责人刘备(毛琦),担任「数智 · 大数据系统论坛」工业出品人,与来自抖音、清华大学、复旦大学、哈尔滨工业大学等多位数据智能技术专家,畅聊大数据系统探索的最新实践。

  • 实时湖仓如何保证数据质量的同时,实现低延迟数据处理?

  • 在缺乏用户历史数据情况下,推荐系统如何有效地为新内容找到目标受众?

  • 如何提升图数据库的多跳查询性能,满足在线业务的实时性要求?

这类问题不仅推动着技术创新探索,也激发了我们对技术落地的无限想象力。

4 月 19 日起,小红书技术团队将接连贡献三个精彩议题,解答上述问题。小红书数据引擎湖仓架构团队负责人庞博、社区推荐算法专家巴斯、分布式数据库架构师再兴将在峰会现场带来实时湖仓架构在小红书的探索与实践、《高时效推荐实践 - 从系统提效到内容冷启动》和《小红书图数据库在分布式并行查询上的探索》的主题分享。

分享日程

4 月 19 日 17:20-18:05「新一代数据架构论坛」

庞博(孙超) |   小红书数据引擎湖仓架构负责人

在数据驱动时代,实时湖仓架构正成为企业快速响应市场变化、提升决策效率的关键。庞博拥有丰富的数据平台架构设计与优化经验,在本次分享他将带领我们深入探讨:小红书如何结合线上业务场景和需求,通过 OLAP 和数据湖技术的深度融合,实现架构的优化升级。

庞博将详细阐述小红书湖仓架构的演进历程,并围绕“产出更快”“查询更快”这两个核心需求,分享小红书实时湖仓架构的创新策略和成果。通过一系列实际案例分析,他将展示如何运用近实时入湖、StarRocks、Iceberg 等前沿技术,有效降低数据处理成本,提升查询性能和效率。

4 月 19 日 17:20-18:05「推荐系统论坛」

巴斯(陈祈烨) |   小红书社区推荐算法专家

小红书如何打造一个分钟级的高时效推荐系统,快速满足用户的个性化需求?内容冷启动作为推荐系统的核心环节,对于新内容的传播和用户参与度的提升至关重要。本次分享,巴斯将深入剖析高时效推荐系统的构建过程和内容冷启动的关键策略。

巴斯在视频推荐、内容冷启动及社交推荐等领域拥有多年实战经验。他将分享小红书去中心化高时效分发系统的实践和挑战,从推荐时效性提升开始,延伸至内容冷启动的多项探索和技术实践。通过实际案例分析,巴斯将揭示如何利用创新算法和策略,解决新内容在缺乏历史数据和用户反馈情况下的推荐难题。

4 月 20 日 16:35-17:20 「数智 · 大数据系统论坛」

再兴(李凝瑞) |   小红书分布式数据库架构师 

图数据库作为数据库领域的重要分支,虽然经过数十年发展并涌现出众多产品,但在互联网公司的在线业务应用中,其查询能力的使用却往往局限于两跳以内。这主要是因为传统数据库在三跳及以上的查询时延过长,无法满足在线业务对实时性的高要求。

小红书数据库团队通过分析原查询模式上的弊端,并提出优化点,将分布式并行查询的思想应用于图数据库,显著提升多跳查询的响应时间。再兴,作为 Apache 社区开源项目 HugeGraph 的核心创始人、小红书图数据库产品 REDgraph 核心成员,将在本次分享中详细介绍这一技术探索。

在本次分享中,再兴将从图数据的基本概念讲起,深入探讨多跳查询在业务中的应用和面临的性能挑战。他将阐述团队如何识别并优化原查询模式,以及为什么选择分布式并行查询作为突破口。通过介绍基于 MPP 理念的技术实践,包括架构改造、查询计划改写、起点 ID 去重等优化措施,再兴将揭示这些创新如何实现查询性能的显著提升。

图片

限时赠票

想想要亲临上海峰会现场,一览数据智能的探索实践?

我们将免费送出门票一张

转发推送至朋友圈,后台回复「DataFun」,即可参与抽奖。

我们将抽取 1 位幸运的小伙伴

获得 DataFunCon 2024·上海站门票(不含餐)。
 

抽奖截止时间:4 月 18 日  12:00


温馨提示:

中奖者请在 6 个小时内留意消息,添加小助手微信【微信号:REDtech01】,凭中奖信息和转发截图领取电子门票。

这篇关于大数据、数据架构、推荐冷启动...小红书的 AI 数据新方案都在这个会的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/909745

相关文章

批量导入txt数据到的redis过程

《批量导入txt数据到的redis过程》用户通过将Redis命令逐行写入txt文件,利用管道模式运行客户端,成功执行批量删除以Product*匹配的Key操作,提高了数据清理效率... 目录批量导入txt数据到Redisjs把redis命令按一条 一行写到txt中管道命令运行redis客户端成功了批量删除k

Redis客户端连接机制的实现方案

《Redis客户端连接机制的实现方案》本文主要介绍了Redis客户端连接机制的实现方案,包括事件驱动模型、非阻塞I/O处理、连接池应用及配置优化,具有一定的参考价值,感兴趣的可以了解一下... 目录1. Redis连接模型概述2. 连接建立过程详解2.1 连php接初始化流程2.2 关键配置参数3. 最大连

SpringBoot多环境配置数据读取方式

《SpringBoot多环境配置数据读取方式》SpringBoot通过环境隔离机制,支持properties/yaml/yml多格式配置,结合@Value、Environment和@Configura... 目录一、多环境配置的核心思路二、3种配置文件格式详解2.1 properties格式(传统格式)1.

解决pandas无法读取csv文件数据的问题

《解决pandas无法读取csv文件数据的问题》本文讲述作者用Pandas读取CSV文件时因参数设置不当导致数据错位,通过调整delimiter和on_bad_lines参数最终解决问题,并强调正确参... 目录一、前言二、问题复现1. 问题2. 通过 on_bad_lines=‘warn’ 跳过异常数据3

Spring AI使用tool Calling和MCP的示例详解

《SpringAI使用toolCalling和MCP的示例详解》SpringAI1.0.0.M6引入ToolCalling与MCP协议,提升AI与工具交互的扩展性与标准化,支持信息检索、行动执行等... 目录深入探索 Spring AI聊天接口示例Function CallingMCPSTDIOSSE结束语

C#监听txt文档获取新数据方式

《C#监听txt文档获取新数据方式》文章介绍通过监听txt文件获取最新数据,并实现开机自启动、禁用窗口关闭按钮、阻止Ctrl+C中断及防止程序退出等功能,代码整合于主函数中,供参考学习... 目录前言一、监听txt文档增加数据二、其他功能1. 设置开机自启动2. 禁止控制台窗口关闭按钮3. 阻止Ctrl +

java如何实现高并发场景下三级缓存的数据一致性

《java如何实现高并发场景下三级缓存的数据一致性》这篇文章主要为大家详细介绍了java如何实现高并发场景下三级缓存的数据一致性,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 下面代码是一个使用Java和Redisson实现的三级缓存服务,主要功能包括:1.缓存结构:本地缓存:使

在MySQL中实现冷热数据分离的方法及使用场景底层原理解析

《在MySQL中实现冷热数据分离的方法及使用场景底层原理解析》MySQL冷热数据分离通过分表/分区策略、数据归档和索引优化,将频繁访问的热数据与冷数据分开存储,提升查询效率并降低存储成本,适用于高并发... 目录实现冷热数据分离1. 分表策略2. 使用分区表3. 数据归档与迁移在mysql中实现冷热数据分

C#解析JSON数据全攻略指南

《C#解析JSON数据全攻略指南》这篇文章主要为大家详细介绍了使用C#解析JSON数据全攻略指南,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录一、为什么jsON是C#开发必修课?二、四步搞定网络JSON数据1. 获取数据 - HttpClient最佳实践2. 动态解析 - 快速

三频BE12000国补到手2549元! ROG 魔盒Pro WIFI7电竞AI路由器上架

《三频BE12000国补到手2549元!ROG魔盒ProWIFI7电竞AI路由器上架》近日,华硕带来了ROG魔盒ProWIFI7电竞AI路由器(ROGSTRIXGR7Pro),目前新... 华硕推出了ROG 魔盒Pro WIFI7电竞AI路由器(ROG STRIX GR7 Phttp://www.cppcn