Unstructured Data Meetup 南京场收官!干货指南:大模型、向量数据库和 RAG

本文主要是介绍Unstructured Data Meetup 南京场收官!干货指南:大模型、向量数据库和 RAG,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

a81ce3849c5f8d49c6cabb811ed9065d.png

近日,Unstructured Data Meetup 南京场圆满收官!本次 Meetup 由向量数据库领军者 Zilliz 创办,同时还邀请到来自阿里云、图灵人工智能研究院的技术专家分享行业对于 GenAI 如何连接非结构化数据的思考。

以下是本次 Unstructured Data Meetup 的重点内容:

  • Milvus 开源社区负责人 李成龙 《向量数据库 Milvus 在大模型领域的案例分享》

  • 阿里云人工智能平台 PAI 算法工程师 张晓雯《PAI-RAG:基于阿里云PAI+Milvus 构建面向生产的高效、可拓展的模块化 RAG 系统》

  • 图灵人工智能研究院高级算法工程师 杜文凯《司法大模型的实践应用》

  • 深度学习框架 MindSpore 资深开发者 王峰《Milvus 向量检索在 B、C 端全域实践》 

300a16682030f7072e0ab73675c3beca.png

01.

向量数据库 Milvus 在大模型领域的案例分享

2c93871f73d1b3db36f71ce5ce682574.png

Milvus 开源社区负责人李成龙首先分享了漫画平台 RAG 应用,详细分享了快看 AI 智能问答和 IP 角色互动两个应用场景。其中,AI 智能问答应用的工作框架包含 5 个模块,分别是:知识挖掘、数据索引、检索模块、重排模块、评估模块。李成龙详细介绍了 5 个模块的技术方案和注意事项。随后,李成龙又分享了 IP 角色互动场景的技术框架,主要包含原创剧情知识库和用户个性化记忆知识库。

第二个案例是国际化 VOC SaaS 公司 Shulex 的评论分析应用。相较于单纯只用大模型的方式来对用户评论打标,通过 Zilliz Cloud(Milvus全托管云服务)+大模型的方案来对用户评论打标,成本可以降低 50%,报表生成速度提升 30%。

第三个案例是自动驾驶领域里的长尾样本挖掘。在自动驾驶领域,"corner case"指的是那些不常见、异常或极端的交通场景,例如突如其来的大雾、暴雨、暴风雪等极端天气,或是行人、动物、非常规交通工具的意外出现。这些场景对车辆的感知系统提出了严峻的挑战。通过视觉大模型 LVM(Large Vision Model)和多模态大模型 LMM (Large Multimodal Models)Embedding模型的特征提取能力,结合 Milvus 大规模向量搜索功能,可以完成数百 TB 视频数据的 Corner Case 检索。

最后,李成龙总结了 Milvus 在大模型领域的应用类型,主要分成 RAG 和内容检索两大类,分别利用了大模型的总结归纳能力和 Embedding 能力。

02.

PAI-RAG:基于阿里云 PAI+Milvus 构建面向生产的高效、可拓展的模块化 RAG 系统

e212bb14d0f20bffccbcc7d01db05df4.png

阿里云人工智能平台 PAI 算法工程师张晓雯首先介绍了 RAG 的基本概念,为什么需要 RAG 以及 RAG 的应用场景和挑战。其中落地过程中的主要挑战包括:

  • 客户的知识库领域、格式、内容的多样性,RAG 效果难以保证。

  • 客户需求具有多样性,使用常规 RAG 链路难以实现定制化需求。

  • 构建企业级 RAG 应用的挑战,可靠性、高性能、高质量难以取舍。

  • 数据安全隐私问题,如何进行更安全更稳定的私有化应用部署。

PAI-RAG 具备文档智能、Agentic RAG、多模态检索、高性能可用这些特性。整个架构使用 PAI-EAS 模型服务 + PAI-Blade 推理加速引擎,帮助客户一站式解决 AI 部署和推理的全部环节。基于模块化的设计,使得各个组件都能独立伸缩。向量检索模块使用了向量检索服务 Milvus 版,具有全托管免运维,高性能低成本,安全可用等特点。

最后张晓雯通过一个视频,演示了在阿里云上如何通过 PAI-EAS + Milvus 快速部署一个 RAG 应用。

03.

司法大模型的实践应用

8cf48055d9870d95e14cbb77393da565.png

图灵人工智能研究院高级算法工程师 杜文凯从司法大模型的政策背景、需求分析、解决方案以及落地成果四个方面进行了分享。

关于政策背景,2021 年 3 月,国家颁发《中华人民共和国国民经济和社会发展第十四个五年规划和 2035 年远景目标纲要》明确提出,要“加强智慧法院建设”。2022 年 12 月,最高法还发布了《关于规范和加强人工智能司法应用的意见》,从顶层设计、司法数据中台和智慧法院大脑建设、应用系统建设、关键核心技术攻关等五个方面,全方位加强和推动人工智能在司法领域的应用。2022 年 12 月 09 日,最高人民法院 印发《关于规范和加强人工智能司法应用的意见》的通知。

需求分析方面,存在基层法院“案多人少”、地区法官队伍差异大且成长难度大、案件办理流程复杂等问题。司法大模型应运而生,具备低成本、全案由覆盖、易推广等特点。

具体解决方案上,杜文凯介绍了基于本地卷宗管理系统的生成式AI辅助应用系统和灵犀工场大模型平台的架构。并分享了五个具体的应用场景:

  • 场景1:随案卷宗自动更新,材料智能分类。

  • 场景2:全量卷宗一键阅卷,要素智能提取

  • 场景3:  AI助手智能辅助,极简对话交互。

  • 场景4:智能分析归纳,“诉辩-事实-证据”关联。

  • 场景5:法律文书一键生成。

最后,杜文凯介绍司法大模型的落地成果,包括在最高人民法院通过三轮技术论证,并在「AI大脑」部署上线,并且在苏州市中级人民法院上线发布“未来法官助手”系统。

04.

Milvus 向量检索在 B、C 端全域实践

6a369273bd258238976f9eb5e7bdf461.png

深度学习框架 MindSpore 资深开发者王峰首先介绍了 Milvus 的技术架构、应用能力(多租户/Attu/Sizing Tool)和高可用特性(Milvus Backup/CDC)。

在 B 端,王峰介绍了 RAG 应用的架构,包括基础版本以及向 Pipeline/Agent 化演进的版本。此外,还分享了 B 端多模态领域的应用,借助类似 CLIP 等多模态的模型,可以将不同的模态的内容转换成向量问题解,通过检索的方式来应用。

C 端方面,主要介绍了双塔模型的应用,双塔模型经典又简单,就是 NLP 领域的 query 和 document,推荐领域的 user 和 item,多模态检索领域的图像和文字等,都可以用双塔表示。

最后,王峰介绍了将向量检索打造为一个平台化服务方面的思考。主要是抽象各类业务场景共性部分的能力,给业务和工程提效方式,把这些能力服务化,提高复用率。

以上就是本次 Meetup 的全部内容了,微信后台回复关键词「8.17南京」可获取讲师 PPT。

推荐阅读

cc952d5002b49ef5c75410d4afe67e60.png

d8992e297d0a9abc34c75e2ec70615bf.png

d3a009cb02e68dae0e7c3c99cc738825.png

这篇关于Unstructured Data Meetup 南京场收官!干货指南:大模型、向量数据库和 RAG的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1092882

相关文章

Python正则表达式匹配和替换的操作指南

《Python正则表达式匹配和替换的操作指南》正则表达式是处理文本的强大工具,Python通过re模块提供了完整的正则表达式功能,本文将通过代码示例详细介绍Python中的正则匹配和替换操作,需要的朋... 目录基础语法导入re模块基本元字符常用匹配方法1. re.match() - 从字符串开头匹配2.

Linux下MySQL数据库定时备份脚本与Crontab配置教学

《Linux下MySQL数据库定时备份脚本与Crontab配置教学》在生产环境中,数据库是核心资产之一,定期备份数据库可以有效防止意外数据丢失,本文将分享一份MySQL定时备份脚本,并讲解如何通过cr... 目录备份脚本详解脚本功能说明授权与可执行权限使用 Crontab 定时执行编辑 Crontab添加定

JavaScript中的高级调试方法全攻略指南

《JavaScript中的高级调试方法全攻略指南》什么是高级JavaScript调试技巧,它比console.log有何优势,如何使用断点调试定位问题,通过本文,我们将深入解答这些问题,带您从理论到实... 目录观点与案例结合观点1观点2观点3观点4观点5高级调试技巧详解实战案例断点调试:定位变量错误性能分

Java使用jar命令配置服务器端口的完整指南

《Java使用jar命令配置服务器端口的完整指南》本文将详细介绍如何使用java-jar命令启动应用,并重点讲解如何配置服务器端口,同时提供一个实用的Web工具来简化这一过程,希望对大家有所帮助... 目录1. Java Jar文件简介1.1 什么是Jar文件1.2 创建可执行Jar文件2. 使用java

Python实现精确小数计算的完全指南

《Python实现精确小数计算的完全指南》在金融计算、科学实验和工程领域,浮点数精度问题一直是开发者面临的重大挑战,本文将深入解析Python精确小数计算技术体系,感兴趣的小伙伴可以了解一下... 目录引言:小数精度问题的核心挑战一、浮点数精度问题分析1.1 浮点数精度陷阱1.2 浮点数误差来源二、基础解决

Java实现在Word文档中添加文本水印和图片水印的操作指南

《Java实现在Word文档中添加文本水印和图片水印的操作指南》在当今数字时代,文档的自动化处理与安全防护变得尤为重要,无论是为了保护版权、推广品牌,还是为了在文档中加入特定的标识,为Word文档添加... 目录引言Spire.Doc for Java:高效Word文档处理的利器代码实战:使用Java为Wo

从入门到精通详解Python虚拟环境完全指南

《从入门到精通详解Python虚拟环境完全指南》Python虚拟环境是一个独立的Python运行环境,它允许你为不同的项目创建隔离的Python环境,下面小编就来和大家详细介绍一下吧... 目录什么是python虚拟环境一、使用venv创建和管理虚拟环境1.1 创建虚拟环境1.2 激活虚拟环境1.3 验证虚

如何通过try-catch判断数据库唯一键字段是否重复

《如何通过try-catch判断数据库唯一键字段是否重复》在MyBatis+MySQL中,通过try-catch捕获唯一约束异常可避免重复数据查询,优点是减少数据库交互、提升并发安全,缺点是异常处理开... 目录1、原理2、怎么理解“异常走的是数据库错误路径,开销比普通逻辑分支稍高”?1. 普通逻辑分支 v

从基础到高级详解Python数值格式化输出的完全指南

《从基础到高级详解Python数值格式化输出的完全指南》在数据分析、金融计算和科学报告领域,数值格式化是提升可读性和专业性的关键技术,本文将深入解析Python中数值格式化输出的相关方法,感兴趣的小伙... 目录引言:数值格式化的核心价值一、基础格式化方法1.1 三种核心格式化方式对比1.2 基础格式化示例

Python与MySQL实现数据库实时同步的详细步骤

《Python与MySQL实现数据库实时同步的详细步骤》在日常开发中,数据同步是一项常见的需求,本篇文章将使用Python和MySQL来实现数据库实时同步,我们将围绕数据变更捕获、数据处理和数据写入这... 目录前言摘要概述:数据同步方案1. 基本思路2. mysql Binlog 简介实现步骤与代码示例1