AI神助攻,购物更省心:我即将上线一套企业数据高度契合的智能导购APP来开创这一新纪元

本文主要是介绍AI神助攻,购物更省心:我即将上线一套企业数据高度契合的智能导购APP来开创这一新纪元,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

将要做什么事的介绍

近期博客写了少了,是因为近小半年来我正在打造一款可私布在企业内部并结合企业自有领域(零售商超先行)数据的智能导购引擎。截止目前为止还算顺利,并且我将很快将在中国本土的一家生鲜百货超市上线这一款生成式AI,帮助用户改善购物体验提升效率。

这可能是中国第一款采AIGC技术的电商产品,它能根据你的文字提示,自动为你生成购物建议、搜索建议和评论摘要等。

举个例子,假如你告诉它:“我想吃水果,但是我不喜欢太甜,糖分高的就算了。”这时,这款AI就会立马为你解析各种水果的糖分含量,然后根据你的需求,为你推荐平台上的低糖水果。

如果你对某个产品感兴趣,还可以继续深入询问,比如:“这个苹果的糖分含量是多少?”这样一来,你就可以省去大量的搜索和比较时间,让购物变得更加轻松高效。

值得一提的是,全球电商巨头亚马逊也在试验类似的功能,这足以看出,生成式AI在电商领域的应用前景十分广阔,已经得到了业界巨头的认可。 说实话,这款AI就像你的私人购物助手,不仅能帮你省时省力,还能帮你做出更科学的选择。

是什么激发了灵感

本人自身所处新零售领域,也接触到了不少圈内人士。在去年GPT刚出现时,大家谈到过一个话题。说:

在双11,想给自己的妻子、孩子、好友买点东西!可是买什么好呢?传统的购买就是自己在网上狂搜一把或者到处听别人PUA、推销。

但是,经常有人会有一种:我不知道具体要买什么,但是我有一个购买的愿镜、愿望。我希望可以有一个搜索把这样的愿望实现成一个个的物品加入到我的购物篮中就好。

亦或者看到一个桌上摆着的色香味俱全的菜,但是它是如何做出来的呢?用的是哪些具体的成份?它的步骤是什么?

这显然不是现在的任何电商购物网站、APP可以做得到的。因为当你把这样的愿望输入相关的搜索,你得到的结果大多为0。

基于这样的愿望、述求式的搜索,诞生了这么一个点子。

过程是很“磨难”的

愿望是美好的、过程的确很艰幸。首先要解决的是如何把一个通用的大模型去和一个特有的业务领域有机的结合起来。

在2023年年初,随着GPT的一火再火。我们可以看到很多大厂的元老纷纷“下海”创业大模型,一时间大模型如雨后春笋一般到处开花。

可是,我们一直没有发觉一款真正的和某一个具体的领域、业务结合应用的实际业务场景。绝大部分都是在讲一些原理,而用来跑业务领域的到写这篇博文为止还都是在跑GIT上那个著名的“奥运会数据”sample。

因此当一个企业“烧”掉了大量的成本而结果只跑了一个“奥运会数据”或者是说可以喂入“维基百科”的内容或者说只是实现了一个“客服”功能而己。这对一个企业来说显然是不公平的。

但是经过一段时间的摸索,我们还是找到了这样的一种有机结合。在这个过程中解决了大量之前未知和己知未解决的问题,很多技术点连博客、论文都没有更不要说相关案例来作参考了,我们纯粹是在摸着石头过河。

企业的数据是私有模型的关键

要做一个私有领域的智能AI,数据的质量是很重要的,特别是企业自身元数据的重新梳理整理归纳上显得很重要。数据质量直接决定了这样的特有领域AI最终的反应是否近人情、会人意,再说了通俗点,就是我们希望它是一款“接地气的AI”。

在集成企业自有模型时,这种集成不能再使用传统的行列维度以及传统的BI、大数据去考虑这个模型的建模和梳理方案论。而是需要使用“语义”分析、神经网络的概念去思考这么一个重整企业原有数据维度的问题。

拿一个未梳理好的企业数据来结合AI后的反例说明问题

反例

上例我们可以看到一个按照传统关系型数据库建模的数据,给到AI后在AI最终跑到TO C端表现出来的回答也是不符合要求的。

正例

而一个梳理良好的企业私有数据模型在AI最终表现出来的效果如下

拿一个零售领域的数据来做例子:

我们知道例如:2.5公斤车厘子这一类属于规格维度,我们把它称为第一维度。

在这一维度就有可能会扩展出6位数其它维度出来,甚至还可以自由扩展亦或者可以让AI自我完善、学习来自行扩展这一维度。

而第二维度的:商品基本属性也不是固定的。

第三个维度就是:业务场景或者又称为“活动场景”是我们经常用来做一些大促、促销、地推活动定义的,它也可以是任意扩展、翻新、甚至淘汰过时不用了,这都不可能是背后的人去一个个定义它们的。

在这三个维度即:规格->基本属性->场景间,我们假设三个维度一交错,那么这个数据量会以亿为单位,它们彼此间的关联不一定每一个都是强关联,也不可能用人脑和现有技术去做这个关联,这3个维度的关联如果用线来表示恐怕比繁星的数量还多。

因此一个质量好的企业私有数据模型必须要可以支持这种关系,这种关系我们把它称为“语义相关”或者用GPT现出后的一个耳熟能详的名词,即:涌现。

就是要让AI去自我扩展和关联而不是人为的去做这个“打标动作”,包括“前AI”我是把AIGC出现前的任何AI归为了“前AI时代”的那种“人为打标”。就拿上面这三个维度来说,就算是你有足够的人手去打标,你要打多少标?这让我想起了阿凡提回答“你能说一下我的头发有多少根”的那个问题了。

超长上下文以及本土化的工具集成的问题

支持超长上下文

无论是GPT还是CLAUDE还是GLM6B亦或是其它,都无法逃脱上下文长度这个“梗”。在训练和使用企业私有模型问题上,我们就碰到了这个问题。

即:我们的切实需要是可以让一个AI无限轮和一个人、或者一个系统对话下去同时又不能抛弃掉对话的完整度。

对于这个问题,网上目前能解决的唯有:ChatPDF。翻遍资料、论坛甚至论文,无解决方案。而ChatPDF的方案又只是一个开源免费仅供作为hello world级别的Sample,是无法商用的。

在这一问题上我们付出了巨大的心思并最终成功独创出了一套解决方案。目前这套解决方案无论是在效率还是准确率以及上下文相关联性来说远超过了ChatPDF。

本土化电商工具的集成心路

我们都知道我国自有本土化电商特别是O2O如:饿了么、美团、支付宝内的本地生活口碑网小程序、APP、WeChat等种类繁多。

由于前文我说到的,目前国内还无一例把一个LLM去和具体某个领域集成起来的方案,所以都以为只要做成API不就可以和之前一样对接了吗?

这样的想法在方案一开始落地时“害”了我们,我们为此也付出了两次推翻原有方案重写引擎的惨痛教训。好在我们有着极大的韧性+耐心,最终,我们也实现了首个可以和国内本土化电商模式工具集成的方案,没有之一,只有唯一。

整个方案可私布在企业内部

作为一个“有责任心的AI模型”,企业的数据是企业珍贵的资产,我们有责任保护好企业的数据不泄漏、不出境。

同时我们还在模型层做足了安全的功课、先后报备、申报、等保3、安全扫描、内容过滤保护是整个方案可以落地的保证。

如果我们把一个可以集成企业私有数据的模型的实现视作一座大山,这座山目前还无一例“登顶”的案例,那么“安全”相关课题可以看作是登天。

只有作一个“有责任”的AI,才能深受客户的信任,要不然这不是在帮客户了而是害客户。

展望一下未来

随着和企业的深入集成,在图搜图-图搜文-文搜图以及其它多媒体领域我们都在实现国内很多首个突破。

该方案上线在即。当它落地后我们还将探索更多的AI与TO B端深入结合的场景。我把我的个人宗旨定位为:积极拥抱生成式AI、并创新式的赋能各To B领域。

未来,随着AI技术的不断发展和深入应用,我们的生活将变得越来越智能,越来越便捷。

如我在之前的一系列博客中所述,随着国家对六大支柱产业的定义未来无限可能,程序员大有可为。一切在于“要转型、要转身快”。

未来无限可能,拥抱AI使人“年轻”。让我们一起拥包AI积极的投入到伟大祖国的建设领域中来吧。

这篇关于AI神助攻,购物更省心:我即将上线一套企业数据高度契合的智能导购APP来开创这一新纪元的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/348554

相关文章

SpringBoot多环境配置数据读取方式

《SpringBoot多环境配置数据读取方式》SpringBoot通过环境隔离机制,支持properties/yaml/yml多格式配置,结合@Value、Environment和@Configura... 目录一、多环境配置的核心思路二、3种配置文件格式详解2.1 properties格式(传统格式)1.

使用Python构建智能BAT文件生成器的完美解决方案

《使用Python构建智能BAT文件生成器的完美解决方案》这篇文章主要为大家详细介绍了如何使用wxPython构建一个智能的BAT文件生成器,它不仅能够为Python脚本生成启动脚本,还提供了完整的文... 目录引言运行效果图项目背景与需求分析核心需求技术选型核心功能实现1. 数据库设计2. 界面布局设计3

解决pandas无法读取csv文件数据的问题

《解决pandas无法读取csv文件数据的问题》本文讲述作者用Pandas读取CSV文件时因参数设置不当导致数据错位,通过调整delimiter和on_bad_lines参数最终解决问题,并强调正确参... 目录一、前言二、问题复现1. 问题2. 通过 on_bad_lines=‘warn’ 跳过异常数据3

Spring AI使用tool Calling和MCP的示例详解

《SpringAI使用toolCalling和MCP的示例详解》SpringAI1.0.0.M6引入ToolCalling与MCP协议,提升AI与工具交互的扩展性与标准化,支持信息检索、行动执行等... 目录深入探索 Spring AI聊天接口示例Function CallingMCPSTDIOSSE结束语

C#监听txt文档获取新数据方式

《C#监听txt文档获取新数据方式》文章介绍通过监听txt文件获取最新数据,并实现开机自启动、禁用窗口关闭按钮、阻止Ctrl+C中断及防止程序退出等功能,代码整合于主函数中,供参考学习... 目录前言一、监听txt文档增加数据二、其他功能1. 设置开机自启动2. 禁止控制台窗口关闭按钮3. 阻止Ctrl +

java如何实现高并发场景下三级缓存的数据一致性

《java如何实现高并发场景下三级缓存的数据一致性》这篇文章主要为大家详细介绍了java如何实现高并发场景下三级缓存的数据一致性,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 下面代码是一个使用Java和Redisson实现的三级缓存服务,主要功能包括:1.缓存结构:本地缓存:使

在MySQL中实现冷热数据分离的方法及使用场景底层原理解析

《在MySQL中实现冷热数据分离的方法及使用场景底层原理解析》MySQL冷热数据分离通过分表/分区策略、数据归档和索引优化,将频繁访问的热数据与冷数据分开存储,提升查询效率并降低存储成本,适用于高并发... 目录实现冷热数据分离1. 分表策略2. 使用分区表3. 数据归档与迁移在mysql中实现冷热数据分

C#解析JSON数据全攻略指南

《C#解析JSON数据全攻略指南》这篇文章主要为大家详细介绍了使用C#解析JSON数据全攻略指南,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录一、为什么jsON是C#开发必修课?二、四步搞定网络JSON数据1. 获取数据 - HttpClient最佳实践2. 动态解析 - 快速

三频BE12000国补到手2549元! ROG 魔盒Pro WIFI7电竞AI路由器上架

《三频BE12000国补到手2549元!ROG魔盒ProWIFI7电竞AI路由器上架》近日,华硕带来了ROG魔盒ProWIFI7电竞AI路由器(ROGSTRIXGR7Pro),目前新... 华硕推出了ROG 魔盒Pro WIFI7电竞AI路由器(ROG STRIX GR7 Phttp://www.cppcn

MyBatis-Plus通用中等、大量数据分批查询和处理方法

《MyBatis-Plus通用中等、大量数据分批查询和处理方法》文章介绍MyBatis-Plus分页查询处理,通过函数式接口与Lambda表达式实现通用逻辑,方法抽象但功能强大,建议扩展分批处理及流式... 目录函数式接口获取分页数据接口数据处理接口通用逻辑工具类使用方法简单查询自定义查询方法总结函数式接口