基于电商常识图谱的知识表示与应用

2024-06-21 07:38

本文主要是介绍基于电商常识图谱的知识表示与应用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述
公众号 系统之神与我同在
1.电商常识图谱的背景:
电商知识图谱要求用一套数据体系联系用户和商品,通过定义拆解用户需求和多粒度的商品理解,来提升搜索与推荐的匹配效率与体验。

一个电商知识图谱中包括许多常识关系:

·isA
·搭配
·不同类型之间的映射关系:风格对应款式、时间需要款式、场景需要品类…
在这里插入图片描述
2.电商常识挖掘的方法:

电商常识挖掘采用的方法是一种阅读理解式的关系抽取。对于一个问题:什么样的连衣裙是减龄的? 通过阅读理解的方式,经由Content:(淘宝攻略)…娃娃领连衣裙穿起来很减龄, 假两件的款型为衣衣增添个性 …,抽取出查询:<风格: 减龄,关系: 风格对应领型,领型: 娃娃领,限制: 品类-连衣裙>。

采用阅读理解的方式进行抽取具有以下几个特点:

·在question中将品类限制和头实体(概念)进行联合encode
·充分利用如今取得极大进展的机器阅读理解技术
·生成的question可以天然地提供给众包和外包进行标注,提高知识审核的效率

电商常识阅读理解数据集包含65k个问题,420k条作为内容的产品描述,95k个不同的答案,举例如下:
在这里插入图片描述
在该数据集上不同的模型表现为:
在这里插入图片描述
3.电商常识的表示方法

电商常识表示的难点在于:

1.常识图谱关系稀疏,比事实类图谱密度低约100倍,常用的知识表示模型对稀疏图谱的表征效果不佳。
在这里插入图片描述
2.电商图谱特有的数据结构,如品类树型结构,品类约束下的n-ary结构(四元组)等,常用的三元组模型不适合直接套用。
在这里插入图片描述
对于常识图谱关系稀疏的问题,通过如下两种方法来解决:

·引入外部语义增强:BERT
·结构特征增强:Graph Embedding

对于电商图谱特有的数据结构:

·针对不同数据结构单独建模,多任务共享embedding联合训练
·树型结构: Poincare Embedding
·n-ary结构:品类映射Decoder
在这里插入图片描述
在进行实验时,为了保证实验的公平性,采取了如下做法:

·增加虚拟节点和虚拟边,将一条四元组拆分成语义等价的七条三元组(1+6)
·保持四元组的必要性:信息冗余
在这里插入图片描述
在三个方面链接实验的预测结果:

·整体性能
·分数据结构的性能
·虚拟边的帮助

实验结果如下:
在这里插入图片描述
4.电商常识的应用方法

拿电商常识在淘宝推荐上的应用来举例:

1.解决query和title之间的语义存在gap的问题:query中经常会出现偏口语、非正式(12% in Taobao)的语言,而title则是相对正式和标准的商家语言。

电商常识则可以进行Query改写:直接利用高准电商常识关系数据,将偏口语非正式的query词改写成商家语言,得以召回相关的商品。例如Query: 漏肚子连衣裙,Rewrite Query: 露脐连衣裙。

2.为模型提供识别搜索相关性的能力:query中口语化的表述和title中偏标准的描述之间的映射可以被电商常识关系关联起来;将知识表示算法学到的表征隐式建模到相关性模型中。
在这里插入图片描述
3.推荐商品召回:通过电商常识关系建模不同表述和维度的side info,使得side info语义相关的商品在向量空间的距离更近。电商常识则可以将能链接到常识图谱中的side info对应的KGE表征建模到图表征学习模型中。
在这里插入图片描述
在这里插入图片描述

这篇关于基于电商常识图谱的知识表示与应用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1080600

相关文章

PHP应用中处理限流和API节流的最佳实践

《PHP应用中处理限流和API节流的最佳实践》限流和API节流对于确保Web应用程序的可靠性、安全性和可扩展性至关重要,本文将详细介绍PHP应用中处理限流和API节流的最佳实践,下面就来和小编一起学习... 目录限流的重要性在 php 中实施限流的最佳实践使用集中式存储进行状态管理(如 Redis)采用滑动

深入浅出Spring中的@Autowired自动注入的工作原理及实践应用

《深入浅出Spring中的@Autowired自动注入的工作原理及实践应用》在Spring框架的学习旅程中,@Autowired无疑是一个高频出现却又让初学者头疼的注解,它看似简单,却蕴含着Sprin... 目录深入浅出Spring中的@Autowired:自动注入的奥秘什么是依赖注入?@Autowired

PostgreSQL简介及实战应用

《PostgreSQL简介及实战应用》PostgreSQL是一种功能强大的开源关系型数据库管理系统,以其稳定性、高性能、扩展性和复杂查询能力在众多项目中得到广泛应用,本文将从基础概念讲起,逐步深入到高... 目录前言1. PostgreSQL基础1.1 PostgreSQL简介1.2 基础语法1.3 数据库

Unity新手入门学习殿堂级知识详细讲解(图文)

《Unity新手入门学习殿堂级知识详细讲解(图文)》Unity是一款跨平台游戏引擎,支持2D/3D及VR/AR开发,核心功能模块包括图形、音频、物理等,通过可视化编辑器与脚本扩展实现开发,项目结构含A... 目录入门概述什么是 UnityUnity引擎基础认知编辑器核心操作Unity 编辑器项目模式分类工程

Python中的filter() 函数的工作原理及应用技巧

《Python中的filter()函数的工作原理及应用技巧》Python的filter()函数用于筛选序列元素,返回迭代器,适合函数式编程,相比列表推导式,内存更优,尤其适用于大数据集,结合lamb... 目录前言一、基本概念基本语法二、使用方式1. 使用 lambda 函数2. 使用普通函数3. 使用 N

Python中yield的用法和实际应用示例

《Python中yield的用法和实际应用示例》在Python中,yield关键字主要用于生成器函数(generatorfunctions)中,其目的是使函数能够像迭代器一样工作,即可以被遍历,但不会... 目录python中yield的用法详解一、引言二、yield的基本用法1、yield与生成器2、yi

Python多线程应用中的卡死问题优化方案指南

《Python多线程应用中的卡死问题优化方案指南》在利用Python语言开发某查询软件时,遇到了点击搜索按钮后软件卡死的问题,本文将简单分析一下出现的原因以及对应的优化方案,希望对大家有所帮助... 目录问题描述优化方案1. 网络请求优化2. 多线程架构优化3. 全局异常处理4. 配置管理优化优化效果1.

从基础到高阶详解Python多态实战应用指南

《从基础到高阶详解Python多态实战应用指南》这篇文章主要从基础到高阶为大家详细介绍Python中多态的相关应用与技巧,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录一、多态的本质:python的“鸭子类型”哲学二、多态的三大实战场景场景1:数据处理管道——统一处理不同数据格式

Java Stream 的 Collectors.toMap高级应用与最佳实践

《JavaStream的Collectors.toMap高级应用与最佳实践》文章讲解JavaStreamAPI中Collectors.toMap的使用,涵盖基础语法、键冲突处理、自定义Map... 目录一、基础用法回顾二、处理键冲突三、自定义 Map 实现类型四、处理 null 值五、复杂值类型转换六、处理

分布式锁在Spring Boot应用中的实现过程

《分布式锁在SpringBoot应用中的实现过程》文章介绍在SpringBoot中通过自定义Lock注解、LockAspect切面和RedisLockUtils工具类实现分布式锁,确保多实例并发操作... 目录Lock注解LockASPect切面RedisLockUtils工具类总结在现代微服务架构中,分布