【AI系列专访】做一件浪漫的事,让机器听懂人类的语言 | 三角兽

2023-10-27 17:20

本文主要是介绍【AI系列专访】做一件浪漫的事,让机器听懂人类的语言 | 三角兽,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

作者:欧应刚  | 小编:小葱



我们认为目前人工智能领域的竞争焦点,已经部分从技术、资本向商业应用转移,有价值应用场景的挖掘和技术的应用落地成为影响AI厂商接下来竞争成败的关键。另一方面,将自身AI技术开放出来,构建赋能平台成为部分AI厂商的选择。


在这样一个市场交替之际,中国软件网策划了“2018中国AI应用、平台与生态”系列专访,倾听来自一线的声音,从实践中分析AI应用的那些痛点和经验。


作为本次系列专题的第一期,我们采访了三角兽的CTO亓超,跟他一起聊一聊语义理解的具体应用,以及三角兽科技在这方面的实践探索。



语义理解与语音识别的不同


亓超谈到,在大众的认知中,语音识别和语义理解仿佛是密不可分的,我们更多的关注到了这两者的结合,而对他们的区别了解较少。亓超指出,语义理解与语音识别是有一定独立性的,他们可以一起合作发挥作用,也可以各自独立发挥作用。以语义理解为例,既可以作为语音识别的后续动作,对识别出的语言进行分析;也可以直接对提供的文本信息进行分析,而不仅仅是分析语音转换来的文本信息。


自然语言处理技术早已广泛应用于各种场景,例如搜索引擎、推荐系统等。当然语义理解和语音识别也是相互融合的,才能产出好的语音交互产品,这也是显示技术功力的重要方面。系统听到的某段语音,因为对其含义的不同理解,会给出差别较大的结果。


在专访中,亓超现场向我展示了三角兽为小米电视提供的语音交互方案,并用语音来点播电影。有趣的是,系统能自动修正一些不规范发音,给出尽可能正确的结果。在亓超现场展示中,对系统说出“路遥知马力“ ,而结果却是”陆垚知马俐“这部电影,其实没有所谓的“路遥知马力“这部电影,系统自动给出了最接近的结果。这用到了三角兽提供的模糊语义识别技术,可以根据用户不清晰或者不准确的表达,反馈尽可能准确的结果。


人机对话的四种类型及其区别

亓超提到,人机对话是一个比较综合的领域,还可以细分为几个不同的种类,包括开放域聊天、问答、推荐及任务驱动的多轮对话。上面从几个特定场景出发,分析了人机对话的应用价值,下面我们系统介绍下人机对话的几种类型及其价值。


开放域聊天,是指不局限话题的聊天,即在用户没用明确的信息或服务获取需求情况下人机之间的交互过程。人们所说的调戏Siri或者某个具有对话功能的机器人,就属于开放域聊天。三角兽的核心团队在这方面技术积累深厚,在创建三角兽之前就先后打造微软小冰和百度度秘两款明星产品,这次三角兽更是推出性格可定制的聊天机器人,将开放域聊天又向前推进了一步。


问答系统,直接根据用户的问题给出精准的答案,这更接近一个信息检索的过程。虽然也可能涉及简单的上下文处理,但通常是通过指代消解和询问补全来完成。问答系统在智能客服领域应用比较普遍,系统根据用户提出的问题来进行回答。


人之间的交互大多不是一次完成的,而是要进行多次交互,这就要用到任务驱动的多轮对话系统。在很多场景中,用户往往带着明确的目的而来,并希望得到满足特定限制条件的信息或服务,例如:订餐,订票,寻找音乐、电影或某种商品等。


任务驱动的多轮对话不是一个简单的自然语言理解加信息检索的过程,而是一个决策过程,需要机器在对话过程中不断根据当前的状态决策下一步应该采取的最优动作,从而最有效的辅助用户完成信息、服务获取的任务,这也是任务驱动的多轮对话与问答系统的重要区别。亓超谈到,三角兽在任务驱动的多轮对话系统方面有深厚的技术积淀,并将这一能力广泛应用于智能家居、智能车载、智能机器人、智能手机等领域中。


与上面谈到的开放域聊天、问答系统和任务驱动的多轮对话本质上是被动响应用户询问不同,推荐系统是主动推荐用户可能感兴趣的信息或者服务,推荐的基础则是当前的用户询问和该用户询问历史所构建的用户画像。亓超提到,三角兽基于挖掘和推荐技术,以人机对话为依托建立深度用户画像,让人机交互从被动响应到主动推荐,给用户和企业创造更多商业价值。



亓超认为,由于上述几种人机对话类型较大的技术差异,用一套系统实现所有功能是不现实的。如果要将上述功能整合在一个应用中,需要一个中控决策模块,这个模块不仅负责需求和问题的分类,还包括任务之间的澄清、确认和跨领域的引导,进而通过一个决策过程来完成不同类型对话的应用整合。在真实的商业应用中,既有解决某类问题的系统,也有综合多种类型的系统,他们根据不同的商业诉求发挥各自作用,共同推动智能人机交互产业的发展。


人机交互的商业应用场景和价值


三角兽是人工智能语义公司,基于大数据和深度学习算法,提供对话式交互解决方案和端对端交互系统。那么人机对话系统可以用到哪些地方,怎么用,又能产生哪些价值?


三角兽想要通过人工知智能的应用达成什么样的目的呢,用他们的话说就是“大幅提升效率,降低成本“。如何来实现,我们以比较典型的智能客服为例来进行说明。三角兽推出了针对企业的智能交互系统,可以让企业微信、微博、App、官网等具备对话能力,提升粉丝粘性,提升品牌和市场运营效率。


以新世界集团K11官方微信应用为例,通过智能对话系统,可以让其官方微信可以及时的与客户进行互动,解决客户提出的问题。作为对人工客服的替代,智能客服系统大大降低了人力成本。更进一步的,智能客服能避免了人工客服的一些天然限制:人工客服有时间限制,晚上和节假日都工作未免有点“不人道”,智能客服则能提供24小时全年无休的服务;人的知识有局限,单个客服很难对公司的所有业务都熟悉,很难通过单个客服就能解决用户的所有问题,更不能解决所有用户的问题。我们在接通人工客服后,一般都要根据具体的问题来进行转接,这就带来较多的麻烦。智能系统可以对公司信息进行全面细致的掌握,较好的应对不同用户提出的问题。


当然,除了严肃的问题解决式对话,智能客服也会是一个很好的娱乐工具。如果某个企业的智能客服足够“有趣”,给用户带来乐趣,对于提升用户粘性必然大有裨益。事实上,能讲段子已经成为智能交互系统的一大卖点了。人们往往是在不断的笑声中,慢慢对机器系统产生好感,从而产生购买或者深度使用的意愿。

除了上面提到的智能客服,三角兽拓展了广泛地智能人机交互应用领域,其中企业服务(商业、媒体、金融、客服等领域)、智能终端(智能家居、智能车载、智能手机、智能机器人和音箱等)和泛娱乐(二次元、游戏、偶像角色等)三个具体的领域是其重要的商业应用方向,并且已经与锤子手机、Rokid机器人、富士康、广发证券、腾讯 、新世界集团,以及2家智能手机厂商、1家智能家居巨头等公司达成了合作。正如亓超所言,三角兽广泛的场景应用和多样化的产品布局,都离不开一条主线,那就是通过智能人机交互方案来为客户实现“降本增效”的商业诉求。



 三角兽 

三角兽是人工智能语义公司,致力于深度学习与认知计算,输出对话式交互解决方案和端对端交互系统,为金融、电信及IoT(包括智能手机、智能电视、智能车载等)等领域企业与政府部门提供解决方案,大幅提升用户体验,提升效率,降低成本。 


三角兽由来自微软、百度、阿里、IBM、乐视等企业的资深算法工程师团队和连续创业经验丰富的市场运营团队组成。 目前已经与微软、百度、中国移动、富士康、新浪、小米、锤子、恒生、Rokid等达成合作,是国内人工智能语义领域发展最快,技术应用落地领域最广的公司。 2016 年 4 月获得洪泰基金和天善资本 1000 万人民币天使投资,9 月获得君联资本和赛富 2000 万人民币投资,2017 年 1 月获得东方网力旗下博雍基金、恒生电子和索道资本 5000 万人民币投资。




了解中国软件网

移动办公、CRM、HR服务

趋势洞察报告研究文章及报告获取路径

请在公众号后来回复【报告】



 中国软件网 

专注有深度的

互联网软件趋势分析

 作者 

欧应刚

人工智能、大数据、云计算和AR领域

致力于做一个有态度、有洞见、有策略的产业观察者

微信:微信oyg0001

邮箱:oyg@soft6.com


 作品概览 

【人工智能】


  • “AI+安防”和“安防+AI”之外,“可视分析+AI”有什么新的玩法?

  • 将AI技术融入工业场景,推动新一代工业智能发展

  • 把脉百度AI,“三得”、“三失”与“三策”


扫描二维码,关注我们吧


这篇关于【AI系列专访】做一件浪漫的事,让机器听懂人类的语言 | 三角兽的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/287190

相关文章

Go语言中泄漏缓冲区的问题解决

《Go语言中泄漏缓冲区的问题解决》缓冲区是一种常见的数据结构,常被用于在不同的并发单元之间传递数据,然而,若缓冲区使用不当,就可能引发泄漏缓冲区问题,本文就来介绍一下问题的解决,感兴趣的可以了解一下... 目录引言泄漏缓冲区的基本概念代码示例:泄漏缓冲区的产生项目场景:Web 服务器中的请求缓冲场景描述代码

Go语言如何判断两张图片的相似度

《Go语言如何判断两张图片的相似度》这篇文章主要为大家详细介绍了Go语言如何中实现判断两张图片的相似度的两种方法,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 在介绍技术细节前,我们先来看看图片对比在哪些场景下可以用得到:图片去重:自动删除重复图片,为存储空间"瘦身"。想象你是一个

Go语言中Recover机制的使用

《Go语言中Recover机制的使用》Go语言的recover机制通过defer函数捕获panic,实现异常恢复与程序稳定性,具有一定的参考价值,感兴趣的可以了解一下... 目录引言Recover 的基本概念基本代码示例简单的 Recover 示例嵌套函数中的 Recover项目场景中的应用Web 服务器中

Go语言中使用JWT进行身份验证的几种方式

《Go语言中使用JWT进行身份验证的几种方式》本文主要介绍了Go语言中使用JWT进行身份验证的几种方式,包括dgrijalva/jwt-go、golang-jwt/jwt、lestrrat-go/jw... 目录简介1. github.com/dgrijalva/jwt-go安装:使用示例:解释:2. gi

Go 语言中的 Struct Tag 的用法详解

《Go语言中的StructTag的用法详解》在Go语言中,结构体字段标签(StructTag)是一种用于给字段添加元信息(metadata)的机制,常用于序列化(如JSON、XML)、ORM映... 目录一、结构体标签的基本语法二、json:"token"的具体含义三、常见的标签格式变体四、使用示例五、使用

Spring AI 实现 STDIO和SSE MCP Server的过程详解

《SpringAI实现STDIO和SSEMCPServer的过程详解》STDIO方式是基于进程间通信,MCPClient和MCPServer运行在同一主机,主要用于本地集成、命令行工具等场景... 目录Spring AI 实现 STDIO和SSE MCP Server1.新建Spring Boot项目2.a

Go语言使用slices包轻松实现排序功能

《Go语言使用slices包轻松实现排序功能》在Go语言开发中,对数据进行排序是常见的需求,Go1.18版本引入的slices包提供了简洁高效的排序解决方案,支持内置类型和用户自定义类型的排序操作,本... 目录一、内置类型排序:字符串与整数的应用1. 字符串切片排序2. 整数切片排序二、检查切片排序状态:

基于Go语言实现Base62编码的三种方式以及对比分析

《基于Go语言实现Base62编码的三种方式以及对比分析》Base62编码是一种在字符编码中使用62个字符的编码方式,在计算机科学中,,Go语言是一种静态类型、编译型语言,它由Google开发并开源,... 目录一、标准库现状与解决方案1. 标准库对比表2. 解决方案完整实现代码(含边界处理)二、关键实现细

如何合理管控Java语言的异常

《如何合理管控Java语言的异常》:本文主要介绍如何合理管控Java语言的异常问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、介绍2、Thorwable类3、Error4、Exception类4.1、检查异常4.2、运行时异常5、处理方式5.1. 捕获异常

C语言中的常见进制转换详解(从二进制到十六进制)

《C语言中的常见进制转换详解(从二进制到十六进制)》进制转换是计算机编程中的一个常见任务,特别是在处理低级别的数据操作时,C语言作为一门底层编程语言,在进制转换方面提供了灵活的操作方式,今天,我们将深... 目录1、进制基础2、C语言中的进制转换2.1 从十进制转换为其他进制十进制转二进制十进制转八进制十进