百度CTO王海峰:语音能力日均调用量过100亿,AI技术在应用中进化

2023-10-09 14:40

本文主要是介绍百度CTO王海峰:语音能力日均调用量过100亿,AI技术在应用中进化,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

11月28日,百度大脑宣布语音能力引擎日均调用量已经超过100亿次,应用规模业界第一,为开发者提供了覆盖云、端、芯的全栈全场景语音开放能力,推动智能语音技术在各行业落地应用。

在当天举行的百度大脑语音能力引擎论坛上,百度大脑语音引擎全新发布和升级了14大产品内容,包括基于百度鸿鹄语音芯片的4款硬件模组、开发板及3大场景解决方案,升级了语音自训练平台、呼叫中心语音解决方案等。来自家电、农业、医疗等行业的合作伙伴代表也在现场分享了百度大脑语音技术赋能的成果。

     

▲ 百度 CTO 王海峰博士致辞

百度首席技术官王海峰博士出席论坛并致辞,他表示:“AI 技术的进化和产业赋能正向循环,相互促进,AI 在应用场景中不断进化。百度的语音技术基于深度学习和产业应用加速突破,已应用到百度 App、百度地图、小度音箱,百度输入法等百度产品,更通过 AI 开放平台赋能众多产业伙伴。百度大脑语音能力每天的调用量已经超过100亿。

现场,百度语音首席架构师贾磊正式提出基于复数 CNN 网络的语音增强和语音识别一体化端到端建模技术,该方法抛弃了数字信号处理学科和语音识别学科的各种先验假设,消除学科间壁垒,直接端到端进行一体化建模。相较于传统基于数字信号处理的麦克阵列算法,错误率降低超过30%。目前该方法已经被集成到百度最新发布的百度鸿鹄芯片中。  

▲ 百度语音首席架构师贾磊主题演讲:百度大脑语音技术的前沿进展

百度从2012年起就开始把深度学习用于中文语音搜索,成为全世界最早把深度学习技术落地工业化产品的企业之一。百度大脑目前已开放了云、端、芯包含语音识别、语音合成等全栈语音引擎能力,并广泛应用于金融、政务、文娱等多种行业和场景。

百度 AI 技术生态部总经理喻友平表示,百度大脑语音能力引擎的应用规模已达到业界第一,同时一直在积极拓展语音能力引擎生态链的建设。

 

▲ 百度 AI 技术生态部总经理喻友平介绍百度大脑语音引擎全栈开放能力

针对智能硬件设备,百度大脑重磅发布基于百度鸿鹄语音芯片的4款硬件模组、开发板,以及智能家居、智能车载、智能 IoT 设备3大端到端软硬一体远场语音交互场景解决方案,具备交互效果优异、软硬一体快速应用、广泛兼容集成门槛低等优点。

同时,在语音识别领域,全面升级短语音识别、实时语音识别能力,发布音频文件转写能力,升级可零代码提升业务术语识别率的语音自训练平台,以及呼叫中心语音解决方案;在语音合成方面,全新发布6个在线语音合成精品音库和5个离线语音合成精品音库。丰富的语音能力,助力智能硬件、互联网、呼叫中心等领域智能化升级。

▲ 嘉宾分享第一排从左至右:创维、瓴岳科技、北京子杰宝贝科技公司;第二排从左至右: 华智水稻、江西善行

论坛上,来自家居、金融、医疗、农业、公益等领域的合作伙伴,登台分享与百度大脑合作的细节,以及如何以语音技术助力自身完成智能化升级。

创维 AIoT 研究院产品经理李凯介绍:“大屏 IoT 的行业痛点在于信息检索难和设备控制操作复杂,通过增加语音交互能力,重构了整个 AIoT 设备生态的交互体验。双方在电视方面的合作成果已落地在10个电视芯片型号、2500万台电视上,助力中端及高端产品线提升了产品溢价能力。”在下一代远场语音方案中,百度鸿鹄语音芯片为创维产品带来了高性价比硬件、整合优化的软件算法等价值,双方将基于百度鸿鹄芯片展开多项产品的合作。

瓴岳科技信贷运营总监宋力现场分享了百度大脑语音技术在贷后领域的应用,依托百度大脑呼叫中心实时语音识别等 AI 服务对用户语音的准确识别,瓴岳打造了降本提效的智能机器人。通过贷后智能机器人、智能语音质检的应用,贷后人力投入降低61.47%,有效实现了合规和高效的运营体系,提高了客户体验。

北京子杰宝贝科技有限公司项目经理肖云峰在会上展现了语音技术在医疗领域的应用:“我们开发的智能录入系统在百度大脑语音自训练平台进行语音识别模型训练,识别率从80%提升至95%以上,包括医疗专业生僻词的识别,而很多厂商模型识别率都达不到这个要求。该系统有效降低了医护人员的工作强度,提升了临床护理效率。”

而在农业领域,也遇到了农业作物专业词汇语音识别率低的行业问题,对此华智生物信息技术主任龙晓波表示:“得益于百度大脑语音自训练平台使用简单、准确率高、可拓展等优点,经多次迭代我们的农业结构化性状数据语音识别准确率从71.09%提升至98.75%,采集一个测试田地性状信息从300人工时降低到160人工时,工作效率提升了一倍。”

善行智能联合创始人黄小瑰介绍了基于百度大脑语音等技术打造的小 Q 智能导盲眼镜,帮助盲人生活出行,为失能人群提供智能化的帮助。现场还发布了“因 AI 而声”公益计划:百度大脑将为提供公益性服务的公司或组织,提供语音技术免费、专属语音技术支持等福利,为特殊群体带去便利和帮助,让 AI 有温度。

▲ 百度大脑语音能力引擎论坛现场

百度大脑开放平台是国内服务规模最大的 AI 开放平台,目前已开放228项 AI 能力,拥有超过150万的开发者用户。

与会人士认为,此次百度大脑语音技术能力的全新发布和升级,为开发者和企业提供了更加完善的全栈语音引擎能力,将帮助更多用户高效打造具备语音交互能力的特色应用与产品,加快语音技术在各行各业的应用落地进程。

这篇关于百度CTO王海峰:语音能力日均调用量过100亿,AI技术在应用中进化的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:https://blog.csdn.net/weixin_45727359/article/details/103306206
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/173556

相关文章

Python Flask 库及应用场景

《PythonFlask库及应用场景》Flask是Python生态中​轻量级且高度灵活的Web开发框架,基于WerkzeugWSGI工具库和Jinja2模板引擎构建,下面给大家介绍PythonFl... 目录一、Flask 库简介二、核心组件与架构三、常用函数与核心操作 ​1. 基础应用搭建​2. 路由与参

Spring Boot中的YML配置列表及应用小结

《SpringBoot中的YML配置列表及应用小结》在SpringBoot中使用YAML进行列表的配置不仅简洁明了,还能提高代码的可读性和可维护性,:本文主要介绍SpringBoot中的YML配... 目录YAML列表的基础语法在Spring Boot中的应用从YAML读取列表列表中的复杂对象其他注意事项总

使用Python实现调用API获取图片存储到本地的方法

《使用Python实现调用API获取图片存储到本地的方法》开发一个自动化工具,用于从JSON数据源中提取图像ID,通过调用指定API获取未经压缩的原始图像文件,并确保下载结果与Postman等工具直接... 目录使用python实现调用API获取图片存储到本地1、项目概述2、核心功能3、环境准备4、代码实现

电脑系统Hosts文件原理和应用分享

《电脑系统Hosts文件原理和应用分享》Hosts是一个没有扩展名的系统文件,当用户在浏览器中输入一个需要登录的网址时,系统会首先自动从Hosts文件中寻找对应的IP地址,一旦找到,系统会立即打开对应... Hosts是一个没有扩展名的系统文件,可以用记事本等工具打开,其作用就是将一些常用的网址域名与其对应

使用@Cacheable注解Redis时Redis宕机或其他原因连不上继续调用原方法的解决方案

《使用@Cacheable注解Redis时Redis宕机或其他原因连不上继续调用原方法的解决方案》在SpringBoot应用中,我们经常使用​​@Cacheable​​注解来缓存数据,以提高应用的性能... 目录@Cacheable注解Redis时,Redis宕机或其他原因连不上,继续调用原方法的解决方案1

CSS 样式表的四种应用方式及css注释的应用小结

《CSS样式表的四种应用方式及css注释的应用小结》:本文主要介绍了CSS样式表的四种应用方式及css注释的应用小结,本文通过实例代码给大家介绍的非常详细,详细内容请阅读本文,希望能对你有所帮助... 一、外部 css(推荐方式)定义:将 CSS 代码保存为独立的 .css 文件,通过 <link> 标签

Web技术与Nginx网站环境部署教程

《Web技术与Nginx网站环境部署教程》:本文主要介绍Web技术与Nginx网站环境部署教程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、Web基础1.域名系统DNS2.Hosts文件3.DNS4.域名注册二.网页与html1.网页概述2.HTML概述3.

Spring AI 实现 STDIO和SSE MCP Server的过程详解

《SpringAI实现STDIO和SSEMCPServer的过程详解》STDIO方式是基于进程间通信,MCPClient和MCPServer运行在同一主机,主要用于本地集成、命令行工具等场景... 目录Spring AI 实现 STDIO和SSE MCP Server1.新建Spring Boot项目2.a

Python使用Reflex构建现代Web应用的完全指南

《Python使用Reflex构建现代Web应用的完全指南》这篇文章为大家深入介绍了Reflex框架的设计理念,技术特性,项目结构,核心API,实际开发流程以及与其他框架的对比和部署建议,感兴趣的小伙... 目录什么是 ReFlex?为什么选择 Reflex?安装与环境配置构建你的第一个应用核心概念解析组件

C#通过进程调用外部应用的实现示例

《C#通过进程调用外部应用的实现示例》本文主要介绍了C#通过进程调用外部应用的实现示例,以WINFORM应用程序为例,在C#应用程序中调用PYTHON程序,具有一定的参考价值,感兴趣的可以了解一下... 目录窗口程序类进程信息类 系统设置类 以WINFORM应用程序为例,在C#应用程序中调用python程序