百度CTO王海峰:语音能力日均调用量过100亿,AI技术在应用中进化

2023-10-09 14:40

本文主要是介绍百度CTO王海峰:语音能力日均调用量过100亿,AI技术在应用中进化,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

11月28日,百度大脑宣布语音能力引擎日均调用量已经超过100亿次,应用规模业界第一,为开发者提供了覆盖云、端、芯的全栈全场景语音开放能力,推动智能语音技术在各行业落地应用。

在当天举行的百度大脑语音能力引擎论坛上,百度大脑语音引擎全新发布和升级了14大产品内容,包括基于百度鸿鹄语音芯片的4款硬件模组、开发板及3大场景解决方案,升级了语音自训练平台、呼叫中心语音解决方案等。来自家电、农业、医疗等行业的合作伙伴代表也在现场分享了百度大脑语音技术赋能的成果。

     

▲ 百度 CTO 王海峰博士致辞

百度首席技术官王海峰博士出席论坛并致辞,他表示:“AI 技术的进化和产业赋能正向循环,相互促进,AI 在应用场景中不断进化。百度的语音技术基于深度学习和产业应用加速突破,已应用到百度 App、百度地图、小度音箱,百度输入法等百度产品,更通过 AI 开放平台赋能众多产业伙伴。百度大脑语音能力每天的调用量已经超过100亿。

现场,百度语音首席架构师贾磊正式提出基于复数 CNN 网络的语音增强和语音识别一体化端到端建模技术,该方法抛弃了数字信号处理学科和语音识别学科的各种先验假设,消除学科间壁垒,直接端到端进行一体化建模。相较于传统基于数字信号处理的麦克阵列算法,错误率降低超过30%。目前该方法已经被集成到百度最新发布的百度鸿鹄芯片中。  

▲ 百度语音首席架构师贾磊主题演讲:百度大脑语音技术的前沿进展

百度从2012年起就开始把深度学习用于中文语音搜索,成为全世界最早把深度学习技术落地工业化产品的企业之一。百度大脑目前已开放了云、端、芯包含语音识别、语音合成等全栈语音引擎能力,并广泛应用于金融、政务、文娱等多种行业和场景。

百度 AI 技术生态部总经理喻友平表示,百度大脑语音能力引擎的应用规模已达到业界第一,同时一直在积极拓展语音能力引擎生态链的建设。

 

▲ 百度 AI 技术生态部总经理喻友平介绍百度大脑语音引擎全栈开放能力

针对智能硬件设备,百度大脑重磅发布基于百度鸿鹄语音芯片的4款硬件模组、开发板,以及智能家居、智能车载、智能 IoT 设备3大端到端软硬一体远场语音交互场景解决方案,具备交互效果优异、软硬一体快速应用、广泛兼容集成门槛低等优点。

同时,在语音识别领域,全面升级短语音识别、实时语音识别能力,发布音频文件转写能力,升级可零代码提升业务术语识别率的语音自训练平台,以及呼叫中心语音解决方案;在语音合成方面,全新发布6个在线语音合成精品音库和5个离线语音合成精品音库。丰富的语音能力,助力智能硬件、互联网、呼叫中心等领域智能化升级。

▲ 嘉宾分享第一排从左至右:创维、瓴岳科技、北京子杰宝贝科技公司;第二排从左至右: 华智水稻、江西善行

论坛上,来自家居、金融、医疗、农业、公益等领域的合作伙伴,登台分享与百度大脑合作的细节,以及如何以语音技术助力自身完成智能化升级。

创维 AIoT 研究院产品经理李凯介绍:“大屏 IoT 的行业痛点在于信息检索难和设备控制操作复杂,通过增加语音交互能力,重构了整个 AIoT 设备生态的交互体验。双方在电视方面的合作成果已落地在10个电视芯片型号、2500万台电视上,助力中端及高端产品线提升了产品溢价能力。”在下一代远场语音方案中,百度鸿鹄语音芯片为创维产品带来了高性价比硬件、整合优化的软件算法等价值,双方将基于百度鸿鹄芯片展开多项产品的合作。

瓴岳科技信贷运营总监宋力现场分享了百度大脑语音技术在贷后领域的应用,依托百度大脑呼叫中心实时语音识别等 AI 服务对用户语音的准确识别,瓴岳打造了降本提效的智能机器人。通过贷后智能机器人、智能语音质检的应用,贷后人力投入降低61.47%,有效实现了合规和高效的运营体系,提高了客户体验。

北京子杰宝贝科技有限公司项目经理肖云峰在会上展现了语音技术在医疗领域的应用:“我们开发的智能录入系统在百度大脑语音自训练平台进行语音识别模型训练,识别率从80%提升至95%以上,包括医疗专业生僻词的识别,而很多厂商模型识别率都达不到这个要求。该系统有效降低了医护人员的工作强度,提升了临床护理效率。”

而在农业领域,也遇到了农业作物专业词汇语音识别率低的行业问题,对此华智生物信息技术主任龙晓波表示:“得益于百度大脑语音自训练平台使用简单、准确率高、可拓展等优点,经多次迭代我们的农业结构化性状数据语音识别准确率从71.09%提升至98.75%,采集一个测试田地性状信息从300人工时降低到160人工时,工作效率提升了一倍。”

善行智能联合创始人黄小瑰介绍了基于百度大脑语音等技术打造的小 Q 智能导盲眼镜,帮助盲人生活出行,为失能人群提供智能化的帮助。现场还发布了“因 AI 而声”公益计划:百度大脑将为提供公益性服务的公司或组织,提供语音技术免费、专属语音技术支持等福利,为特殊群体带去便利和帮助,让 AI 有温度。

▲ 百度大脑语音能力引擎论坛现场

百度大脑开放平台是国内服务规模最大的 AI 开放平台,目前已开放228项 AI 能力,拥有超过150万的开发者用户。

与会人士认为,此次百度大脑语音技术能力的全新发布和升级,为开发者和企业提供了更加完善的全栈语音引擎能力,将帮助更多用户高效打造具备语音交互能力的特色应用与产品,加快语音技术在各行各业的应用落地进程。

这篇关于百度CTO王海峰:语音能力日均调用量过100亿,AI技术在应用中进化的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/173556

相关文章

利用Python操作Word文档页码的实际应用

《利用Python操作Word文档页码的实际应用》在撰写长篇文档时,经常需要将文档分成多个节,每个节都需要单独的页码,下面:本文主要介绍利用Python操作Word文档页码的相关资料,文中通过代码... 目录需求:文档详情:要求:该程序的功能是:总结需求:一次性处理24个文档的页码。文档详情:1、每个

JS纯前端实现浏览器语音播报、朗读功能的完整代码

《JS纯前端实现浏览器语音播报、朗读功能的完整代码》在现代互联网的发展中,语音技术正逐渐成为改变用户体验的重要一环,下面:本文主要介绍JS纯前端实现浏览器语音播报、朗读功能的相关资料,文中通过代码... 目录一、朗读单条文本:① 语音自选参数,按钮控制语音:② 效果图:二、朗读多条文本:① 语音有默认值:②

Java中的Schema校验技术与实践示例详解

《Java中的Schema校验技术与实践示例详解》本主题详细介绍了在Java环境下进行XMLSchema和JSONSchema校验的方法,包括使用JAXP、JAXB以及专门的JSON校验库等技术,本文... 目录1. XML和jsON的Schema校验概念1.1 XML和JSON校验的必要性1.2 Sche

MyBatis/MyBatis-Plus同事务循环调用存储过程获取主键重复问题分析及解决

《MyBatis/MyBatis-Plus同事务循环调用存储过程获取主键重复问题分析及解决》MyBatis默认开启一级缓存,同一事务中循环调用查询方法时会重复使用缓存数据,导致获取的序列主键值均为1,... 目录问题原因解决办法如果是存储过程总结问题myBATis有如下代码获取序列作为主键IdMappe

Java中的分布式系统开发基于 Zookeeper 与 Dubbo 的应用案例解析

《Java中的分布式系统开发基于Zookeeper与Dubbo的应用案例解析》本文将通过实际案例,带你走进基于Zookeeper与Dubbo的分布式系统开发,本文通过实例代码给大家介绍的非常详... 目录Java 中的分布式系统开发基于 Zookeeper 与 Dubbo 的应用案例一、分布式系统中的挑战二

Java 缓存框架 Caffeine 应用场景解析

《Java缓存框架Caffeine应用场景解析》文章介绍Caffeine作为高性能Java本地缓存框架,基于W-TinyLFU算法,支持异步加载、灵活过期策略、内存安全机制及统计监控,重点解析其... 目录一、Caffeine 简介1. 框架概述1.1 Caffeine的核心优势二、Caffeine 基础2

使用Node.js和PostgreSQL构建数据库应用

《使用Node.js和PostgreSQL构建数据库应用》PostgreSQL是一个功能强大的开源关系型数据库,而Node.js是构建高效网络应用的理想平台,结合这两个技术,我们可以创建出色的数据驱动... 目录初始化项目与安装依赖建立数据库连接执行CRUD操作查询数据插入数据更新数据删除数据完整示例与最佳

使用Go调用第三方API的方法详解

《使用Go调用第三方API的方法详解》在现代应用开发中,调用第三方API是非常常见的场景,比如获取天气预报、翻译文本、发送短信等,Go作为一门高效并发的编程语言,拥有强大的标准库和丰富的第三方库,可以... 目录引言一、准备工作二、案例1:调用天气查询 API1. 注册并获取 API Key2. 代码实现3

PHP应用中处理限流和API节流的最佳实践

《PHP应用中处理限流和API节流的最佳实践》限流和API节流对于确保Web应用程序的可靠性、安全性和可扩展性至关重要,本文将详细介绍PHP应用中处理限流和API节流的最佳实践,下面就来和小编一起学习... 目录限流的重要性在 php 中实施限流的最佳实践使用集中式存储进行状态管理(如 Redis)采用滑动

深入浅出Spring中的@Autowired自动注入的工作原理及实践应用

《深入浅出Spring中的@Autowired自动注入的工作原理及实践应用》在Spring框架的学习旅程中,@Autowired无疑是一个高频出现却又让初学者头疼的注解,它看似简单,却蕴含着Sprin... 目录深入浅出Spring中的@Autowired:自动注入的奥秘什么是依赖注入?@Autowired