文本生成超逼真语音,ElevenLabs获8000万美元融资

2024-01-23 16:44

本文主要是介绍文本生成超逼真语音,ElevenLabs获8000万美元融资,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1月23日,文本生成语音平台ElevenLabs在官网宣布,获得8000万美元(约5.7亿元)B轮融资。本次由Andreessen


Horowitz、 Nat Friedman领投,红杉资本、 SV Angel等跟投。

用户通过文本和语音的方式在ElevenLabs平台,就能生成中文、英文、日文、韩文等29种语言以及1000多种声音,同时可以对生成语音的清晰度、风格、稳定等参数进行自定义设置。

此外,ElevenLabs在宣布融资的同时发布了新的配音工作室、语音库和移动应用三款预览产品,以巩固其在生成式AI语音领域的独角兽地位。

图片

资料显示,ElevenLabs创立于2022年4月,总部位于美国纽约,最初员工不超过10人,目前已增长至40多人。

ElevenLabs曾在2023年1月获得200万美元种子轮融资,6月21日获得1900万美元A轮融资。

ElevenLabs于2023年1月正式推出了测试产品,因简单、易用、免费等优势,其注册用户很快突破100万,目前41%的财富 500 强公司在使用其产品

包括世界上最大的有声读物出版商之一的Storytel;全球著名内容创作者平台TheSoul Publishing;

知名游戏开发商Paradox Interactive等。这些企业通过ElevenLabs平台制作有声读物、电影配音、游戏NPC的声音等。

图片


Eleven Labs核心团队

产品方面,ElevenLabs基于自研的Eleven Multilingual v2、Turbo v2等大模型,提供文本生成语音、语音生成语音、语音克隆、语音识别等特色功能。

文本生成语音:用户通过文本可直接生成中文、英文、韩文、日文等29种语言语音,同时支持跨文本语音生成。例如,上传了一段英语文本,可直接生成意大利语音。

使用方法也非常简单,先选择语音生成的类型,然后选择应用的模型、语音参数和模仿语音,再输入文本,通常几秒钟就能生成语音。

图片

虽然ElevenLabs支持中文语音,但根据「AIGC开放社区」的实际体验,其语音、语调等方面还是有很强的机器人感觉,英语和其他语种表现却很好。

语音转语音:可帮助用户将语音自动转换成别的语音,例如,上传了一段男声语音,可以自动转换成老年人的声音。

传统的语音转换方法是,需要采集音频样本,然后提取基频、共振峰、时域和频域特征等,再进行去噪、归一化,整个流程非常繁琐复杂。

而ElevenLabs可实现一键语音转换,同时支持用户对语音进行可视化控制,例如,修改强度、音峰、情感等参数。

图片

语音克隆:用户提供一段语音片段,将其上传到ElevenLabs平台。就能通过新上传的语音,创建全新的内容,整体模仿效果非常出色。

为了减少ElevenLabs平台生成一些非法语音,例如,模仿他人亲戚用于电信诈骗,ElevenLabs推出了语音识别分类功能,用户只需要上传语音便能快速识别出是真人发音或AI自动生成的,这对于提升产品的安全性非常重要。

图片

此外,为了进一步提升语音方面的功能,ElevenLabs在今天宣布推出了新的配音工作室、语音库和移动应用三款全新的预览产品。

新的配音工作室:可帮助用户为整部电影配音,并生成和编辑其转录、翻译和时间码,从而为内容制作提供更多控制。该功能主要面向长视频和影业的用户。

语音库:用户可以将自建的语音模板在语音库进行分享,当有其他用户使用时可以获得报酬。这个功能与OpenAI的自定义ChatGPT商店类似,都是鼓励开发者共同创建产品生态。

图片

移动应用:可以让用户通过移动应用中,使用ElevenLabs的产品功能。前三个月将免费为用户提供服务,目前处于申请预览版状态。

ElevenLabs首席技术官 Piotr Dąbkowski表示,通过此次 B 轮融资,ElevenLabs将巩固其在生成式AI语音领域的领导者地位。

这笔资金将用于产品研究、扩大基础设施、为特定垂直领域开发新产品,以及加强安全措施,确保以负责任和合乎道德的方式开发生成式AI技术。

本文素材来源ElevenLabs官网,如有侵权请联系删除

END

这篇关于文本生成超逼真语音,ElevenLabs获8000万美元融资的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/636880

相关文章

Python中图片与PDF识别文本(OCR)的全面指南

《Python中图片与PDF识别文本(OCR)的全面指南》在数据爆炸时代,80%的企业数据以非结构化形式存在,其中PDF和图像是最主要的载体,本文将深入探索Python中OCR技术如何将这些数字纸张转... 目录一、OCR技术核心原理二、python图像识别四大工具库1. Pytesseract - 经典O

苹果macOS 26 Tahoe主题功能大升级:可定制图标/高亮文本/文件夹颜色

《苹果macOS26Tahoe主题功能大升级:可定制图标/高亮文本/文件夹颜色》在整体系统设计方面,macOS26采用了全新的玻璃质感视觉风格,应用于Dock栏、应用图标以及桌面小部件等多个界面... 科技媒体 MACRumors 昨日(6 月 13 日)发布博文,报道称在 macOS 26 Tahoe 中

Python实现精准提取 PDF中的文本,表格与图片

《Python实现精准提取PDF中的文本,表格与图片》在实际的系统开发中,处理PDF文件不仅限于读取整页文本,还有提取文档中的表格数据,图片或特定区域的内容,下面我们来看看如何使用Python实... 目录安装 python 库提取 PDF 文本内容:获取整页文本与指定区域内容获取页面上的所有文本内容获取

Python实现自动化Word文档样式复制与内容生成

《Python实现自动化Word文档样式复制与内容生成》在办公自动化领域,高效处理Word文档的样式和内容复制是一个常见需求,本文将展示如何利用Python的python-docx库实现... 目录一、为什么需要自动化 Word 文档处理二、核心功能实现:样式与表格的深度复制1. 表格复制(含样式与内容)2

python如何生成指定文件大小

《python如何生成指定文件大小》:本文主要介绍python如何生成指定文件大小的实现方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录python生成指定文件大小方法一(速度最快)方法二(中等速度)方法三(生成可读文本文件–较慢)方法四(使用内存映射高效生成

详解如何使用Python从零开始构建文本统计模型

《详解如何使用Python从零开始构建文本统计模型》在自然语言处理领域,词汇表构建是文本预处理的关键环节,本文通过Python代码实践,演示如何从原始文本中提取多尺度特征,并通过动态调整机制构建更精确... 目录一、项目背景与核心思想二、核心代码解析1. 数据加载与预处理2. 多尺度字符统计3. 统计结果可

Maven项目中集成数据库文档生成工具的操作步骤

《Maven项目中集成数据库文档生成工具的操作步骤》在Maven项目中,可以通过集成数据库文档生成工具来自动生成数据库文档,本文为大家整理了使用screw-maven-plugin(推荐)的完... 目录1. 添加插件配置到 pom.XML2. 配置数据库信息3. 执行生成命令4. 高级配置选项5. 注意事

MybatisX快速生成增删改查的方法示例

《MybatisX快速生成增删改查的方法示例》MybatisX是基于IDEA的MyBatis/MyBatis-Plus开发插件,本文主要介绍了MybatisX快速生成增删改查的方法示例,文中通过示例代... 目录1 安装2 基本功能2.1 XML跳转2.2 代码生成2.2.1 生成.xml中的sql语句头2

使用Python自动化生成PPT并结合LLM生成内容的代码解析

《使用Python自动化生成PPT并结合LLM生成内容的代码解析》PowerPoint是常用的文档工具,但手动设计和排版耗时耗力,本文将展示如何通过Python自动化提取PPT样式并生成新PPT,同时... 目录核心代码解析1. 提取 PPT 样式到 jsON关键步骤:代码片段:2. 应用 JSON 样式到

SpringBoot实现二维码生成的详细步骤与完整代码

《SpringBoot实现二维码生成的详细步骤与完整代码》如今,二维码的应用场景非常广泛,从支付到信息分享,二维码都扮演着重要角色,SpringBoot是一个非常流行的Java基于Spring框架的微... 目录一、环境搭建二、创建 Spring Boot 项目三、引入二维码生成依赖四、编写二维码生成代码五