亚马逊开发出有史以来最大的文本转语音模型
2024-02-20 14:20
2 月 18 日消息,亚马逊人工智能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在 arXiv 预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。
近年来,像 ChatGPT 这样的“大型语言模型”凭借其智能回答问题和生成高级文本的能力而备受关注。然而,人工智能也在逐步融入其他主流应用领域。在这个新项目中,研究人员尝试通过增加参数数量和扩充训练数据集来提升文本转语音应用的能力。
据IT之家了解,这个名为“可扩展流式文本转语音模型”(BASE TTS)的新模型拥有 9.8 亿个参数,并使用 10 万小时的录音(来自公共网站)进行训练,其中大部分为英语语音。研究人员还向模型提供了其他语言的单词和短语示例,使其能够正确发音一些常见的表达,例如“au contraire” 和 “adios, amigo”。
亚马逊团队还测试了使用较小数据集的模型,希望能从中发现人工智能领域所说的“涌现能力”。这种能力是指人工智能应用,无论是大型语言模型还是文本转语音模型,突然突破到更高智能水平的现象。他们发现,对于文本转语音应用而言,这种飞跃发生在参数量达到 1.5 亿的中型数据集上。
研究人员还指出,这种飞跃涉及一系列语言属性,例如使用复合名词、表达情感、使用外语词、应用语音学和标点符号以及正确强调句子中的关键词等能力。
研究团队表示,出于对潜在滥用风险的担忧,BASE TTS 将不会向公众开放,他们计划将其作为学习应用,并期望将学到的知识应用于改善文本转语音应用的整体音质。
-
Ao沐沐电商
6683人在用最安全S资源,100%真实手工补单,提升店铺商品人气权重,安全稳定不降权!
-
礼品网-0.7元发全国
29080人在用低至0.7元发全国,真实物流,真实礼品,真实派送,提供底单,假一罚十,超时包赔,客服在线,全年无休!
-
柚子花
39854人在用【安全补单资源】100%真实人工补单,支持多渠道进店,提升店铺商品人气权重,安全稳定不降权!
-
人气魔方
44463人在用100%真实购物花呗大号,7天打造爆款,安全高效不降权!
-
数据宝盒
35574人在用【实力平台推荐】20W真实买家资源,多渠道爆款计划。
-
壁虎看看
24399人在用快手短视频直播电商数据分析工具,多维度为商家提供直播达⼈带货数据及带货能力评估。
-
妙手ERP
4226人在用免费跨境电商ERP软件,支持Shopee、Lazada、TikTok等平台运营
-
熊猫岛礼品代发
30046人在用熊猫岛礼品代发平台,礼品件0.8元发全国,24小时实时物流监控保障所有快件的效率性时效性稳定性,网点充单一单一号真实包裹发货。批量下单,一键发货,每张快递单都真实打印发往全国,千万商家的共同选择。

