关闭广告

IDEA研究院发布LEMAS:首个15万小时多语言语音数据集

科技行者84人阅读


科技发展到今天,人工智能已经能够模仿人类的声音说话了。然而,如果你曾经尝试过让AI说其他语言,比如让一个英语AI说中文,你可能会发现它的口音怪异,发音不准,甚至完全听不懂在说什么。这就像是一个只会说英语的人硬要说中文,结果说得让人啼笑皆非。这背后的根本问题是什么呢?缺乏高质量的多语言语音数据。

由国际数字经济研究院(IDEA)主导的研究团队最近发表了一项突破性成果,这项研究发表于2025年1月的arXiv预印本服务器上,论文编号为arXiv:2601.04233v1。感兴趣的读者可以通过这个编号查询完整论文。研究团队构建了一个名为LEMAS的庞大语音数据集,包含超过15万小时的多语言语音数据,覆盖10种主要语言,并且每个词都有精确的时间戳标注。基于这个数据集,他们还开发了两个强大的AI模型:LEMAS-TTS和LEMAS-Edit,前者专门负责语音合成,后者专门负责语音编辑。

为了理解这项研究的重要性,我们可以把语音AI比作一位多语言播音员。传统的播音员要想掌握多种语言,需要大量的训练素材和精确的指导。同样,AI要想说好多种语言,也需要海量的高质量语音数据作为"教材"。但现有的多语言语音数据存在许多问题:要么

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

保时捷4S店暴雷背后 两记“暴击”都是新势力给的

小李车评李建红 浏览 108

东京车展首发 曝丰田世极轿跑SUV概念车官图

车质网 浏览 225

全球最大、国内首制万吨级纯电动智能海船“宁远电鲲”号开启海试

IT之家 浏览 65

深圳“AI+政务”方案重磅发布:以后办业务,一句话的事!

南方都市报 浏览 1

借小贝之力,三狮欲赴迈阿密集训

体坛周报 浏览 229

奥巴马意外现身 庆祝胜利

参考消息网 浏览 181

专家:高市早苗跟台湾关系较密切 会让大陆比较担忧

澎湃新闻 浏览 212

特朗普:内塔尼亚胡执政前景“存在不确定性”

环球网资讯 浏览 236

阔腿裤失宠了?这4条裤子承包你整个春天的时髦!

LinkFashion 浏览 14

E句话| 姐有新恋情啦?

仙女事件簿 浏览 242

1.5亿利润与12亿负债,祥源文旅为何景区造血,债务“起飞”?

华夏时报 浏览 1898

世界排名升至第2!莫雷加德创生涯新高,力压林诗栋雨果张本智和

乒谈 浏览 0

杨天真冷漠背后:杨子姗6年贡献不足,解约时连20字祝福都吝啬!娱乐圈价值论太扎心

阿废冷眼观察所 浏览 285

推广中奖名单-更新至2025年12月19日推广

黎贝卡的异想世界 浏览 98

老兵们打赢了第一仗,但真正的战争是整个赛季

体坛周报 浏览 223

巴军方称已列装中国制造的直-10ME攻击直升机 国防部回应

环球网资讯 浏览 319

散户转移战场、交易量枯竭:加密行业的“静默调整期”

智通财经 浏览 60

张馨予晒妈妈织的围巾!被称呼为宝宝好幸福

阿雹娱乐 浏览 94

年龄差19岁,这对姐弟恋又给内娱上了一课!

伊周潮流 浏览 137

险企投资收益波动加大 业绩分化利润水平提升

证券市场周刊 浏览 229

翟佳宁,“恶狠狠”讲笑话,得了脱口秀冠军

艳姐的搞笑视频 浏览 246
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4