来源:星火智游网 责编:网络 时间:2025-04-23 16:22:52
3月6日,出门问问(Mobvoi)联合香港科技大学、上海交通大学、南洋理工大学、西北工业大学等顶尖学术机构,共同开源新一代语音生成模型Spark-TTS,并重磅推出其商业化高品质TTS引擎——TicVoice7.0。作为出门问问第七代TTS引擎,TicVoice7.0在语音生成领域实现了重大突破,开启了全新的语音生成范式。
TicVoice7.0的核心优势在于其创新的语音编码方式和建模结构。该引擎采用BiCodec编码技术,将语音编码为互补的两部分:固定序列长度的Global Token和低码率的Semantic Tokens。Global Token负责建模时序无关的全局特征,如音色,确保语音生成的全局可控性;Semantic Tokens则以wav2vec2.0提取的特征为输入,编码与文本紧密相关的信息,确保语义的强相关性。这种设计不仅解决了传统语音编码中存在的问题,还实现了语音token建模与文本token建模的高度统一,使语音生成更加高效且可控。
基于这一创新,TicVoice7.0展现出卓越的语音克隆能力和情感表现力。它能够在3秒内敏锐捕捉声纹特征,让AI不仅能“说人话”,还能模仿人类的叹息、停顿等细微情感表达。相比上一代语音大模型,TicVoice7.0在音色相似度、情感表现及稳定性上均有显著提升,国际通用MOS评分从3.9提升至4.2,情感表现力更强,听感更自然、悦耳且稳定。
此外,TicVoice7.0在个性化定制方面也表现出色。用户可以通过调整性别、语速、基频等多种属性,精准塑造独特的声音风格。在“至臻Pro-精品发音人”定制方面,用户仅需提供20-200句语料,即可获得播音级专业配音体验,国际通用MOS评分从4.3提升至4.7,达到广播级水平,为影视、游戏等场景提供了专业级的语音生成解决方案。
目前,出门问问已将TicVoice7.0落地于旗下AI配音产品“魔音工坊”,为用户带来更好的服务和体验。该引擎不仅在客服、有声书、情感直播、影视解说等应用场景中表现出色,还通过开源生态与产学研深度协同,为行业发展注入了新动能。
自来也和纲手拔萝卜配音声音以其独特之韵味,令众人潜心于二者之互动。二者之声,乃是共鸣之道,情感之流,使人宛如置身于其境。二人虽在不
在当今这个信息爆炸的时代,网上的娱乐内容琳琅满目,其中漫画作为一种轻松、幽默的艺术形式,受到了众多年轻人的喜爱。尤其是歪歪㊙️羞羞
秋蝉漫画入口页面弹窗下拉式者,乃近来网络之新兴形式,旨在为众多漫画爱好者提供更加便捷之浏览体验。此一设计,非但省却繁杂之操作,且以
日产不断在汽车技术的创新上探索,2023年的无人区一线、二线和三线标志着无人驾驶技术的新阶段。在全球倡导绿色出行和智能交通的大背景下,
出门问问推出TicVoice 7.0版本 实现超自然语音克隆及跨语言生成新功能
Portkey AI Gateway:便捷集成多种大型语言模型的开源人工智能平台解决方案
SiMa.ai 荣获《福布斯》最佳初创企业雇主奖,连续第三年引领行业标准
月圆之夜最新兑换码汇总与使用技巧大揭秘,快来看看你获得了哪些福利吧
开源中国顺利完成数亿元C轮融资,推动AI战略布局加速发展
德鲁伊探秘:掌握自然力量的守护者指南与策略分享
揭秘《这就是江湖》前期最强T0职业到底是什么,谁能称霸江湖?
英雄联盟小丑:在欺骗与智慧中游刃有余的传奇角色
腾讯推出HunyuanVideo-I2V图生视频模型,新增对口型等多种互动玩法
剑侠情缘3单机版:探索武侠世界中的深情旅程与人生羁绊