来源:星火智游网 责编:网络 时间:2026-02-16 09:20:02
法国人工智能初创公司Mistral AI近日宣布推出全新的语音转文字模型系列——Voxtral Transcribe2。这一系列包含两款针对不同应用场景优化的模型,旨在解决语音交互中的高延迟和成本痛点。
其中,最受关注的是名为 Voxtral Realtime 的实时转录模型。该模型拥有4B(40亿)参数规模,采用创新的流式架构。其核心亮点在于极致的响应速度:模型可以在音频输入的瞬间同步进行转录,官方数据显示其转录延迟已被压缩至200ms(0.2秒)以下。这意味着在实时对话或同声传译场景中,用户几乎感受不到处理停顿。为了促进开发者社区的生态建设,Mistral AI已以 Apache2.0协议正式开放了该模型的权重。
另一款模型 Voxtral Mini Transcribe V2 则主打大批量处理与极高性价比。该模型专门为处理长音频设计,单次请求即可支持长达3小时的录音文件。在准确率表现上,Mistral 官方表示该模型已超越了 GPT-4o mini Transcribe 和 Gemini2.5Flash。
在语言支持与成本方面,两款新模型均具备出色的普适性,支持包括中文在内的13种主流语言。定价策略也十分具有竞争力:离线批处理版 API 价格为每分钟0.003美元,而追求极致性能的实时版 API 价格则为每分钟0.006美元。
划重点:
⚡ 极低延迟: Voxtral Realtime 模型将转录延迟降至200ms 以内,支持音频即时转录,且已开源模型权重。
天堂vs日本vs中国美国vs欧洲观看免费在各大网络平台上引起了极大的关注,电影爱好者纷纷热议如何更好地获取这
女生裸妆拔萝卜网站的出现为广大女性提供了一个学习和交流化妆技巧的平台。在这里,用户可以轻松获取到各类
父母儿女四人大联欢免费观看乃盛事也,四人共聚一堂,欢声笑语不断。此活动充满了亲情与温馨,令人心驰神往。通过分享各自的趣事与经历,亲
成品精品1688免费平台为众多商家提供了丰富的产品选择,助力他们在激烈的市场竞争中脱颖而出。越来越多的创业者和店主开始利用1688这一电商平台,
延迟低于 0.2 秒!Mistral AI 发布 Voxtral Transcribe 2 语音模型,支持中文实时转录
笃心笃行三十载,vivo以用户导向照亮创新征途
河南人工智能公共服务平台发布 人才培养工程启航 共筑中部创新高地
贾跃亭携FF发布三大系列EAI机器人,全尺寸职业型定价34990美元起引关注
西门子收购Canopus AI,借AI技术赋能Calibre平台攻克亚纳米级工艺难题
鼎汉技术与深圳先进院携手 聚焦AI与具身智能共筑智造创新联合体
2025款腾势N7来袭!轿跑造型吸睛,科技内饰豪华,续航动力双在线
联发科:人工智能导致供应链成本上升 将调整定价
被AI对手暗讽给ChatGPT加广告 奥特曼:不是一个量级
苹果论文又炸场!Qwen3-Coder 被“特调”后,UI 生成能力竟超越了 GPT-5?