来源:星火智游网 责编:网络 时间:2025-04-23 14:34:42
人工智能初创公司 Cohere 的非营利研究实验室本周发布了一款多模态 “开放” AI 模型 ——Aya Vision。该实验室声称,该模型在行业内处于领先地位。
Aya Vision 能够执行多项任务,包括撰写图片说明、回答与照片相关的问题、翻译文本以及生成23种主要语言的摘要。Cohere 表示,他们通过 WhatsApp 免费提供 Aya Vision,希望能让世界各地的研究人员更方便地获取技术突破。
Cohere 在其博客中指出,尽管人工智能已经取得了显著进展,但在不同语言之间的模型表现仍存在很大差距,尤其是在涉及文本和图像的多模态任务中。“Aya Vision 的目标就是帮助缩小这一差距。”
Aya Vision 有两个版本:Aya Vision32B 和 Aya Vision8B。更为先进的 Aya Vision32B 被称为 “新边界”,在某些视觉理解基准测试中表现超越了体量为其两倍的模型,包括 Meta 的 Llama-3.290B Vision。同时,Aya Vision8B 在某些评估中表现也优于一些体量为其十倍的模型。
这两个模型在 AI 开发平台 Hugging Face 上以 Creative Commons4.0许可证的形式提供,用户需遵循 Cohere 的可接受使用附录,且不可用于商业应用。
Cohere 表示,Aya Vision 的训练采用了一种 “多样化的” 英语数据集,实验室将这些数据集翻译后,使用合成标注进行训练。合成标注是指由 AI 生成的标注,有助于模型在训练过程中理解和解释数据。尽管合成数据存在潜在缺点,但像 OpenAI 等竞争对手也在越来越多地使用合成数据来训练模型。
Cohere 指出,使用合成标注训练 Aya Vision 使得他们能够减少资源的使用,同时仍能取得竞争力的表现。“这展示了我们对效率的重视,利用更少的计算资源实现更多成果。”
为了进一步支持研究界,Cohere 还发布了一套新的基准评估工具 ——AyaVisionBench,旨在考察模型在视觉与语言结合任务中的能力,如识别两张图像的差异和将屏幕截图转换为代码。
当前,人工智能行业正面临所谓的 “评估危机”,这主要源于流行基准的广泛使用,这些基准的总分与大多数 AI 用户关心的任务的能力相关性较差。Cohere 声称,AyaVisionBench 为评估模型的跨语言和多模态理解提供了一个 “广泛且具有挑战性” 的框架。
官方博客:https://cohere.com/blog/aya-vision
划重点:
🌟 Aya Vision 模型被 Cohere 称为行业最佳,能够执行多种语言和视觉任务。
💡 Aya Vision 有两个版本,分别为32B 和8B,表现超越体量更大的竞争模型。
🔍 Cohere 还发布了新的基准评估工具 AyaVisionBench,旨在改善 AI 模型评估问题。
随着移动互联网的迅速发展,各类应用程序不断涌现,丰富了人们的日常生活。幸福宝8008app作为一款颇受欢迎的应用,不仅提供了多个功能,还
魅影直播间在B站的直播功能近年来逐渐受到广大用户的青睐。这不仅是因为平台的流量优势,更重要的是其提供了丰富的互动体验,这让主播与观
化学是一个充满神奇与魅力的领域,尤其是在探索金属元素及其化合物时,更是让人感受到无尽的惊喜。今天,我们将聚焦在“钢钢钢钢钢钠好多水
小莫烧麦原唱歌曲mp3免费听,此曲乃音韵之美,深得人心。诸君可于互联网上寻觅此曲之音频,多方平台齐聚,或可免费聆听,畅享其中妙趣。小
Cohere推出全新多模态人工智能模型Aya Vision,提供32B与8B两个版本供用户选择
谷歌推出Whisk Animate预览版:轻松将图片转换为 8 秒精彩动画短片
LOL凯哥:在召唤师峡谷里挥洒策略与幽默的双重天才
遇到想不想修真版本更新失败的情况该如何应对和解决问题呢?
全球首款5G-A人形机器人“夸父”在MWC盛大亮相,获国王亲自点赞称赞
江湖经济型无中拳为何展现出强大的实力,深度解析其背后的原因
英国监管机构正式批准微软与OpenAI之间的合作协议,将推动人工智能技术的发展与应用
想要深入修真论道大会的各种玩法及攻略分享,带你玩转修真世界
奇迹暖暖14-3关卡详细攻略与搭配技巧分享,助你轻松通关
如何在江湖中提高摆摊的性价比,让每一笔投入都能获得最大的回报与收益