来源:星火智游网 责编:网络 时间:2026-02-23 13:55:02
2 月 6 日消息,OpenAI 昨日(2 月 5 日)发布公告,宣布推出 GPT-5.3-Codex,宣称这是其迄今最强的 AI 智能体编程模型。
附上相关基准测试结果如下:
在 SWE-bench Pro(公开版)测试中,该模型得分 56.8%,超越了前代的 56.4%;
在 Terminal-Bench 2.0 测试中,其得分从前代的 64.0% 大幅跃升至 77.3%;
最为显著的是在 OSWorld-Verified 智能体计算机操作基准测试中,得分从 38.2% 飙升至 64.7%,表明其在复杂环境下的操作能力实现了质的飞跃。
官方数据显示,该模型不仅在多项编程基准测试中创下新高,运行速度也比前代 GPT-5.2-Codex 提升了 25%。
OpenAI 致力于将 GPT-5.3-Codex 打造为更优秀的开发者协作工具。新模型支持用户在任务执行过程中进行“引导与交互”,且不会导致上下文丢失。
在 Codex 应用中,模型会高频更新工作进度,允许开发者实时提问、讨论方案并修正方向。官方博文指出,Codex 正从单一的编程智能体演变为更通用的计算机协作者,大幅降低了构建应用的门槛。
GPT-5.3-Codex 目前已全面向 ChatGPT 付费用户开放,涵盖 Plus、Team 及 Enterprise 等订阅计划。用户可通过 Codex 应用、命令行工具(CLI)、IDE 扩展插件及网页端立即访问,API 版本也将在近期上线。(故渊)
成品精品1688免费为广大消费者提供了便利的购物体验,通过这个平台,用户可以轻松找到心仪的精品商品。无论�
自来也和纲手拔萝卜配音声音以其独特之韵味,令众人潜心于二者之互动。二者之声,乃是共鸣之道,情感之流,使人宛如置身于其境。二人虽在不
天堂极品mv自推出以来,引发了广泛的关注与热议。这部音乐视频不仅在视觉效果上给人带来了极大的震撼,歌曲的旋律也异常动人,伴随其独特的叙事
精品免费产品精品综合精品综合近年来,随着科技的发展,越来越多的精品免费产品涌现出来。这些产品以其高质量和零费用的优势,吸引了大量用户�
OpenAI最强AI智能体编程模型:GPT-5.3-Codex登场,基准测试全面霸榜
Xcode拥抱AI:接入第三方大模型,助力新手快速开发苹果应用
OpenAI GPT-5首秀生物界:AI自主操控机器人
国家超算互联网郑州核心节点试运行 3万卡国产AI算力池助力大规模计算场景
全球芯片销售今年或破万亿大关,AI助力逻辑与存储芯片双双增长
OpenAI首款AI硬件被曝名为Dime:耳机形态,有望今年发售
全新宝马i3渲染图曝光:首款纯电动3系 续航超900公里
我国生成式 AI 用户规模破 6 亿:普及率超四成,算力水平跃居全球前列
生数科技联合清华开源Motus模型,为具身智能发展提供新路径
英飞凌4月起上调电源开关与IC元件价格,AI需求增长或成涨价主因