OpenAI新版4o逆袭-重返大模型竞技场榜首

OpenAI新版4o逆袭-重返大模型竞技场榜首

作者:news 发表时间:2025-08-16
直线上冲!“牛市旗手”券商ETF(512000)飙涨2.7%,接力新高!长城证券3连板专家已经证实 银行全线下挫,百亿银行ETF(512800)罕见领跌2%,溢价资金狂涌,机构:银行绝对收益持续 江苏球迷专属!宁波银行宁苏锡三城联动打造“苏超能量站”这么做真的好么? 吉利汽车中报:核心利润大涨102% 全年销量剑指300万 协同整合释放高质量发展红利后续反转来了 威海市委书记闫剑波莅临光威复材调研联系分包项目科技水平又一个里程碑 每日投行/机构观点梳理(2025-08-15)太强大了 龙国联通与伊利集团签署战略合作协议科技水平又一个里程碑 阿里AI To C业务启动近千人招聘,涉夸克、通义、AI眼镜等业务实测是真的 【中广聚焦】解局! 为何多家广电公司频繁来华数调研交流是真的? 龙国首都星巴克基金会五周年:累计投入超4100万元、惠及20万人后续来了 记者时时跟进 7月份国民经济数据发布,一起看看→学习了 中金:维持惠理集团跑赢行业评级 升目标价至3.0港元后续会怎么发展 【中广聚焦】解局! 为何多家广电公司频繁来华数调研交流实垂了 华润置地的“济南答案”:望雲首开零分销狂销8亿,靠什么让高端客群“闭眼入”?又一个里程碑 星展:升万洲国际目标价至9.6港元 下半年前景稳健是真的吗? 中银国际:维持五矿资源“买入”评级 目标价升至5.25港元太强大了 亿航智能薛鹏:相比直升机,eVTOL有三大优势后续反转来了 圣诺生物:上半年归母净利润同比增长308.29% 中加基金配置周报|国内出口维持韧性,OpenAI发布新一代大模型反转来了 茅台上市500ml四瓶整箱装:价格卡位万元内,瞄准中秋消费 红旗连锁上半年营收下降 7.3%!连续13 年增长态势遇转折,何解?专家已经证实 邦达亚洲:美元指数持续下行 黄金小幅收涨实时报道 光迅科技:1.6T光模块产品已具备批量交付能力科技水平又一个里程碑 马斯克警告:在特斯拉实现大规模自动驾驶前平仓空头 否则会受重创实垂了 亿航智能薛鹏:相比直升机,eVTOL有三大优势后续反转 光迅科技:1.6T光模块产品已具备批量交付能力 起底网贷黑产(上)|直击现场!揭秘律所的“债务托管”生意 外卖大战不能简单定义为“内卷式竞争”,专家呼吁包容审慎监管学习了 晶华微索赔递交立案,投资者还可加入维权实测是真的 百隆东方:上半年归母净利润3.9亿元,同比增长67.53% 长江有色:14日氧化铝期价跌2.47% 日内成交表现尚可是真的? 挪威今年油气投资预计将达到270亿美元峰值太强大了 外卖大战不能简单定义为“内卷式竞争”,专家呼吁包容审慎监管 卢伟冰回应小米手机东南亚第一:市场份额不是最关键,高端机和苹果三星还有较大差距太强大了 起底网贷黑产(上)|直击现场!揭秘律所的“债务托管”生意后续反转来了 华铭智能索赔持续推进,部分案件已在审理中专家已经证实 比亚迪华为等 149 家储能企业发声反内卷:避免不理性低价行为,防范“劣币驱逐良币”后续来了 夯实数智基础 东方通云原生中间件平台助力企业构建坚实云原生能力体系又一个里程碑 挪威今年油气投资预计将达到270亿美元峰值科技水平又一个里程碑 仁智股份诉讼时效尚未到期,已有胜诉案例维权还可加入这么做真的好么? 创新国际港股IPO:2025年前五个月毛利率净利润率双降 关联方贡献近六成收入 与南山铝业国际差距显著反转来了 起底网贷黑产(上)|直击现场!揭秘律所的“债务托管”生意记者时时跟进 上市首日暴涨超200%!这家加密货币交易所什么来头? 长江有色:14日铜价上涨 低价货源成交稍显活跃后续会怎么发展 期市晨昏线8.14(晚):国际油价跌破关键价格关口,重点关注!秒懂

在万众瞩目的新加坡OpenAI开发者日活动中,ChatGPT再度展现了其非凡的实力。最新版本的ChatGPT-4o(简称4o)在备受关注的大模型竞技场中一举夺魁,将此前占据榜首的Gemini拉下了马。

OpenAI新版4o逆袭

此次4o的更新重点在于“创意写作能力”,据官方介绍,新版本能够生成更加自然、吸引人且有针对性的文本,显著提升了文本的相关性和可读性。4o在处理上传文件方面也进行了优化,能够提供更深入的见解和更全面的回应。

o1的核心贡献者Karina Nguyen对此次更新表示了肯定。她指出,作为Canvas功能的一部分,改进写作是一个顶级用例,有望改变人机协作的方式,让创作过程更具创造性。尽管她承认这一研究问题非常主观且开放,但至少在写作方面取得的进展对于实现AGI(通用人工智能)的创造性智能至关重要。

OpenAI新版4o逆袭

在大模型竞技场的创意写作分榜上,新版4o(ChatGPT-4o-1120)的得分从上一个版本的1365跃升至1402,进步显著。同时,在代码能力、数学能力、困难任务以及风格控制等多个方面,4o也均有所提升,成功从之前的第二名跃升至第一名。

OpenAI新版4o逆袭

然而,尽管4o的表现亮眼,但网友们对于OpenAI迟迟未推出o1满血版仍表示不满。一些网友在社交媒体上直言,希望OpenAI能够尽快放出o1,与近期备受瞩目的DeepSeek等模型进行正面较量。甚至有网友调侃称,OpenAI的更新策略似乎就是每当有其他模型登上榜首时,便迅速推出新版本夺回第一。

OpenAI新版4o逆袭

尽管4o在创意写作方面取得了显著进步,但仍有网友对其生成的内容进行了测试,并发现系统仍能够准确识别出这些内容为AI所写。不过,也有网友对4o的更新进行了深入研究,并发现OpenAI在系统提示词方面进行了优化,新增了一道护栏,以确保ChatGPT在敏感话题上不会胡说八道。

OpenAI新版4o逆袭

目前,新版4o已在大模型竞技场中上线,感兴趣的读者可以前往体验并分享自己的感受。对于未来OpenAI是否会推出o1满血版,以及它将如何与其他模型进行竞争,我们拭目以待。

相关文章