OpenAI发布了最新大模型ChatGPT-5，其在多项测试中表现出色，如数学能力测试AIME 2025满分、编程测试SWE-bench Verified得分74.9、博士水平科学知识测试GPQA Diamond得分88.4等。同时，OpenAI旗下的o3在国际象棋对抗赛中夺冠。然而，GPT-5在简单方程计算和图表生成中仍存在瑕疵，引发网友讨论。文章指出，尽管大模型能力持续进步，但进步幅度已难以带来惊艳感，可能接近现有算法范式的瓶颈。OpenAI在发布会上更多强调GPT-5的垂直场景应用能力，如生成小游戏和回答健康问题，以促进AI与人类的协作。

GPT-5大提升，o3对抗赛夺冠，但OpenAI越来越难让人惊艳了？ - 观察者
原文

2025-08-09 08:52

138

GPT-5大提升，o3对抗赛夺冠，但OpenAI越来越难让人惊艳了？ - 观察者原文

相关文章

全部评论

GPT-5大提升，o3对抗赛夺冠，但OpenAI越来越难让人惊艳了？ - 观察者
原文