GPT-5大提升,o3对抗赛夺冠,但OpenAI越来越难让人惊艳了? - 观察者
原文

2025-08-09 08:52
138
OpenAI发布了最新大模型ChatGPT-5,其在多项测试中表现出色,如数学能力测试AIME 2025满分、编程测试SWE-bench Verified得分74.9、博士水平科学知识测试GPQA Diamond得分88.4等。同时,OpenAI旗下的o3在国际象棋对抗赛中夺冠。然而,GPT-5在简单方程计算和图表生成中仍存在瑕疵,引发网友讨论。文章指出,尽管大模型能力持续进步,但进步幅度已难以带来惊艳感,可能接近现有算法范式的瓶颈。OpenAI在发布会上更多强调GPT-5的垂直场景应用能力,如生成小游戏和回答健康问题,以促进AI与人类的协作。

全部评论