快讯OpenAI推出具备推理能力的人工智能模型o1,在数学和编码方面表现卓越
链观CHAINLOOK消息,据 OpenAI 官方博客,OpenAI 推出具备推理能力的人工智能模型 o1,内部代号为「草莓」。OpenAI o1 可以推理复杂的任务,并解决比之前科学、编码和数学模型更难的问题。在测试中 OpenAI o1 在物理、化学和生物学等具有挑战性的基准任务上的表现与博士生类似,其在数学和编码方面表现出色。在国际数学奥林匹克(IMO)资格考试中,GPT-4o 只正确解决了 13% 的问题,而推理模型的得分为 83%,OpenAI o1 的编码能力在 Codeforces 竞赛中达到了第 89 个百分点。
作为早期模型 OpenAI o1 尚不具备 ChatGPT 的许多有用功能,例如浏览网页以获取信息以及上传文件和图像,GPT-4o 在短期内将更加强大。但对于复杂的推理任务来说,这是一个重大进步,代表了人工智能能力的新水平。鉴于此将计数器重置为 1,并将该系列命名为 OpenAI o1。医疗保健研究人员可以使用 o1 来注释细胞测序数据,物理学家可以使用 o1 生成量子光学所需的复杂数学公式,所有领域的开发人员可以使用 o1 来构建和执行多步骤工作流程。
OpenAI 还发布了 OpenAI o1-mini,这是一种更快、更便宜的推理模型,在编码方面特别有效。作为较小的模型,o1-mini 比 o1-preview 便宜 80%,这使其成为需要推理但不需要广泛的世界知识的应用程序的强大且经济高效的模型。OpenAI 计划为所有 ChatGPT 免费用户提供 o1-mini 访问权限。