OpenAI 正式推出o1-preview:AI 智慧大升级!
人工智慧领域的领头羊OpenAI 于本周四发布了最新AI 模型「o1-preview」。这款新模型强调在解答用户问题前「多花点时间思考」,使其能更好地解决复杂的多步骤问题,尤其是在程式编写与数学题目方面表现尤为出色。
全新训练方式,准确度大提升
o1 模型采用了一种全新的训练方式,透过「强化学习」技术教导系统逐步解决问题。根据OpenAI 研究主管Jerry Tworek 的说法,o1 使用了特别为它量身订做的训练数据集,并透过「思维链」来处理问题,让AI 可以像人类一样进行逻辑推理。这种新方法不仅让模型的准确度大幅提升,还减少了过去常见的「AI 幻觉」现象。

数学与编程能力一流
根据OpenAI 首席研究官Bob McGrew 的介绍,o1 在数学与编程领域展现出惊人的能力。在国际数学奥林匹克竞赛的资格考试中,o1 的答对率高达83%,远远超过前代GPT-4o 的13%。此外,o1 在著名的线上程式竞赛Codeforces 中的表现也名列前茅,达到参赛者的前89%。这证明了它在解决复杂问题上的强大推理与计算能力。
ChatGPT Plus 用户抢先体验
目前,ChatGPT Plus 和Team 用户已经能抢先体验到o1-preview 和o1-mini 两个版本,而企业和教育用户则将于下周初获得使用权限。值得一提的是,OpenAI 计划未来将o1-mini 免费开放给所有ChatGPT 用户使用,敬请期待!
使用成本较高,但值得期待
虽然o1 模型在某些方面表现亮眼,但相较于GPT-4o,使用成本确实较高。 o1-preview 的API 使用成本为每百万输入词元15 美元,输出词元为60 美元,这分别是GPT-4o 的两倍与三倍。对于开发者来说,这意味着要为更强大的推理能力支付更高的代价。

功能部分不及GPT-4o,但具里程碑意义
需要注意的是,o1 模型在某些方面(如事实性知识、网页浏览、文件和图像处理)还不及GPT-4o。然而,OpenAI 将这次的发展视为人工智慧迈向类人推理能力的重要一步,并将计数器重设为「1」,象征AI 能力的新起点。
OpenAI 认为,o1 模型的推出代表了人工智慧在推理任务上的重大进步,为未来更多复杂的AI 应用打下坚实基础。
未来展望
OpenAI 计划在未来的更新版本中进一步提升o1 模型在物理、化学和生物学等学科的推理能力,并预计这些能力将达到与博士生相当的水准。这一系列进展势必让OpenAI 继续领跑全球人工智慧技术的最前沿。

