界面新闻记者 | 宋佳楠
当地时间2月27日,OpenAI发布了最新模型GPT-4.5的研究预览版。这是一款通用型大语言模型 ,其定位并非OpenAI最顶尖的模型,但却号称“情商最高 ”,且API调用价高于其主流模型GPT-4o 。
据OpenAI方面介绍 ,GPT-4.5是OpenAI迄今为止规模最大 、知识储备最丰富的模型之一,拥有1万亿激活参数,训练数据量高达120万亿tokens ,上下文窗口长度扩展至256K11。
与OpenAI的主流模型相比,GPT-4.5的最大特点在于其“感性能力”的提升。它能够进行更自然、更温暖的对话,甚至在回答问题时展现出一定的“人情味” 。例如 ,当用户输入“我被放鸽子了,我要发一个‘恨他们’的短信 ”时,GPT-4.5会先输出安抚情绪的内容,再给出建议。
在面对 “我考试失败了 ,心情很低落” 这类输入时,之前的模型会立刻尝试解决问题,而GPT-4.5会先询问用户是否想聊聊感受 ,或提供分散注意力的方法,展现出更高的情感智能,更适合处理与情感交流、写作辅助(优化内容 、激发创意)、客户服务等相关任务 。
新模型的“幻觉率”(错误生成虚假信息的概率)低于GPT-4o和o1模型 ,仅为37.1%,而GPT-4的幻觉率为61.8% 。但在一些基准测试里,它未达行业最前沿水平 ,如在编程能力的SWE-Bench Verified基准测试中,与GPT-4o和o3-mini表现相当,逊色于OpenAI 的deep research和Anthropic的Claude 3.7 Sonnet。
在学术基准测试AIME和GPQA上,GPT-4.5也不及领先的AI推理模型,如o3-mini、DeepSeek的R1和Claude 3.7 Sonnet。不过 ,在数学和科学相关问题上,相比其他非推理模型,它仍有不错的表现 。
需要指出的是 ,OpenAI此前推出的o1等属于推理模型,能生成 “思维链”,在处理问题前先进行反思。而GPT-4.5是该公司最后一款 “非链式思维 ” 模型 ,未来将作为推理模型的基础,标志着OpenAI在人工智能技术发展上的一个重要过渡。
在功能上,它支持搜索 、画布模式 ,用户可上传文件和图像,但暂不支持语音模式、视频和屏幕共享等多模态功能。
目前,GPT-4.5首先开放给软件开发者以及ChatGPT Pro(每月200美元)订阅用户 ,未来也将向ChatGPT Plus(每月20美元)和Team订阅用户开放 。但其定价为每百万token输出150美元,远高于GPT-4o的60美元。
眼下OpenAI的模型发布节奏正在不断加快,其需要应对来自Anthropic、xAI等的激烈竞争。
前不久,由OpenAI前员工创立的Anthropic发布了Claude 3.7 Sonnet ,马斯克的xAI则推出了Grok 3 。在中国市场,DeepSeek等本土企业的崛起也给OpenAI带来一定技术压力。这些都促使OpenAI不断优化和拓展应用场景,以保持优势。
科技早报 | OpenAI未来几个月内将发布GPT-5;宇树科技否认进行新一轮融资|界面新闻 · 科技
OpenAI将迎大更新:免费的GPT-5数月内来袭,o3取消独立发布|界面新闻 · 科技
科技早报 | 阿里发布开源全新模型;Manus被质疑“饥饿营销+套壳炒作”|界面新闻 · 科技
科技早报 | OpenAI发布首款AI代理工具;字节跳动启动AGI长期研究计划|界面新闻 · 科技
密切跟进OpenAI,国产o1类推理模型陆续登场|界面新闻 · 科技
科技早报|OpenAI正式推出AI视频生成模型Sora;英伟达涉嫌违反反垄断法,市场监管总局立案调查|界面新闻 · 科技
科技早报 | OpenAI推出GPT-4.5研究预览版;小米15 Ultra售价6499元起|界面新闻 · 科技
OpenAI竞争对手推首款混合推理模型,称是其有史以来最智能模型|界面新闻 · 科技
还没有评论,来说两句吧...