GPT-5.3 Instant上线:ChatGPT终于不说教了_模型_搜索_OpenAI
听雨 发自 凹非寺
量子位 | 公众号 QbitAI
好好好,OpenAI和谷歌新模型又撞车了!
3月4日凌晨,谷歌前脚刚发完Gemini 3.1 Flash-Lite,OpenAI后脚就更新了GPT-5.3 Instant。
Instant模型一般为速度优化版本,适合快速日常查询、草稿写作、即时翻译等轻量任务。
之前大家用ChatGPT可能都会感觉: 模型好用是好用,就是废话太多了。
包括也有不少网友吐槽,ChatGPT的回答生硬的铺垫太多,比如“为什么这很重要”“大局观”“不只是你一个人”等等。
好在OpenAI把这些建议都听进去了,官方表示:
我们已经清楚地听到了你们的反馈,5.3 Instant减少了尴尬感。
我们已经清楚地听到了你们的反馈,5.3 Instant减少了尴尬感。
5.3 Instant做了重点优化:更准确,更少尴尬。去掉了机械回复、冗余免责声明等“AI腔”,沟通更自然流畅,同时回答质量更精准,联网搜索和写作能力都增强了。
简单来说,就是终于学会像个正常人一样聊天了。
目前新模型已经在ChatGPT中正式上线,开发者也可通过API使用名为gpt-5.3-chat-latest的模型。
前代模型GPT-5.2 Instant则会在付费用户的旧版模型区保留三个月,6月3日退役。
最大升级:情商更高,废话更少
GPT-5.3 Instant的最大亮点在于情商更高,废话更少,回复更直接。
首先,它显著减少了不必要的拒答行为,并削减了回答开头的过度免责声明。
OpenAI后训练团队的Blair演示了一个例子,比如你跟ChatGPT开个玩笑:
我在考虑让我的狗来运营我的创业公司,你怎么看?
我在考虑让我的狗来运营我的创业公司,你怎么看?
旧模型总会额外加一句“以防万一”的提醒,好像担心用户是认真的,甚至把它当成某种求助信号。可这显然只是个玩笑。
新模型则不再那么“字面化”,而是更理解语境,甚至会给你生成几张狗狗CEO的图片,分析狗当CEO的优势。
你可以像和朋友聊天一样开玩笑,模型不会随意***设你有不良意图。
如果你想询问一些危险行为背后的原理,比如做一道物理题,计算远距离射箭的轨迹。
旧模型在这种情况下会过度强调安全问题,开头先声明“我们只能在纯粹的分析模拟语境下讨论”,默认你可能有不良动机。
但有时候咱可能只是想理解物理原理,或者讨论射箭这项运动。
新模型就会直接进入物理计算,不再加多余免责声明。它理解“远距离射箭”是运动场景,于是直接帮助优化轨迹计算。
简单来说,就是模型更能“读懂空气”,更有“人味”了。它能结合上下文语境判断出用户意图,不会再那么生硬刻板地给出免责声明。
另外,还有那个经典的例子——
为什么我在旧金山找不到爱情?
为什么我在旧金山找不到爱情?
旧模型可能会在前面啰嗦地铺垫一句:“这不是你的问题,你不是一个人……”
而新模型会直接切入主题,上来就分析为啥你找不到爱情、大家约会都有什么困难。主打一个流畅实用。
联网搜索和写作能力都增强了
GPT-5.3 Instant的联网搜索能力也有所增强。
之前的ChatGPT可能只是简单地罗列并汇总搜索信息,而且很容易出现链接堆砌或信息松散的问题。
而5.3 Instant,一来优化了联网搜索结果的整合质量,让基于网页信息的回答更加可靠;二来能够有效平衡搜索结果与自身知识储备及逻辑推理,利用既有的认知图谱为网络资讯提供深度解析。
比如问它一个问题:
2025-26赛季棒球休赛期最重要的签约是什么?它对棒球的长期前景有何重要意义?
2025-26赛季棒球休赛期最重要的签约是什么?它对棒球的长期前景有何重要意义?
旧模型给出的答案是上一个休赛期的合同解析,时效性显得比较陈旧,而且阅读起来也很像资料堆砌。
妥妥的信息搜集好手啊!学生党查资料写论文啥的更不怕了(doge
此外,5.3 Instant的升级还有一个亮点,那就是写作风格更细腻了。
比如让它写一首能触动人心的短诗:
费城的一位邮递员在他退休那天完成了他最后一次的投递工作。
费城的一位邮递员在他退休那天完成了他最后一次的投递工作。
旧模型开头就来了一句废话:“这是一首篇幅虽短却蕴含着深刻情感的诗。”
然后才开始诗歌正文,读起来嘛,也算中规中矩,不过有点意象罗列了,读着比较空泛,让人没有很印象深刻。
而新模型的结果要略好一丢丢,描绘出了很多具体细节,比如“三月的阳光透过细雨洒在砖墙上”“在默瑟街,一位女士挥手”等等,更具有生活气息。
但不得不说,第二句的“by the way”还是有点出戏的。
关于这款新模型,还有一点值得注意:其幻觉率减少了26.8%。
官方表示,内部***用了两项评估指标:
一套侧重于医疗、法律及金融等高风险领域;
另一套专门针对“幻觉”高发场景进行测试,样本取自经过脱敏处理、被用户标记为事实错误的真实对话记录。
一套侧重于医疗、法律及金融等高风险领域;
另一套专门针对“幻觉”高发场景进行测试,样本取自经过脱敏处理、被用户标记为事实错误的真实对话记录。
相比前代,GPT-5.3 Instant在使用网络搜索时,幻觉率减少26.8%;而仅靠内部知识作答时,幻觉率减少了19.7%。
用户反馈显示,在使用网络搜索回答查询时,幻觉减少了22.5%。
安全测试方面,GPT-5.3 Instant与前代相比在性内容、暴力等主题上的得分均有下降,能更好地拒绝非暴力非法活动请求,同时也加强了对情感支持和心理健康对话的处理。
OpenAI还少见地列出了新模型的一些局限性:比如它对于非英语语种会比较生硬, 在某些语言(如日语和韩语)中的回复风格可能稍显生硬,或带有刻板的直译感。
另外,虽然 GPT‑5.3 Instant的回复语调感觉上应该更加流畅,但官方表示他们会持续监控反馈并进行优化,让回答变得更自然。
不得不说一句,和隔壁谷歌的跑分碾压对比,OpenAI这次发布可以说是相当“清新脱俗”:
全程没有出现任何benchmark,主打一个不卷性能卷体验,只为了让模型更顺手、让用户体验更流畅。
One More Thing
最近GPT-5.4已经意外泄露。
泄露信息显示,GPT-5.4将支持200万tokens的上下文窗口,并引入“状态化AI”技术,实现跨会话的持久记忆功能,可保留用户工作流和工具调用状态。
另外,GPT-5.4可能新增一项功能开关,可绕过传统图像压缩机制,直接保留全分辨率的原始图像字节数据。
这意味着,GPT-5.4可能将具备像素级精准的视觉分析能力。
官方也早已按捺不住了,直接明晃晃表示:5.4的到来“比你想象的要快”。
所以GPT-5.4和DeepSeek V4,到底谁会先来?
参考链接:
[1]***s://openai***/zh-Hans-CN/index/gpt-5-3-instant/
[2]***s://deploymentsafety.openai***/gpt-5-3-instant/gpt-5-3-instant.pdf
— 欢迎AI产品从业者共建 —
📚「AI产品知识库」是量子位智库基于长期产品库追踪和用户行为数据推出的飞书知识库,旨在成为AI行业从业者、投资者、研究者的核心信息枢纽与决策支持平台。返回搜狐,查看更多
同类文章排行
- 在微软(Microsoft)工作是怎样一番体验?
- 跨平台GUI框架到底应该自绘还是原生控件绑定?
- 大三了,应该去做运维还是去J***a后端呢?
- 做个web服务器,gin框架和go-zero怎么选?
- 王冰冰好看吗?
- 数据库不就是增删改查一些数据吗?研发一个数据库到底难在哪了?
- 女朋友送的switch被亲戚要求送小孩我该怎么办?
- 很好奇,组NAS的玩家是如何解决上传速率的问题?
- 买到烂尾楼到底该有多绝望?
- 鸿蒙折叠屏笔记本为什么敢卖26999?
最新资讯文章
- ***如你是负责核弹发射的人员,一天你正在值班,突然收到了发射核弹的命令,这种情况下你会按下发射按钮吗?
- 什么是 AI Agent(智能体)?
- ***拍大尺度片子时摄影师不会看光吗?
- 如何进入开源软件世界提升自己?
- 同样是对标安卓系统,为什么谷歌的Fuchsia死了,而华为的鸿蒙却愈发壮大?
- go语言unmarshal反序列化json数据,类型不确定怎么办?
- 和女生合租,都会发生什么事情?
- 你们都用 Flutter 开发了什么 App?
- 和女生合租,都会发生什么事情?
- 为什么各大品牌内存条包装都那么low?
- 为什么 Windows 系统上的安装包有 exe 和 msi 两种格式,有什么区别?
- 拒绝情绪输出,大家觉得有什么办法可以让国足堂堂正正进入世界杯?
- 如何评价腾讯元宝桌面端使用 Rust 的 Tauri 框架?
- 如何评价B站up主***千代退网?
- 历史上有哪些来自对手的神助攻?
- 如何评价网传鸿蒙 PC 成功裸机启动 Windows ARM?
- 程序员想搭建自己的服务器求指教。?
- 轰20的亮相为什么被反复推迟?
- 妈妈的类风湿越来越严重,我总感觉快要失去妈妈了怎么办?
- 女明星穿瑜伽裤出门是什么体验?





