2025年7月18日凌晨,OpenAI推出新品ChatGPT Agent,本应是行业焦点的发布,却意外成了竞品的秀场,这款向Pro用户开放(Plus和Team用户本周一陆续开放)的新功能,还没让普通用户兴奋起来,就被各家Agent竞品盯上了。
ManusAI率先下场,连发十几条推文,将自家Agent与ChatGPT Agent逐项对比,字里行间都在暗示自己“更早、更快、更好用”,另一家只有24人的初创公司Genspark也不甘示弱,创始人Eric Jing直接晒出对比结果——同样的任务提示,Genspark用时更少、成本更低,质量还高出几倍,“我们竟然能走在OpenAI前面”,他的兴奋藏都藏不住。
这场本是巨头新品亮相的戏码,硬生生变成了竞品的“集体展示”,ChatGPT Agent到底表现如何?为何刚发布就被轮番“对比”?我们结合实测案例和多款国产AI的表现,一探究竟。
为了还原ChatGPT Agent的真实能力,我们搜集了网友实测和对比数据,从复杂任务到日常需求,看看它到底能不能担起“Agent”的名号。
博主@rowancheung给了一个具体需求:为年收入50万美元、希望30岁在温哥华退休并拥有500万美元的人,创建包含储蓄率、税务优化、投资策略的FIRE模型,还要生成可下载的PPT。
ChatGPT Agent的表现中规中矩:它自动启用虚拟电脑,搜索温哥华税法、计算储蓄额、构建投资场景,20分钟就生成了14页PPT,内容涵盖生活成本(租房2.6-3.9万加元/月、 groceries400-900加元/月)、税务分析(平均税率43.6%)、储蓄率表格(80%储蓄率对应年储蓄22.5万美元)等核心信息。
但缺点也很明显:PPT设计简陋,几乎是黑白文字,内容停留在基础计算,比如提到“90%储蓄率+7%回报率,30岁仅能积累260万美元”,却没给出更具体的优化方案,博主直言:“结果和Manus、Genspark类似,试过其他工具就很难兴奋起来,”
另一位用户让ChatGPT Agent帮忙生成特易购购物清单(含甜点),它能自主浏览网站、添加购物车,整个过程无需用户操作,但用户坦言:“如果自己做,可能更快,”
从这两个案例能看出,ChatGPT Agent确实实现了“自动化执行任务”——不用用户一步步指令,能自主调用工具完成流程,但它的短板也很突出:效率、结果质量、设计感都有提升空间,尤其对比已经成熟的竞品时,优势并不明显。
为了更客观,我们选取了Manus、Minimax、Kimi三款国产AI,用同样的任务测试,结果差距很明显。
同样是生成FIRE退休计划,Manus只用了10分钟就完成了,它的优势体现在三个方面:
设计感:PPT有色彩搭配,还会用图标和图表,比如用柱状图展示不同储蓄率的积累速度,比ChatGPT的黑白表格直观多了。
内容延伸:不仅计算储蓄额,还加入“汇率转换”(将美元收入转为加元计算)、“企业税务优化”(成立公司降低税率)等细节。
场景丰富度:在“新加坡企业办公选址”“棕榈泉网球之旅”等任务中,Manus生成的行程包含具体时间、费用(如航班UA1870,6:10起飞)、景点开放时间,甚至会用符合场景的图片当背景(比如棕榈泉任务用沙漠绿洲图)。
不过Manus也有小问题:PPT里没标注信息来源,对于需要溯源的专业场景可能不够友好。
Minimax完成FIRE计划用了近1小时,但“慢工出细活”,它不仅生成PPT,还附带一份PDF报告和在线浏览链接,内容细到让人惊讶:
• 把生活成本分成“极简”“舒适”“奢华”三档(舒适档年支出4.6万美元,包含独立2室公寓租金)。
• 计算不同储蓄率对应的退休时间(82.3%储蓄率需39岁退休)。
• 甚至加入“风险管理”章节,提醒“市场下跌20%时需暂停大额提款”。
数据可视化也是亮点:用折线图展示储蓄增长曲线,用表格对比4种提款率(3%保守型、5%激进型)的优劣,比ChatGPT的纯文字分析更有参考价值。
Kimi是唯一在接任务后先提问的AI:“你现在多大?租房还是买房?”这种“互动感”让它的结果更贴合实际。
同样的FIRE计划,Kimi的报告长达几十页:
• 明确指出“5年积累500万美元几乎不可能”(即使82%储蓄率+10%回报率,5年最多275万)。
• 细化到“每月支出上限7500元”(住房3500、食品800)。
• 连“配偶RRSP供款”“资本利得时机选择”等小众税务策略都有涉及。
最关键的是,Kimi会标注信息来源(如“数据来自CRA 2025年规定”),专业度拉满。
从ChatGPT Agent的发布和竞品反应来看,AI行业正在发生一个重要变化——从“回答问题”转向“执行任务”。
过去的AI是“问答机”:你问“怎么退休”,它告诉你“要储蓄、投资”,现在的Agent是“执行者”:你说“帮我做退休计划”,它会自己查数据、算方案、做PPT,这种转变让AI从“工具”变成“协作伙伴”。
国产AI的突围,也给行业提了个醒:用户需要的不只是“能做”,更是“做好”,速度(Manus的10分钟)、质量(Kimi的细节)、体验(Minimax的多形式输出),任何一点做到极致都能占得先机。
ChatGPT Agent或许不是“革命性产品”,但它像一声哨响——AI的竞争不再是模型参数的比拼,而是谁能更贴近真实需求,谁能成为人机交互的“主入口”,接下来,不管是OpenAI还是国产玩家,要拼的可能不只是技术,更是对“用户到底需要什么”的理解。
Snagit v2025.2.0 for Mac 最新下载和使用指南
每天吃鸡蛋的人,身体会发生哪些变化?
AutoCAD2026 中 Defpoints 图层的打印设置调整
WordPress备份神器 All-in-One WP Migration and Backup使用手册
快速将 AutoCAD 局部图纸存为单独文件的操作方法
蓝光资源基础知识
Firefox中国版停止运营后,如何备份Firefox的数据?如何下载 Firefox 国际版?
王安宇 、王玉雯主演爱情电视剧《值得爱》全26集BT迅雷下载
小蜜蜂加速器,免费订阅,体验试用再上车,仅需5元/月
Affinity 三件套 iPad 版限时免费开放,注册购买即可永久解锁(附操作指南)
AutoCAD2026中多行文字双击后没有弹出「编辑工具栏」如何恢复?
孩子几岁能用洗面奶和祛痘护肤品