实测GPT-5：写作“AI味”浓，代码“美而无用”，OpenAI为何急于打响价格战今日资讯

2025-08-09 18:08 发布时间: 4小时前 69

核心提示：GPT-5 发布后，实测发现，写作能力 " 倒退 "，编写的代码 " 美而无用 "，未达预期。在技术边际收益锐减、运营成本高企、人才流失隐忧的夹缝中，采取了向普通用户免费和远低于对手的 API 定价策略，试图让 GPT-5 成为冲击 5000 亿美金估值、争夺 B 端与 G 端市场的关键筹码。每经记者｜岳楚鹏

GPT-5 发布后，实测发现，写作能力 " 倒退 "，编写的代码 " 美而无用 "，未达预期。在技术边际收益锐减、运营成本高企、人才流失隐忧的夹缝中，采取了向普通用户免费和远低于对手的 API 定价策略，试图让 GPT-5 成为冲击 5000 亿美金估值、争夺 B 端与 G 端市场的关键筹码。

每经记者｜岳楚鹏郑雨航

在经历了无数次 " 跳票 " 后，市场翘首以盼的 GPT-5 终于登场，但迎接它的并非预想中的热烈掌声。

《每日经济新闻》记者（以下简称 " 每经记者 "）第一时间进行实测后发现，被寄予厚望的 GPT-5，其输出的文章 "AI 味 " 似乎比以往更重了。与此同时，全球用户与行业专家的反馈也颇为尖锐：GPT-5 的写作能力被指出现 " 倒退 "，编写的代码被讽刺为 " 美而无用 "，甚至在被誉为通用人工智能（AGI）终极测试的 Arc Prize 中，惨遭竞争对手马斯克旗下 Grok 4 的 " 碾压 "。

然而，在这场略显平淡甚至令人失望的技术发布背后，一个更清晰的战略转向正在浮现： 似乎不再痴迷于单纯的技术迭代本身，而是将目光更多地投向了公司的生存与商业扩张。

在技术边际收益锐减、运营成本高企、核心人才流失等多重隐忧的夹缝之中，为 GPT-5 制定了向普通用户免费开放和远低于竞争对手的 API 定价策略。这表明，GPT-5 的角色，已不再是那个惊艳世人的 " 技术奇迹 "，而是冲击 5000 亿美元估值、全力争夺 B 端（企业）与 G 端（政府）市场的关键商业筹码。

图片来源：视觉中国

" 博士级专家 " 的尴尬—— "AI 味 " 的文章与 " 美而无用 " 的代码

在 8 月 7 日的发布会上，的 CEO 山姆 · 阿尔特曼曾用三个生动的身份，类比了公司三代旗舰模型的演进：GPT-3 像是偶有灵光闪现但常伴挫败感的高中生；GPT-4 则如同具备了真实智慧与实用价值的大学生；而最新的 GPT-5，则被誉为可以按需召唤的 " 博士级专家 "，能够随时助力用户达成各种复杂目标。

声称，GPT-5 在超高难度的科学问题上刷新了世界纪录，并在与人类专家的对比测试中，有近 70% 的场景表现更优。此外，GPT-5 还与现有的 o 系列模型进行了无缝整合，能够根据任务的复杂性，自动选择最佳的推理路径。官方数据显示，GPT-5 在代码生成和写作领域的准确率均高于 GPT-4 系列，部分内部测试中的错误率甚至下降了约 80%。

为了减少备受诟病的 " 幻觉 " 问题，GPT-5 还引入了更严格的事实核查与内容过滤机制。具体来看，在联网搜索时，GPT-5 的事实错误概率比 GPT-4o 低约 45%；独立思考时，出错概率比 o3 模型低约 80%；在开放式事实性基准测试中，产生 " 幻觉 " 的数量更是比 o3 模型少了约六分之五。

在发布会上特别强调了 GPT-5 在代码生成和写作方面的能力。然而，用户的实际使用体验，似乎并未完全印证官方的说法。

首先，在写作能力上，尽管声称 GPT-5 的文笔更具 " 人味儿 "，但有用户在体验后直言，其写作能力甚至 " 退化到和 GPT-3.5 差不多 "。每经记者也要求 GPT-5 就本场发布会撰写一篇新闻报道，最直观的感受是：其输出的文章逻辑清晰，但遣词造句的模式化痕迹明显，"AI 味 " 比以前更重了。

其次，在编程方面，GPT-5 的优势也并不突出。在改进版的编程能力评估基准 SWE-bench 测试中，GPT-5 并未与竞争对手公司的 4.1 Opus 拉开显著差距。尽管在发布会上展示了令人惊艳的编程演示，但在实际应用中的效果却备受质疑。

Meta 公司的一位工程师体验 GPT-5 后在社交媒体上感叹道："GPT-5 仅用一次调用就重构了我的整个代码库：25 个工具调用，3000 多行新代码，12 个全新的文件。" 但他随即话锋一转：" 然而，这些代码都无效（无法正常工作），虽然确实写得很漂亮。"

另一位研究人员在经过一系列项目代码测试后，甚至给出了一个颠覆性的结论，他认为目前主流大模型的代码编写能力排名应该是： Opus 4.1 > -2.5-Pro > GPT-5-。从第三方的基准测试数据来看，GPT-5 相较于竞争对手的旗舰模型，其领先优势也微乎其微。根据的综合排名，GPT-5 目前虽然位列第一，但其综合得分仅比自家的老模型 o3 高出两分，比 Grok 4 仅高出一分。而在被誉为 AGI 终极测试的 Arc Prize 竞赛中，GPT-5 更是被 Grok 4 大幅超越。

"GPT-5 不太可能‘超越一切预期’，因为大模型的边际收益正在迅速递减。"AI 营销与销售专家、太和智库研究员唐兴通在接受每经记者采访时分析指出，" 我们今天所看到的所谓‘进步’，更多是来自于工程层面的调优和多模态能力的融合，而非纯粹的智能层面上的突破。"

他认为，AI 的发展正面临两大物理限制："我们必须清醒地认识到，‘数据墙’是客观存在的，高质量的公共训练数据正在被快速耗尽。同时，算力成本的指数级增长，也让过去那种‘大力出奇迹’的暴力美学难以为继。"

当技术光环褪色—— 被迫打响 " 价格战 "

在 GPT-5 的技术表现未能完全征服市场的同时，为其制定的商业策略，却显露出了前所未有的 " 杀气 "。

目前，无论是 Plus、Pro、团队版还是免费用户，均已陆续接入 GPT-5。对于广大的开发者和企业 API 用户，GPT-5 的定价策略极具竞争力：其标准版 API 的定价为每百万 token 输入 1.25 美元，输出 10 美元，这不仅低于上一代的 GPT-4o，更远低于其主要竞争对手 Opus 4.1 和 2.5 Pro。而其轻量级的 GPT-5-mini 版和 GPT-5-nano 版的价格则更为低廉。

的这套定价策略显然直指广阔的 B 端市场：通过极具吸引力的超低 API 价格，将那些正在自研模型或使用竞争对手服务的企业客户，直接 " 挖 " 到自己的生态中来。在 GPT-5 发布会的后半场，也一反常态，将重点放在了分享企业应用案例上，详细展示了其模型如何帮助企业构建各种应用，并专门推出了服务于企业的 GPT-5-chat 模型。

" 面临着巨大的降价压力，主动降价是深思熟虑后的市场分层策略，旨在应对日益激烈的开源模型竞争。" 唐兴通向每经记者指出，" 在技术上越来越难以‘一步登天’的背景下，商业上的‘遍地开花’才是当务之急。AI 的下半场，胜利将不再属于那个模型参数最高的玩家，而是将属于那个能率先为顶尖技术找到‘杀手级应用’的玩家。"

GPT-5 的目标，已不再是通过炫技来获得市场的掌声，而是要精准地瞄准企业客户口袋里的真金白银。GPT-5 并非一个颠覆性的代际跨越模型，而是准备投入到残酷商业肉搏战中的关键筹码。

IT 研究公司的分析师阿伦 · 钱德拉塞卡兰也认为，GPT-5 仍然只是一种 " 渐进式优化 "，而非颠覆性的、跨越式的提升。唐兴通则表示，GPT-5 的 " 渐进式改进 "，短期内可能会刺破资本市场的幻想泡沫，估值会承压，但对于其中长期的商业化进程，甚至可能是件好事。"关键已经不在于技术本身有多么性感，而在于如何将已经足够强大的技术，转化为能够解决现实世界问题的可靠产品。"

" 需要加速从一个伟大的实验室，进化为一个强大的商业帝国。" 唐兴通总结道。

C 端增长见顶？—— 的 5000 亿美元估值野望

GPT-5 的发布，或许还与近期的资本运作密切相关。

据媒体 8 月 7 日报道，正在与现有投资者展开初步谈判，商讨一次员工持有的股权出售事宜。如果这笔交易能够达成，的估值预计将从目前的 3000 亿美元，一举跃升至 5000 亿美元，这将超过埃隆 · 马斯克旗下的 3500 亿美元，使其成为全球最具价值的未上市 AI 公司。

唐兴通向每经记者指出，5000 亿美元的估值，反映的并非当前的市场价值，而是资本市场对其在 AGI 时代的一种 " 期权定价 "。" 支撑这个估值的核心逻辑是：谁掌握了通向 AGI 的最短路径，谁就拥有了重新定义整个世界的权力。"

然而，现实的财务压力依然严峻。有媒体预计今年的收入将达到 120 亿美元，但其居高不下的运营成本依旧是困扰其发展的一大难题。有分析指出， 每创造 1 美元的收入，可能将伴随着 2.25 美元的成本。据此粗略估计，该公司今年的运营支出预计将超过 280 亿美元，这些支出主要与其使用的微软云计算服务、正在建设的 " 星际之门 " 数据中心项目，以及与算力提供商签订的 129 亿美元五年期协议有关。除了财务压力，还面临着核心人才流失的挑战，近期多名 AI 关键研究员的离职，可能在一定程度上削弱其技术领先优势，并增加其人力成本。

的 CEO 山姆 · 阿尔特曼图片来源：视觉中国

" 在 AI 这条赛道上，现金流为负并不是问题，失去技术领先地位才是真正的灾难。" 唐兴通认为，" 当前的巨额投入，都是在为未来的潜在垄断地位买单。" 不过，他也指出，持续的融资可以暂时解决资金问题，但无法从根本上解决其盈利模式的难题。

目前，的收入增长主要依赖于的订阅业务，该业务贡献了公司总收入的约 70%。最新数据显示，每周约有 7 亿活跃用户。但在唐兴通看来，7 亿用户既是的 " 荣耀勋章 "，在某种程度上也代表着其 " 增长的边界 "。

" 的 C 端增长确实已接近饱和，但真正的野心，在于广阔的 B 端（企业）和 G 端（政府）市场。" 他分析道。近期时隔六年再次开源部分模型，正是为了吸引那些对数据主权高度敏感的政企客户，这标志着其战略重心正在从 " 消费互联网 " 转向 " 产业互联网 "。

的团队深知，其以 API 驱动的商业模式，在中低端市场迟早会被更便宜、更灵活的开源模型所侵蚀。与其被动地等待被其他人颠覆，不如主动求变。因此，正在从单纯的 " 卖算力 "，转向更为复杂的 " 卖生态 "，试图构建一个立体化的商业架构：开源模型是其吸引广大开发者的流量入口，高端 API 是其主要的利润中心，而企业级服务则是其未来最重要的增长引擎。

为了快速切入政府市场，在 8 月 6 日宣布，未来一年将以象征性的 1 美元价格，向美国联邦政府机构提供其产品，让政府雇员可以 " 几乎免费 " 地使用其最强大的 AI 服务。这种典型的 " 供应商锁定（ Lock-in）" 策略，旨在以极低的成本快速渗透政府和大型机构市场，为未来的长期合作和高价值服务奠定坚实的基础。

" 正站在成为下一个微软的十字路口，" 唐兴通总结道，" 其成败的关键，在于它能否在持续的技术突破、创新的商业模式以及严格的风险管控这三者之间，找到那个最佳的平衡点。"

举报收藏

更多>同类生活资讯

推荐图文

推荐生活资讯

点击排行

• 宇树科技王兴兴：未来几年人形机器人出货量每年	• 湖北恩施一特教老师殴打自闭症学生被行拘10日后
• 特朗普称俄乌和平协议涉及“领土交换”，泽连斯	• 11万股东深夜惊雷！刘益谦旗下*ST天茂拟主动退
• 唐山独立轧钢企业将于2025年8月9日起实施限产措	• 关于唐山独立轧钢企业限产安排通知刷爆头条
• 时隔4年，葛兰再限购到底是什么回事	• 甘肃榆中强降雨致山洪4000余人被困，仍有村庄失
• “普特会”时间地点敲定，特朗普称美俄就乌克兰	• 两大电网余缺互济保供应（经济新方位）今日资讯