Workflow
缩放定律(Scaling Law)
icon
搜索文档
南财快评|如何看待美股AI估值争议?
21世纪经济报道· 2025-11-21 19:28
2000年美股的互联网泡沫,在客观上催生了廉价的光纤基础设施,为后来移动互联网的爆发奠定了物理 基础。同理,今天全球的算力堆积,或许正是通向通用人工智能(AGI)的必经之路。没有资本的大规 模押注,就不可能有大模型的参数量级飞跃。因此,在市场担忧估值是否过高的同时,也应看到这是技 术演进中的一种激进的融资机制。 现在的问题在于,这些科技巨头们处于这场游戏的哪个阶段?如果说过去两年是概念验证和狂欢的"上 半场",那么现在他们正步入最为艰难的"中场时刻"。这是一个由预期、资本与技术现实共同编织的复 杂局势,未来的关键,在于技术的商业化落地能否追上预期的上升速度。这是一场惊心动魄的动态博 弈,也是时间与耐心的赛跑。 在这个阶段,对于美股AI公司来说,单纯的算力堆叠带来的边际效应开始递减,技术神话需要面对财 务报表的冷酷审视。投资者不再仅仅满足于"未来可期"的故事,他们开始索要营收数据和利润率。这正 是"动态博弈"最为激烈的时刻:一方面,技术必须继续加速,Scaling Law(缩放定律)是否失效的争论 需要用更强大的模型来终结;另一方面,商业化必须大步流星地赶上来,证明AI不仅仅是昂贵的玩 具,而是实实在在的利润引 ...
我们扒完了 GPT-5 全网爆料,奥特曼和 OpenAI 这次的饼真不好画了
36氪· 2025-08-05 18:39
营销策略与市场预期 - OpenAI通过高频次、碎片化的信息释放持续预热GPT-5,包括高管访谈、内部消息泄露和社交媒体互动,以维持市场热度 [1][3][7] - 公司原计划2024年发布GPT-5,但实际发布时间多次推迟,最新传闻指向2025年8月初 [23][31] - 市场对benchmark提升的兴奋度逐渐降低,公司转向通过营销叙事保持关注度 [5][7] 技术架构升级 - GPT-5核心突破在于整合基础模型与推理模型,形成统一架构 [9] - 采用智能路由系统,根据任务复杂度自动调用最佳模型(如快速响应模型或深度推理模型) [20][22] - 训练规模达17-18万块GPU,为历史最高 [39] 多模态能力突破 - 实现完整多模态能力,可处理图文、音视频等多种信息流 [10] - 用户体验预计达到"吉卜力时刻"级别,并在评测中领先 [11] - 用户通过API生成复杂HTML页面和图片,效果显著优于前代 [14][20] 软件工程与编程能力 - 专门优化企业级代码库维护能力,直接挑战Anthropic Claude的编程优势 [12] - 在内部测试中表现优于Claude Sonnet 4,且计算资源消耗未增加 [12] - 微软通过API访问测试Claude功能,涉嫌违反商业条款 [30] AI智能体与推理能力 - 强化多步骤指令执行能力,向自主完成任务方向迈进 [15] - 在客服代理等复杂规则场景中表现突出,减少对具体案例的依赖 [15] - 基于Q*技术突破开发的o系列模型展现强大推理能力 [41] 通用验证器技术 - 通过超级对齐团队开发的通用验证器技术,评估主模型输出质量 [16][17] - 在主观领域(创意写作、策略分析)取得显著进步 [18] - 该技术是获得国际数学奥林匹克金牌的关键 [18] 硬件部署与合作伙伴 - 计划在2025年底前部署100万块GPU,当前已使用17-18万块完成训练 [37][39] - 积极与AMD谈判,目标实现NVIDIA与AMD市场份额50/50分配 [37] - 微软2025年计划采购40万台AMD MI350/MI355X,采购量接近NVIDIA [37] 研发挑战与竞争态势 - Orion项目(原GPT-5前身)因缩放定律瓶颈失败,降级为GPT-4.5发布 [40] - 面临Anthropic在编程、幻觉抑制、安全等方面的竞争压力 [48] - 需通过GPT-5赢回编程领域优势,证明技术领导力 [50] 微软合作与AGI定义 - 微软通过合作弥补自身模型研发短板,优化Copilot和Bing搜索 [32][35] - 协议未明确定义AGI,侧重短期技术互补而非长期依赖 [32][35] - 约定实现AGI后微软将失去部分先进技术使用权 [32]