Scaling Law
搜索文档
有的AI在算命,有的AI在救命
量子位· 2026-02-07 12:22
文章核心观点 - AI技术正深度融入春运及日常出行,以高德地图的“鹰眼守护”预警系统为代表,通过大规模交通数据、先进视觉语言模型和实时预警能力,显著提升了道路交通安全水平,并正在实现出行安全领域的“Scaling Law”(规模效应)[1][2][17] 春运出行趋势与AI应用背景 - 2025年春运期间,官方预计40天内人员流动量将达95亿人次,其中自驾出行占比达8成,人次超过70亿[1] - AI在出行领域的应用已从辅助功能(如学习、写作)扩展到能提升安全性的关键环节,例如在事故前发出预警[1][2] “鹰眼守护”预警系统的功能与效果 - 系统由中国安全生产科学研究院联合高德开发,用户无需特殊操作,打开高德导航即可自动开启[4] - 系统能超越人类视距,提前识别24类潜在风险,包括重大异常事件、前方急刹车、夜间货车和弯道超车等,并实现秒级预警[4] - 截至2026年2月1日,系统累计已预警112亿次,平均每天预警8800万次,其中多车异常预警超14.7万次[16] - 以G2京沪高速为例,系统上线后,2025年国庆期间日均万车事故数同比下降约10%[16] - 在另一起高速事故中,系统在22分钟内预警超220次,覆盖范围达500米,至少帮助超200名车主避险[16] 系统的技术升级与春运保障 - 为保障春运,系统升级聚焦“全、广、快”三个核心[6] - “全”:新增分钟级天气预警,并对连续急转弯、长下坡等高风险路段结合天气提前预警,同时优化了货车的刹车预警阈值[6][7] - “广”:覆盖全路网、全场景,不挑手机和车机,支持摩托车、小车、货车、网约车等多种出行方式[7] - “快”:在江苏率先上线“鹰眼报警”功能,实现事故检测、报警、后车预警、救援闭环,可在6秒内自动完成事故检测并触发报警,该功能后续将推广至全国[7] 核心技术:TrafficVLM模型 - 系统的核心是TrafficVLM模型,以Qwen-VL为底座,训练数据来自通过交通孪生技术还原的现实世界海量交通视频[8] - 该模型不仅学习交通规律,还获得了理解交通“语义”的能力,并具备通用建模能力,可从小路口通行情况建模到城市级交通规律[10] - 应用实例:当用户前方3公里发生事故导致拥堵时,系统能感知车流速度变化和车辆并线行为,推理出异常,预测拥堵蔓延,并提前语音提醒用户变道避让,同时在导航界面呈现车流动态和现场图片[13][14] 出行安全的“Scaling Law”(规模效应) - 技术领域的Scaling Law认为,模型参数、算力和数据越多,性能上限越高[17][18] - 在出行安全领域,使用“鹰眼系统”的用户越多,提供的数据量越大,预警就越准确及时,系统能力随之增强,形成正向循环[18] - 高德地图2025年10月的月活用户数已达9.96亿,庞大的用户基础为这一Scaling Law提供了数据支撑[18] - 每个驾驶员通过使用系统参与其中,既守护了自己也帮助了他人,共同实现了社会价值层面的出行安全Scaling Law[19]
凭借 27 万小时真机数据,Generalist 可能是最接近“GPT-1 时刻”的顶级机器人团队
海外独角兽· 2026-01-29 20:06
公司核心观点 - Generalist是机器人领域中极少数具备长期竞争潜力的公司,其核心优势集中在数据规模、团队能力与清晰的技术发展路径上[2] 为什么看好Generalist - **数据规模优势**:公司积累了27万小时的真机训练数据,可能是全球首个在数据规模上达到GPT-1量级的机器人团队,领先其他团队6-12个月时间窗口[2][4][6] - **数据采集挑战**:复刻27万小时数据不仅需要资金,更需要时间,仅制造专用采集硬件就需要4-6个月,需要1000个人不停采集大半年甚至小一年[6] - **团队技术实力**:三位联合创始人兼具MIT、Princeton顶尖学术背景与Google DeepMind、Boston Dynamics的业界研发经历,是PaLM-E、RT-2等具身智能里程碑项目的主要贡献者[2][6] - **工程扩展经验**:工程负责人Evan Morikawa曾是OpenAI工程负责人,领导了ChatGPT、GPT-4等产品的工程团队,拥有从0到1再到大规模扩展的丰富经验[7] - **模型灵巧性展示**:公司通过一系列demo展示了模型出色的灵巧性,包括2025年6月实现的高频动态抛掷,9月组装乐高任务中攻克的亚毫米级精度,以及GEN-0在工具使用、柔性物体处理和高精度装配方面的能力[3][7] - **底层动作生成**:模型具备Low-level动作生成能力,在端到端控制下能输出丝滑且精准的操作策略,让机器人在复杂环境中表现出近似生物本能的灵巧度[8] 机器人领域的Scaling Law - **行业验证进展**:2024年,MIT和慕尼黑工业大学的研究人员通过对327篇论文分析后认为机器人基础模型存在scaling laws[11] - **公司宣称突破**:去年11月,Generalist声称首次在机器人领域验证了类似语言模型的scaling law,即随着预训练数据和计算量的增加,下游任务性能呈现可预测的幂律提升[9][13] - **参数量相变**:公司研究发现,当模型参数扩大到7B以上时会发生相变,大模型能够持续吸收数据,Training Loss会持续下降,只有跨越这个参数门槛,模型才能真正通过预训练获得通用能力[14] - **数据量幂律关系**:在足够的模型规模下,预训练数据的规模与下游任务的最终表现之间存在显著的幂律关系[16] - **实践验证**:通过盲测A/B实验证实,增加预训练数据能提高任务成功率,即使在下游数据仅有5.6小时的情况下增益也十分显著;当全量预训练数据与充足的下游数据(550+小时)结合时,任务成功率峰值高达99%[18][19] - **数据质量重要性**:团队发现数据质量和多样性比数据量本身更为重要,不同来源的预训练数据组合会训练出具有不同特征的模型[23] Generalist的技术细节与模型 - **公司关注点**:公司最关注机器人的灵巧性,认为这需要在数据、模型和硬件层面都有突破[29] - **GEN-0模型能力**:2025年11月发布的GEN-0基础模型展示了在单一神经网络流中完成长序列任务的能力,包括工具使用、柔性物体处理以及高精度装配,并已成功部署在6-DoF机械臂、7-DoF机械臂以及16+ DoF的半人形机器人上[30] - **模型架构创新**:GEN-0使用称为“谐波推理”的机制,摒弃了传统“慢思考”与“快反应”分离的架构,将感知Token和动作Token融合在同一个Transformer流中处理,能以100Hz以上的频率生成连续、流畅且智能的动作[52] - **早期Demo亮点**:2025年6月的demo展示了分拣紧固件、折叠包装、回收螺丝、拆解分类抛掷乐高等任务,所有机器人完全自主,由深度神经网络实时控制[34] - **乐高构建任务**:9月展示的乐高积木模仿构建任务被第三方归类为通用机器人的最高等级(Level 4),机器人通过观察人类搭建的结构后,能够从零开始复制出完全一样的结构,具备亚毫米级精度[34][35] - **泛化能力估算**:在仅使用4种颜色的2x4乐高积木搭建3层结构的限制条件下,存在约99840种可能的组合,表明机器人并非死记硬背,而是真正具备了应对多样化结构的能力[37] 数据、硬件与处理能力 - **数据总量与增速**:GEN-0在预训练上使用了超过27万小时的真实世界机器人操作数据,目前以每周1万小时的速度新增[38] - **数据采集方法**:公司使用UMI进行数据采集,通过在全球范围内部署数千个数据收集设备和机器人实现并行化、多样化采集,根据推测,方法包括让人类佩戴装有摄像头的手套装置来收集自我中心数据[40][42] - **数据合作与评估**:公司与多家data foundry合作在不同环境中采集多样化数据,并通过持续的A/B测试评估合作伙伴的数据质量,据此调整数据采购比例[43] - **数据处理能力**:公司构建了专用的硬件和处理管线,每天能处理相当于6.85年的人类操作经验数据[44] - **数据成本估算**:有评论认为,即使在中国,要收集到训练GEN-0的数据也要花费200-300万美元[47] - **行业支持**:2025年9月,Generalist AI入选由MassRobotics联合AWS和NVIDIA发起的Physical AI Fellowship项目首批名单,可获得包括20万美元AWS云服务额度在内的技术支持[48] 团队背景 - **CEO Pete Florence**:曾任Google DeepMind高级研究科学家,博士毕业于MIT,主导或参与了PaLM-E和RT-2等项目,DeepMind发布的Gemini Robotics论文4次引用了其研究成果[54] - **CTO Andrew Barry**:曾任Boston Dynamics资深机器人学家,博士毕业于MIT,参与了Spot机器狗机械臂项目的研发,与CEO Pete Florence同为Russ Tedrake的学生,并有长期学术合作与共同创业经历[54][55] - **首席科学家 Andy Zeng**:曾任Google DeepMind研究科学家,博士毕业于普林斯顿大学,在机器人抓取和视觉感知领域多次获奖,与Pete Florence合作密切,共同发表超过十七篇论文[55] 竞争格局 - **行业象限划分**:机器人领域可按场景复杂度和交付形态划分,Generalist位于第二象限,即“通用具身大脑”,专注于解决最难的“大脑”问题以赋能任何硬件[59][61] - **核心护城河**:公司最大的护城河是大量端到端的真机数据和极强的团队技术实力[62] - **与Physical Intelligence对比**:PI在2025年11月完成6亿美元融资,估值达56亿美元,融资进度更领先;PI采用Flow Matching技术可直接输出连续平滑的电机信号,并拥有Recap算法赋予模型自我进化能力,而Generalist目前缺乏这种部署后“越用越强”机制;PI团队由Chelsea Finn、Sergey Levine等多位学术界泰斗组成全明星阵容,团队构建更全面,而Generalist团队更加精炼[62][63][64] - **与Google对比**:Google通过Open X-Embodiment联盟采取开放生态策略,拥有大量的TPU算力和资金支持,而Generalist作为创业公司缺乏同等的生态掌控力,需在数据质量和灵巧操作上建立高壁垒,并关注高昂数据采集成本带来的资金消耗问题[62][64][65] - **与Sunday Robotics对比**:Sunday专注于家庭场景,采用低成本手套采集数据,已明确表示将在2026年晚些时候启动“Founding Family Beta”计划,把约50个Memo机器人放到真实家庭中测试,商业化落地更快;而Generalist凭借高质量数据和精密控制能完成更精密的装配任务,但Sunday可能因缺乏力反馈信息而暂时聚焦容错率较高的家务[62][65]
Altman承认“搞砸了”,曝 GPT-5.2 牺牲写作换顶级编程,明年成本降 100 倍,实锤Agent 已能永久干活
36氪· 2026-01-27 12:12
OpenAI战略方向与模型发展蓝图 - OpenAI首席执行官Sam Altman在线上研讨会中勾勒了GPT-5及其后续版本的进化蓝图,揭示行业正进入智力成本极低、软件形态从“静态”转向“即时生成”的剧变期 [3] - 公司承认在GPT-5.2的研发中“搞砸了”写作能力的优先级,将有限的算力资源倾斜在了推理、编码和工程能力等硬核智力指标上 [3] - 公司战略重心是通过Scaling Law(规模定律)先攻克人类智力的最高地带(如推理、编程),再回头填补审美和表达等细节,未来模型的竞争将是全维度实现“智力平权” [4] 模型性能与成本趋势 - GPT-5相较于GPT-4.5在逻辑推理和编程上极强,但在文采上略逊一筹,表现出性能的“非对称性” [3] - 公司承诺到2027年底,GPT-5.2级别的智力成本将至少下降100倍 [4][8] - 市场出现新趋势:开发者对“速度”的渴求正在超越对“成本”的关注,随着Agent处理长程任务,输出速度需要实现百倍以上的提升才有实用价值 [5][8] - 公司未来可能提供两种路径:极致廉价的“智力自来水”和极速反馈的“智力推进器” [5] 未来软件形态与操作系统变革 - Altman提出颠覆性愿景:未来软件不应是静态的,计算机应能直接生成“即时应用”来解决特定问题,形成“随需随生、用完即弃”的模式 [5] - 软件将根据用户习惯进行极致定制,工具会不断进化并向个人需求收敛,最终形成一套独属于个人的、动态进化的生产力系统 [5][9] - 在OpenAI内部,员工已习惯用编程模型(Codex)来定制自己的工作流,每个人的工具用起来都完全不同 [9] 对开发者与创业者的影响及建议 - 给创业者的建议是构建“模型越强,产品就越强”的东西,而不要在模型边缘做“小补丁”,否则将难以应对模型更新带来的功能吞噬 [10] - 建立成功初创公司的核心规则未变,仍需解决获客、市场策略、创造粘性和形成网络效应等问题 [10] - 对于Agent执行长流程任务,在特定、理解透彻的任务上今天就能尝试自动化,建议开发者先拆解任务,让Agent能够自我验证每一个中间步骤 [11] AI在科研与创意领域的应用 - AI对科学家而言像是“无限量的博士后”,能同时探索多个新问题,进行广度搜索 [15] - 公司观察到GPT-5.2已经让内部科学家感受到了非平庸的科学进展 [12] - 当创造的成本骤降,可以通过密集的反馈循环快速试错,从而更早找到好的创意,AI有望成为激发人类高质量创意的工具 [12] - 在生物医药领域,三维推理能力是当前药物设计的瓶颈,公司确认这个问题一定会解决,但时间点尚不确定 [25] AI安全与治理框架的转变 - Altman指出,世界在AI安全尤其是生物安全上,需要完成从“封堵(blocking)”转向“韧性(resilience)”的根本性转变 [15] - 类比火灾安全,未来应通过制定规范、发明阻燃材料、建立体系来提高社会对AI潜在风险的韧性,而非一味限制 [16] - AI在生物恐怖主义和网络安全方面会成为真实的问题,但同时也是这些问题的重要解决方案 [16] - 如果今年AI出现明显严重的失败事件,生物安全是一个相当合理的“风险爆点”方向 [17] AI与人类协作及教育 - Altman认为,在一个充满AI的世界里,人与人之间的连接会变得更有价值,而不是更没价值 [20] - AI会以前所未有的方式让多人协作成为可能,例如五人团队与一个AI共同工作,生产力会被大幅放大 [20] - 对于基础教育,Altman反对在幼儿园阶段使用电脑和AI,认为该阶段应注重户外活动、接触真实物体和人际互动 [24] - 当前的教育体系需要改变教学和评估思考能力的方式,以适应AI工具的存在,而非假装其不存在 [19] Agent规模化部署的潜在风险 - 随着Agent开始大规模运行并直接操作生产系统,最被低估的风险是:工具的能力和便利性太强,失败概率虽低但后果可能是灾难性的 [21] - 人们可能因模型表现可靠而逐渐放松警惕,授予其完全、无人监督的系统访问权限,从而在系统中埋下安全漏洞 [21] - 随着模型能力快速上升且越来越难理解,如果存在微妙的错位或新的系统性问题,而整体性的安全基础设施构建不足,可能会在不知不觉中走向危险状态 [21][22]
AI来了,大厂为什么留不住高管? | 巴伦精选
钛媒体APP· 2026-01-26 18:44
文章核心观点 - 当前正经历从互联网流量时代向人工智能时代的技术范式转移 这引发了中国科技大厂核心高管的新一轮离职创业潮 其背后的核心矛盾是大厂追求确定性的组织文化与AI早期探索所需的不确定性之间的结构性冲突 [2][3][4] - 风险投资机构将拥有大厂背景的AI人才视为新的“确定性锚点” 通过一套成熟的“捕猎机制”追逐并投资这些创业者 用人的确定性来对冲技术方向的不确定性 [24][26][27] - 人才的迁徙方向是经济景气度与生产力范式转移的“晴雨表” 资金、技术和人才的汇聚点将是下一个时代利益分配的中心 [14][15] 高管离职创业的驱动因素 - **主动逃离(看到内部无法实现的“非共识”机会)**:创业者在大厂内部已洞察到技术范式转移(如从CV转向NLP大模型)或AGI的提前到来 但大厂的决策流程、资源分配逻辑无法支撑其将想法变为现实 典型案例包括闫俊杰离开商汤创立MiniMax 姜大昕离开微软创立阶跃星辰 [5][6] - **被动出走(被大厂的“免疫系统”排斥)**:创业者提出的创新项目或产品构想(如Noam Shazeer在Google内部推动的Meena聊天产品)因不符合公司当前策略或风险偏好而被否决 迫使人才离职自行创业 [7][8] - **本质冲突**:驱动离职的深层原因是工业时代设计的大厂“确定性文化”(强调流程、KPI、可预测回报)与AI早期“不确定性探索”(需要快速试错、容忍失败)之间的根本性冲突 [8][9] 大厂面临的人才挽留困境 - **决策链条无法压缩**:即便给予独立团队和资源 AI项目的关键决策仍需漫长审批 管理层“风险最小化”的决策逻辑与创业者“机会最大化”的需求相悖 有案例显示内部耗时三个月被否决的方案 外部一周即可获得投资条款 [10][11] - **利益分配机制无法重构**:大厂能提供高额年薪(如从400万提升至600万)和股权激励 但无法提供创业所带来的阶级跨越和未来增长的全部想象空间 [10][11] - **试错空间被挤压**:大厂内部项目失败会导致负责人承受业绩压力和边缘化风险 而创业失败则被视为迭代的一部分 [12] - **国际巨头的“自救”尝试**:Google通过合并AI团队、赋予自主权营造“大厂里的初创公司”氛围 英伟达通过“Jensen特别奖”等极高薪酬和股权激励(使约80%员工成为百万富翁)将人员流失率压制在2.7% OpenAI则通过新员工入职即可获得股权来争夺人才 [12][13] 创业高管画像与创业阶段特征 - **AI 1.0时代(2022-2023年):“技术信仰者”**:首批创业者多为对Transformer架构等有深度理解、坚信Scaling Law的技术专家 如贾扬青(Lepton AI)、杨植麟(月之暗面)、王小川(百川智能) 他们致力于解决“从0到1”的模型能力问题 追求技术极致 [17][18][19] - **AI 2.0时代(2024-2025年):“商业翻译官”**:第二批创业者多为擅长产品定义、商业化落地的产品经理和业务负责人 如裴沵思(Noumena)、潘宇扬(心感智影)、苏铁(湃岛科技)、王腾(今日宜休) 他们的核心能力是找到产品市场契合度(PMF)和可付费场景 [17][20][21][22] - **赛道分布**:智能硬件、AI应用、具身智能成为最集中的创业赛道 [3] 风险投资的逻辑演变与投资偏好 - **逻辑迁移**:投资逻辑从互联网时代追逐“流量的确定性”和可复制的方法论 转变为AI时代追逐“人的确定性” 将有大厂成功经验的高管视为对冲认知不确定性的“锚点” [23][24] - **看重高管的特质**: - **整合资源的能力**:高管拥有笼络顶尖人才的网络和信用 能组建跨领域精英团队 [25] - **对垂直行业的深度洞察**:深耕过具体业务线的高管对行业痛点敏感 能精准定位AI可规模化填补的洼地 如前钉钉副总裁王铭针对海外TikTok创作者需求打造AI智能体Moras [25] - **融资与公关能力**:高管擅长管理预期 用数据和叙事说服多方利益相关者 如前小米高管王腾在产品未问世时便获得数千万元种子轮融资 [26] - **成熟的“捕猎机制”**:投资机构通过定期组织私密晚宴、FA混入高管社交圈等方式 构建“潜在项目库” 敏锐捕捉创业意向 形成猎人与猎物的共谋 [26][27] 人才流动的宏观图景与数据 - **创业事件数量**:整个2025年 创始人背景带有科技大厂的创业融资事件数量超过70起 其中大疆、字节、腾讯、华为、阿里5家的高管创业事件数量领先 [3] - **代表性案例与交易**: - 阶跃星辰于2023年8月发布Step-1千亿参数模型 综合性能超越GPT-3.5 [6] - 2024年 Google以27亿美元价格回购了其前员工创立的Character.AI的技术和团队 [8] - 2025年3月 Lepton AI被英伟达以数亿美元收购 [18] - 大疆如影产品线在其负责人领导下累计营收达数十亿元 [21]
关于2026年科技行业的12个关键问答:AI、自动驾驶、机器人、世界模型、美股......
钛媒体APP· 2026-01-14 16:08
AI行业趋势与范式转变 - 2025年行业认知从“是否使用AI”转向“如何使用及投入多少预算”,企业关注点从追求最贵最好的模型转向更实际的小语言模型和本地化微调,以实现垂直行业部署 [2] - 2025年“DeepSeek Moment”标志着大模型开发不再被五大科技巨头垄断,新兴实验室可能实现从0到1的突破,行业呈现去中心化趋势 [3][4] - 2026年AI竞争焦点将从“单纯堆数据”转向“系统级Scaling”,涉及数据策展、系统优化与产品反馈闭环,谷歌因其系统中心型优势而表现突出 [3][6] Scaling Law与模型发展路径 - Scaling Law依然强劲,增长瓶颈不在于数据耗尽,而在于数据精心挑选、清洗与配比,算力集群的细节优化(如连接、容错、带宽)仍有10倍提升空间 [5] - 2026年模型竞争路径分化,纯模型公司面临更大成本压力,行业将对过去“无脑堆数据”的方式进行修正 [6] - 模型“保鲜期”短暂,领先优势可能仅维持6个月,这引发了对大公司是应自研模型还是优先发展应用的战略辩论 [7][9] 科技巨头的AI战略分歧 - Meta面临战略困境,其Llama 4模型表现不及预期,内部在死磕底层模型技术以确保长期独立性,与优先发展应用产品之间存在路线之争 [6][7] - 一种观点认为,像Meta这样体量的公司必须掌控AI底层技术(“电力”),以防像过去被苹果隐私政策制约那样,在AI时代被卡脖子 [7][8][9] - 另一种观点认为,大厂应发挥应用层优势,可通过购买API或等待市场成熟后再布局模型能力,错过一年不会构成生存威胁 [7][9] AI应用落地与投资机会 - 2026年AI应用爆发将主要集中于B端(企业级),特别是在医疗、金融、保险等垂直领域,AI Agent将带来营收级增长,企业采纳速度远超传统SaaS时代 [10] - 摩根大通一家银行的AI预算,超过全球排名前十的其余九家银行的总和,推动其与初创公司的POC验证周期缩短至几周,商业订单签署仅需数月 [10] - 当前明确的AI生产力应用是AI原生编程(Vibe Coding)和AI浏览器,但ChatGPT的“足够好”挤压了利基市场空间,未来杀手级应用需跳出对话框形态,深度融入工作流或硬件 [11] 自动驾驶技术路线与竞争格局 - 旧金山停电事件成为技术分水岭,特斯拉的端到端方案能基于学习人类博弈行为通过无信号路口,而Waymo基于规则的系统则陷入瘫痪,凸显了处理极端情况的能力差异 [12][13] - 特斯拉的算法领先源于其问题驱动的团队文化、放弃激光雷达“置之死地而后生”的勇气,以及软硬件协同设计能力,这些因素共同构成了竞争壁垒 [14][15][21] - Waymo的每英里运营成本为1.43美元,特斯拉约为0.81美元,Waymo成本虽可能下降,但其基于规则的系统及车队维护(如机械激光雷达折旧、人工充电)使其难以达到特斯拉的成本水平,且不具备规模经济效应 [24][25][26] 芯片与算力格局演变 - 投资逻辑正从“纯GPU信仰”转向关注“ASIC效率”及算力集群的瓶颈环节,如带宽,光通讯公司(如博通)的边际变化显著 [3][30][31] - 谷歌凭借TPU的垂直整合优势,在证明其模型能力与更低推理成本后,估值从14倍快速提升至近30倍,与英伟达GPU阵营形成分化 [29][30] - 特斯拉专注于推理芯片的软硬件协同设计,其第四代芯片为规则系统设计,第五代则考虑了端到端和大语言模型需求,而训练芯片项目Dojo因复杂度高及存在英伟达替代选项而失败 [19][20][21][22][23] 美股市场动态与资本逻辑 - 2025年8月17日后市场因子发生剧烈切换,资金从高估值、高质量AI龙头股流向高波动性的周期性行业资产,反映了资金流动逻辑的微妙变化 [28] - AI行业泡沫是否破裂不取决于烧钱规模,而取决于“模型智力每三个月翻倍”的信仰是否持续,只要信仰存在且信贷周期支持,资金流就不会中断 [3][32][33] - 2026年OpenAI的IPO将是关键市场试金石,其能否证明具备系统级入口地位和强商业闭环,将极大影响整个AI板块的估值 [3][33] 宏观风险与投资关注点 - 主要宏观黑天鹅风险可能来自金融条件的突然紧缩,例如日本央行激进加息抽走全球日元流动性,或美国激进财政政策引发债务担忧 [34] - 特朗普提出的约900亿美元返税政策可能刺激消费并重新推高通胀,导致复杂多变的宏观周期,需密切关注PMI和就业市场的边际变化 [34] - 投资应遵循“不要对抗美联储,也不要对抗技术进步的信仰”的原则,在智能密度提升的逻辑中寻找非共识红利 [35]
大模型时代小公司,怎么走出OpenAI的路
新财富· 2026-01-14 16:05
文章核心观点 - 当前大模型行业的技术范式仍由OpenAI确立的Scaling Law主导,并未发生第二次革命,初创公司难以复制OpenAI的成功路径 [9][13][14] - 行业已从“百模大战”进入整合阶段,在巨头倾轧和DeepSeek改写规则后,仅有少数基座模型初创公司存活 [17][22][23] - 初创公司的生存之道在于避开与国内大厂(腾讯、字节、阿里)在主航道的正面竞争,在既有范式下分化出独特的、可持续的商业模式 [25][26][42] 行业格局演变:从百模大战到巨头主导 - **市场整合**:2023-2024年的“百模大战”后,基座模型初创公司几乎仅剩智谱、月之暗面、MiniMax三家 [17][23] - **规则改写者**:DeepSeek的出现终结了“百模大战”,其通过**降低成本**、**开源路线**,将模型从“稀缺资产”变为“基础材料”,迫使行业改变认知 [18][19][20][21] - **巨头策略**:国内大厂选择将模型能力基础设施化或深度绑定自身生态,挤压了初创公司的独立生存空间 [22] - 阿里巴巴将模型开源并与云服务深度绑定,使其成为获客工具 [22] - 字节将模型能力快速嵌入剪映、飞书等高频产品,吃进产品体验 [22] - 腾讯将模型深度嵌入微信生态,形成封闭内循环 [22] 领先AI初创公司的资本市场表现 - **智谱华章**:于2026年1月8日在港交所上市,发行价116.2港元,公开发售超额认购约**1159倍**,首日涨**13.17%**,后续市值一度达**900亿港元**,IPO募资约**43亿港元**,其中**70%**(约29亿港元)用于大模型研发 [3][38] - **MiniMax**:于2026年1月9日在港交所上市,发行价165港元,公开发售超额认购约**1800多倍**,首日暴涨**109.1%**,市值突破**1000亿港元**,IPO募资约**42亿港元**,其中**70%** 用于大模型开发 [5][38] - **月之暗面**:在2026年初完成**5亿美元**C轮融资,投后估值达**43亿美元**,公司现金储备超**100亿元**,将用于加速K3模型训练 [38] 成功初创公司的差异化生存路径 - **MiniMax:出海聚焦细分场景** - 避开国内超级App竞争,主攻海外市场,围绕**陪伴、互动、创作**等非标准化、高情绪权重的场景进行快速迭代验证 [27][28][29] - **智谱华章:深耕To G/To B“脏活累活”** - 面向政企、金融、能源等复杂场景,提供**私有化部署和深度定制**服务,以工程能力和执行力换取生存空间,成为“最能被嵌进去的模型” [30][31][33] - 作为“独立模型公司”,在B端相比大厂具有更独立的优势 [32] - **月之暗面(Kimi):单点极致突破** - 极度克制,专注**长文本理解和知识型对话**单一场景,将资源集中于上下文长度、信息密度和稳定性,在特定维度做到极致 [34][35][36] 其他细分领域的产品创新案例 - **Lovart**:专注于设计领域的AI Agent产品,集成市面上优秀的图片、视频大模型(如Nano Banana、Midjourney、GPT等),通过“无边画布”和自动化流程服务专业设计师,其订阅制价格从每年**192美元**到**1188美元**不等 [39][40][41] - **行业启示**:类似Perplexity(搜索)、Cursor(编程)等公司,成功关键在于**避免进入大厂主战场**,在垂直细分领域创造独特价值 [42]
MINIMAX-WP(0100.HK):模型智能持续突破 解锁商业化潜能
格隆汇· 2026-01-14 09:25
文章核心观点 - 公司主动修正了“DAU/流量=壁垒”的逻辑,深刻认识到AI时代的核心护城河是模型智力的代差[1] - 公司通过缩减低效的ToB销售团队和C端买量费用,将资源极度聚焦于高强度的模型研发与技术突破,这种“反共识”的收缩是向Scaling Law下半场(推理侧/架构创新)的精准抢跑[1] - 管理团队兼具顶尖科研与to B商业化及交付经验[1] 行业趋势与市场空间 - AI正定义新一代生产力,其总可寻址市场(TAM)正从软件预算转向劳动力预算[1] - 行业正经历从判别式AI向生成式AI的质变[1] - Scaling Law推动模型智能指数级提升,同时推理成本指数级下降(通缩属性),使得AI具备了推理、规划能力的“数字员工”属性[1] - 以美国为例,传统软件市场仅针对约3000亿美元的IT预算,而AI作为生产要素,将渗透全球约13万亿美元的劳动力成本市场[1] - AI不仅是卖License,更是按产出价值定价,市场天花板被打开[1] 技术路径与竞争格局 - 粗放的预训练Scaling(堆算力/数据)面临边际效应递减,行业进入“架构创新 & 推理侧Scaling”的新阶段[2] - DeepSeek(MLA/架构压缩)与Google(多模态关联)代表了不同的技术突围方向[2] - 技术壁垒回归到“工程能力+架构创新”的综合实力[2] - 在AI赛道内部,“基础设施层”与“原生应用层”的投资逻辑正在分化[5] - 相比于DeepSeek在成本侧建立的壁垒,公司在多模态(语音/视频)交互体验上的深耕,使其在用户粘性与商业化变现上具备更深护城河[5] 公司战略与管理团队 - 公司创始人兼具科研能力与to B交付经验,曾任商汤科技副总裁、智慧城市事业群CTO,具备卓越的技术和管理能力,在商汤带领过700余人的团队,智慧城市业务2021年收入超20亿元人民币[3] - 管理层深刻认知到“用户规模≠模型智能”,单纯堆砌DAU无法反哺模型智力[3] - 公司2025年战略重心从“做营收/投流”转向“技术迭代”[3] - 人事上,缩减ToB销售团队以应对API价格战,弱化纯C端运营,将资源集中于模型研发,意图通过代差级体验打造真正的Super App[3] - 公司战略重心回归技术研发,新一代多模态模型(如Video-01、端到端语音)预计将在FY26-27开始显著贡献增量ARR[5] 财务预测与经营状况 - 预计公司FY25-27分别实现营业收入0.80亿美元、1.85亿美元、3.51亿美元,同比增长162%、131%、90%[4] - 其中AI原生产品(To C)收入FY25-27分别实现0.58亿美元、1.39亿美元、2.63亿美元,同比增长超140%[4] - 开放平台(ToB)收入FY25-27分别实现0.22亿美元、0.46亿美元、0.88亿美元[4] - 预计Non-GAAP毛利润FY25-27分别实现0.20亿美元、0.74亿美元、1.93亿美元,对应Non-GAAP毛利率25.0%、40.0%、55.0%[4] - 预计Non-GAAP净亏损将逐步收窄,FY25-27分别录得亏损-2.4亿美元、-1.8亿美元、-0.8亿美元,对应Non-GAAP净利率-300%、-97%、-24%[4] - 公司C端产品已实现正毛利(4.7%),且营销费用率在收入翻倍背景下绝对值下降[5] - 随着推理成本下降,未来净利率有望迎来非线性拐点[5] - 公司目前隐含估值处于FY26 77x P/S[5]
第一上海证券新力量NewForce总第4942期
第一上海证券· 2026-01-13 19:11
报告行业投资评级 * 报告对科技行业,特别是国产算力产业链,持积极推荐态度,核心观点是提示其确定性投资机会 [5][7] 报告的核心观点 * 报告核心观点是,国产算力在2026年将迎来大规模生产元年,并在AI推理时代迎来广泛落地,确定性机会显著 [5] * 供给端,芯片制造良率问题有望在2026年突破,产业链软硬件协同优化提升产品可用性 [5] * 需求端,2026年国内互联网大厂及运营商对国产算力的采购需求明确且规模巨大,例如字节跳动预计国内算力采购达600-650亿元,其中国产算力份额预计超400亿元;阿里巴巴预计投入超1,200亿元;腾讯预计投入超800亿元 [6] * 海外H200芯片的放开对国产算力产业链影响有限,因两者应用场景重叠度不高,且国产新一代产品算力对标H100,在推理场景性价比更高 [6] * 海外算力产业链的驱动力已从训练转向推理应用落地,AI应用商业化进入拐点,将持续驱动算力需求高增长,例如谷歌提出未来4-5年实现算力1,000倍增长的目标 [8][9][10] * 光模块产业供需格局持续紧张,供应链瓶颈是2026年关键考量 [10] 根据相关目录分别进行总结 国产算力产业链 * 持续推荐国产算力产业链的确定性投资机会 [7] * 核心标的包括寒武纪(688256)、中芯国际(0981.HK)、华虹半导体(1347.HK) [7] * 建议关注国产IC载板相关公司,如深南电路(002916)、鹏鼎控股(002938)、兴森科技(002436)、宏和科技(603256),因上游玻纤布紧缺导致IC载板供应出现瓶颈 [7] 海外算力产业链 * 建议关注Scaling Law叙事的持续性、大厂资本开支、Token消耗量、年度经常性收入等关键指标 [10] * 光模块领域,建议重点关注龙头公司中际旭创(300308),其积极应对供应链瓶颈并在CPO等新技术布局领先 [10] * 同时建议关注应用光电(AAOI)在北美光芯片和光模块产能布局的投资机会 [10] 股票池与公司估值 * 报告列出了涵盖消费硬件、国产算力、国产存储、海外CSP/ASIC产业链(PCB及材料、通信、液冷电源)等多个细分领域的股票池 [12] * 报告提供了包含零售消费、科技、工业、医药、金融、美股、A股等多个行业及市场的公司估值与评级表,表中列明了股票代码、现价、目标价、投资评级、市盈率、市值等关键数据 [14][15] * 在科技行业相关公司中,对寒武纪(688256)给予“买入”评级,目标价为1,683.00元人民币,对应2026年预测市盈率为123.8倍 [15] * 对中芯国际(0981.HK)给予“买入”评级,目标价为90港元,对应2026年预测市盈率为57.0倍 [14] * 对华虹半导体(1347.HK)给予“买入”评级,目标价为105港元,对应2026年预测市盈率为704.2倍 [14] * 对应用光电(AAOI.US)给予“买入”评级,目标价为42.2美元 [15]
西南证券:AI模型迭代聚焦工程能力 AI应用落地锚定高ROI场景
智通财经网· 2026-01-13 17:17
海外AI投资趋势转变 - 2025年海外云厂商强调“云服务供不应求”并关注AI应用商业化变现,AI投资正从FOMO CapEx(害怕错过的资本开支)向ROI CapEx(投资回报率驱动的资本开支)转变 [1][2] - 2024-2025年海外科技大厂资本开支高增且未来预期上调,行业普遍面临现金流压力,促使厂商寻求多种数据中心建设方式和融资手段,AI独角兽IPO进程有望提速 [1] 数据中心与算力效率优化 - 数据中心建设面临电力容量限制,海外云厂商强调最大化每瓦特下的Tokens产出效率,对硬件、软件栈和系统架构进行全面优化以提高算力利用率 [3] - 海外云厂商日益注重数据中心建设的通用性和灵活性,以适应不同代际的GPU和多种模型计算,支持训练与推理负载的灵活切换,协同设计和通用性成为关键 [3] 大模型演进与商业化进程 - AI大模型将继续围绕长文本、多模态、逻辑推理等能力迭代,Transformer架构仍有较大工程优化空间 [4] - Scaling Law从预训练延伸至强化学习和持续学习,训练数据将带来模型能力分化,推理阶段有望放大差异化特征,催生不同的AI用例并与不同领域深度融合 [1][4] - 在工程化能力提升和锚定高ROI应用场景下,AI商业化进程有望提速,订阅、API、广告、Agent等多种业务模式逐步探索成形 [1][4] AI云服务增长前景 - 2025年海外AI云服务进入“超大订单+长期基建”模式,云订单金额从十亿级到千亿级不等,剩余履约合同金额呈现高速增长,AI云服务有望迈向加速扩张阶段 [5] - 海外云厂商表示当前算力产能供不应求,已锁定数吉瓦级别电力容量,云业务收入增速高度依赖产能上线节奏,预计随着2026年算力容量逐步释放,云业务有望迎来加速增长 [5]
当黄仁勋在CES重申物理 AI 路径,它石已提前走通具身智能 Scaling Law
具身智能之心· 2026-01-13 12:47
行业技术发展路径 - 自动驾驶被广泛认为是通向物理AI与具身智能的关键技术路径和“钥匙”[2] - 自动驾驶与具身智能在技术上同宗同源,自动驾驶是具身智能的一个关键子任务,代表了智能体在复杂物理环境中的移动与导航能力[3] - 自动驾驶中成熟的端到端系统,统一了时空坐标下的感知、决策与规划,为机器人在物理世界中的理解与行动提供了根本性的底层框架[3] 公司技术前瞻与行业地位 - 公司创始人早在2025年7月便在世界人工智能大会上系统阐述了自动驾驶与具身智能的技术同源性,时间领先业界半年以上[2] - 公司基于对物理AI发展路径的早期战略判断和自动驾驶的深厚积累,推动具身智能从实验室走向真实世界应用[8] 核心驱动力:数据 - 业界共识认为,高质量、大规模、丰富的数据是遵循Scaling Law、驱动智能水平跃升的关键燃料[3] - 具身智能对高质量、真实数据的需求量是自动驾驶的十倍以上[3] - 公司提出了“以人为中心”的真人数据采集新范式,并于2025年12月开源了全球首个具身VLTA多模态数据集World In Your Hands[5] 数据价值与技术创新 - 融入“以人为中心”的数据后,机器人在极其杂乱场景中的操作成功率由8%暴涨至60%,并显著提升了灵巧手在桌面操作任务中的泛化性与稳定性[5] - 公司自研的数据采集套件实现了厘米级的运动捕捉精度,并能输出包含6D位姿信息的高丰度数据流[6] - 该创新路径降低了数据采集难度与成本,单采集员日均5小时内即可采集生成1.8TB数据,为训练更强大的模型构筑了可扩展的数据供给基础[6] - 公司首席科学家表示,“以人为中心”的数据采集范式配合其数据引擎,可以记录和生产最高质量、最丰富的具身智能数据,真正使得Scaling Law成为可能[5]