LLM
搜索文档
LeCun创业0产品估值247亿,回应谢赛宁入伙
量子位· 2026-01-23 15:44
公司概况与战略定位 - 杨立昆(Yann LeCun)离开Meta后创立新公司Advanced Machine Intelligence(AMI),法语意为“朋友”[9] - 公司总部位于巴黎,并计划在纽约、蒙特利尔、新加坡等地设立运营机构[10] - 公司坚定选择开源路线,与当前硅谷的闭源趋势相反,认为开源是构建人工智能平台的正确道路[11][13] - 公司前期将专注于研发,核心方向是“世界模型”,而非当前主流的大语言模型(LLM)[17][19] - 公司的终极目标是成为未来智能系统的主要供应商之一,不仅做研究,还会推出围绕世界模型和规划能力的实际产品[38] 技术理念与路径 - 公司认为构建智能系统的正确方式是“世界模型”,而非LLM[19] - LLM虽然有用,但仅通过处理语言无法实现人类水平的智能,因其受限于文本的离散世界,缺乏对物理世界的系统认知,无法进行真正的推理或规划[20][22][23] - 世界模型的核心在于理解世界背后的认知逻辑和抽象表征,而非生成精美的像素(如李飞飞的Marble公司所追求的像素生成路线)[30][31][32] - 公司技术基础是杨立昆此前提出的联合嵌入预测架构(JEPA),该架构不是生成式AI,无法预测未来所有细节,但能从世界的抽象表示中学习,并在抽象空间进行预测[34][36] - JEPA将使用文本、视频、音频和传感器等多种数据,通过学习世界的底层规则来实现真正的现实世界推理和规划[37] 融资与估值情况 - 公司(AMI Labs)正以30亿欧元(约合人民币247亿元)的目标估值寻求融资[45] - 预计将在未来几周内完成3.5亿欧元的初期融资,最终目标是首轮融资5亿欧元[46] - 一旦融资完成,公司将步入“商业成果0,但估值超10亿美元”的初创公司行列[50] - 当前风险投资(VC)圈的投资逻辑发生变化,从看产品或技术路径转向看重创始人背景,例如Ilya Sutskever和Mira Murati离开OpenAI后创办的零产品初创公司均获得了约20亿美元的估值[52][53] 人才招募与团队建设 - 公司正在积极招兵买马,已从Meta挖走前副总裁Laurent Solly[40] - 有消息称,公司有意邀请研究员谢赛宁加入并担任首席科学家一职[7][42] - 杨立昆在访谈中高度认可谢赛宁,称其为杰出的研究者,并曾两次成功聘请他(之前在FAIR和纽约大学)[43] 与Meta的关系 - 杨立昆对Meta的某些决策表示不满,例如解散机器人团队被认为是战略性错误,并认为Meta擅长研究但不擅长将技术转化为产品[15] - 尽管理念存在分歧,但Meta可能成为新公司的第一个客户,双方有望达成合作,Meta将有权访问其创新成果[5][47][48] - Meta将不会成为公司的投资者之一[47]
咖啡机变聪明后,我连咖啡都喝不上了
机器之心· 2026-01-18 14:48
文章核心观点 - 以大型语言模型为核心的生成式AI语音助手在智能家居控制场景中,其固有的随机性与不确定性导致了基础指令执行可靠性的显著下降,引发了用户不满[1][18][27] - 尽管新技术在理解复杂指令和上下文方面能力更强,代表了从“单指令执行器”到“代理式AI”的能力范式切换,但其在需要高度确定性的控制任务上表现不佳,揭示了当前技术部署的边界问题[29][31][32][44] 行业现状与用户反馈 - 亚马逊Alexa升级至生成式AI版本后,在执行如“煮咖啡”、“开灯”等基础、预设的智能家居指令时频繁失败,且每次拒绝的理由都不同[3][4][5][6][7] - 用户社区中抱怨声广泛,基础控制功能如开灯、播放歌曲、设定计时器等成为“重灾区”,部分用户甚至因此换回本地红外控制的传统设备[8][9][11][12] - 2025年即将过去,AI在复杂任务上表现卓越,却在清晨一句简单的“煮杯咖啡”指令上失败,与现实预期形成鲜明反差[8][14] 技术原理与挑战 - 传统语音助手本质是模板匹配器,通过识别关键词和填充参数来执行指令,虽然笨拙但结果高度确定[15][19][20] - 生成式AI助手基于LLM,其核心价值在于理解与生成的灵活性,但这也引入了大量随机性,导致对同一指令的解释空间被放大,输出不一致[18] - 在要求即时、可重复、零容错的设备控制场景下,概率性模型本身存在缺陷,微小的输出偏差就可能导致API调用失败,进而使整个操作失败[18][22][23][24] - 理论上通过大量工程投入、约束设计和失败兜底可以提升可靠性,但在资源有限和商业诱惑下,行业选择了先将技术推向市场再逐步修正的策略[25][26] 新技术的优势与潜力 - 生成式AI助手在理解复杂、模糊或多任务指令方面能力显著增强,例如能同时理解并执行“调暗灯光”和“调高温度”的复合命令[34][35] - 具备一定的上下文理解和探究能力,例如当被质问为何不关音乐时,会尝试查询原因[36] - 在信息归纳与通知方面表现更智能,例如摄像头检测到运动后,能提供“门口出现不熟悉面孔”等更具描述性的通知,而非笼统的“检测到运动”[38][39][40] - 代表“代理式AI”方向,具备服务链式调用能力,能理解复杂任务关系并动态生成执行逻辑,这是旧有基于固定规则的系统无法实现的范式切换[30][31][32] 行业发展的共识与方向 - 用户讨论中形成的温和共识是:问题关键不在于是否引入AI,而在于界定其应用的“边界”,不应试图用AI替代一切已被验证的确定性执行机制[42] - 更合理的方向可能不是“去按钮化”,而是让AI辅助人类理解系统,而非完全取代传统的可靠控制接口[42] - 当前的混乱可能并非生成式AI的失败,而是将其放置在了并不适合其特性的核心控制位置[44] - 如何让LLM学会区分何时需要精确执行、何时可以随机发挥,仍是行业尚未解决的根本问题[1][27]
互联网-2026 年影响行业的十大争议与核心标的--Internet-10 Debates to Shape the Sector and Key Picks in '26
2026-01-13 10:11
行业与公司 * 行业:北美互联网行业 [1][2] * 涉及公司:AMZN, META, GOOGL, DASH, EBAY, RBLX, RDDT, ABNB, EXPE, BKNG, SNAP, TTD, YELP, FIGS, MTCH, BMBL, UBER, LYFT, CART, WMT, U, TTWO, EA, PLTK, COMP 等 [1][3][4][7][8][9][10][11][13][14][15][16][67][113][143][151][165][167][180] 核心观点与论据 **2026年行业主题展望** * 2026年市场主题将与2025年相似,市场将奖励那些能展示生成式人工智能带来实质性正投资回报率的公司,例如更快的收入增长、用户参与度提升、更大的每股收益/自由现金流等 [2] * 对于面临颠覆不确定性的子行业,如网约车、电子商务、旅游以及规模较小、未经证实的广告平台,其估值倍数可能维持在较低区间 [2] * 总体上对2026年超大规模云服务商的增长持乐观态度,并列举了5个理由认为2026年将出现人工智能技术采用和扩散的加速 [2][56][58] **关键投资标的观点** * **AMZN:首选超大盘股** * 目标价315美元,隐含约27%上行空间 [3][6] * 市场低估了其在AWS和零售领域的生成式人工智能领导地位 [3] * **AWS方面**:预计将实现持续20%以上(可能达到20%中段)的增长,市场对Trainium芯片的忽视可能带来上行期权 [3] * **零售方面**:在智能代理、推荐算法、库存物流、机器人、广告工具等方面的投资将带来更持久和盈利的增长,预计将占据消费者支出的更大份额 [3] * 估值:当前股价基于市盈增长比率较同行有约40%的折价,目标价对应31倍2027年每股收益10美元,市盈增长比率1.4倍,仍较同行有约20%折价 [6] * **META:关注超级团队执行力与产品管线** * 目标价750美元,隐含约15%上行空间 [7] * 投资者情绪因Llama模型在2025年的失误而过度悲观,估值低于20倍2027年每股收益 [7] * 预计2026年核心参与度、货币化能力以及新大语言模型的交付将扭转情绪,驱动收入预期上修和估值倍数扩张 [7] * 模型和产品管线的表现将决定其估值是达到23倍每股收益(基础目标价)还是25倍以上(看涨目标价1000美元) [7] * **GOOGL:关注搜索业务预期上修** * 目标价330美元,隐含约0%上行空间,看涨目标价415美元 [8] * 搜索核心和GCP的加速增长是看涨基础,预计GCP在2026年可能增长50%以上 [8] * 当前股价对应24倍2027年每股收益,高利润的付费搜索业务增长预期上修将是推动股价向看涨目标价迈进的关键,目前模型预测2026/2027年付费搜索增长约13%/9% [8] * **DASH:投资于优势领域以变得更强** * 目标价300美元,隐含约39%上行空间 [9] * 对统一技术平台、ROO业务及其他长期机会的投资持乐观态度,因其有实现投资回报的历史记录,且业务逻辑合理 [9] * 核心业务加速使其有能力为投资提供资金并实现息税折旧摊销前利润 [9] * 目标价对应27倍2027年息税折旧摊销前利润,按增长调整后较同行溢价约10%,而当前股价按增长调整后较同行有约20%折价 [9] * **EBAY:市场对其增长可持续性和盈利性过度悲观** * 目标价112美元,隐含23%上行空间 [13] * 2025年固定汇率计商品交易总额同比增长8%,市场对2026年持续增长持怀疑态度 [13] * 增长驱动力包括:收藏品领域的持久顺风、新举措的扩展、消费者支出从服务转向商品的韧性、垂直和水平改进的持续叠加 [13] * 当前股价对应14倍2027年调整后每股收益,低于其他具有双位数每股收益增长的成熟市场平台(约15-25倍),其在智能代理商务中的强势地位可能有助于提升估值倍数 [13] * **RBLX:机遇强于以往,短期风险已被充分定价** * 目标价155美元,隐含约100%上行空间 [14] * 2025年证明了其用户生成内容平台的力量,预订量和参与度估计均同比增长超过50% [14] * 尽管2026年计划投资和艰难同比数据对股价构成压力,但近期爆款游戏的成功强化了其持续推出新热门游戏的能力,且历史表明在用户快速增长后留存率高于担忧 [14] * 当前股价对应约20倍2027年息税折旧摊销前利润,而2025-2028年息税折旧摊销前利润增长预计超过30% [14] * **RDDT:收入和用户增长前景可期** * 目标价265美元,隐含约8%上行空间 [10][12] * 广告工具套件改善,与Gemini和OpenAI的合作增强了其在产品搜索漏斗中的重要性 [12] * 预计第一季度可能推出的新用户引导流程将带来更持久的美国用户增长,从而推动估值倍数扩张 [12] * 其商业搜索查询价值正在增长,可能推动与Gemini/GPT的合作伙伴关系在2027年到期前续签,或与亚马逊等公司达成新合作 [12] **持谨慎态度的领域** * **ABNB:评级减持,目标价130美元,隐含约7%下行空间** * 其市盈增长比率较BKNG有约80%的溢价,尽管收入增长水平相似且BKNG每股收益增长略快 [15][16] * 需要微观层面的创新来驱动增长重新加速、持久性和利润预期上修,以证明其溢价估值的合理性 [16] * **YELP:评级减持,目标价28美元,隐含约9%下行空间** * 对其向服务转型驱动持续预期上修的能力信心有限,同时餐厅、零售和其他业务份额持续流失 [16] * 新产品如Yelp Assistant的上行期权被人工智能驱动的消费者行为变化所带来的结构性风险所抵消 [16] * **EXPE:评级中性,目标价270美元,隐含约9%下行空间** * 与最接近的同行BKNG的估值差距已显著收窄,EXPE交易于约17倍2027年公认会计准则每股收益,而BKNG为约18倍 [16] * 认为EXPE相对于BKNG/ABNB面临更多相对风险,例如更多美国连锁酒店业务、更低的直接流量,可能受到GOOGL/OAI创建更先进智能代理旅游产品的影响,且此风险尚未被定价 [16] * **FIGS:评级中性,目标价8美元,隐含32%下行空间** * 认为市场高估了其近期收入加速的持续性,估值拉伸至21倍2027年息税折旧摊销前利润 [16] 其他重要内容 **十大主题辩论摘要** 1. **前沿模型格局演变**:2026年重点将从基准测试超越转向产品化和货币化,关注GOOGL、META、AMZN的模型产品化进展,Blackwell芯片驱动的模型改进和META的超级智能实验室是关键变量 [40][47][48][49] 2. **生成式人工智能投资回报率证据**:预计企业生成式人工智能工具采用将加速,技术扩散将拓宽,超大规模云服务商增长将加快,列举了5个看涨理由 [52][56][58] 3. **生成式人工智能效率降低巨头招聘**:预计META/AMZN/GOOGL等巨头与人力相关的运营支出增长将在2026和2027年显著减速 [60][63] 4. **智能代理对电子商务的影响**:智能代理购物即将到来,可能为2030年基准电子商务预测增加高达6%,杂货是最大支出机会,垂直领域参与者可能更早受益 [65][68][69] 5. **自动驾驶进展及对UBER/LYFT的影响**:2026年是自动驾驶可用性的拐点年,覆盖城市人口比例将从2025年底的15%提升至32%,关注服务、安全、每英里成本 [77][80][83] 6. **物理人工智能的重要性**:AMZN新兴的机器人仓库可能在2026/2027年产生最大影响,预计到2027年增加约40个机器人仓库,可能带来约20亿美元经常性成本节约 [96][98][101][102] 7. **在线杂货的未来**:美国约1.4万亿美元的线下杂货支出是智能代理商务的最大解锁领域之一,杂货/消费品预计将驱动2026-2030年基准/看涨情况下48%/53%的智能代理支出 [112][113][121] 8. **生成式人工智能与搜索格局变化**:预计2023-2026年搜索查询量复合年增长率为14%,高于2021-2024年的约5%,Gemini在商业行为上略优于ChatGPT,需关注ChatGPT广告的影响 [126][128][131][132][138][139] 9. **人工智能世界模型对游戏制作的影响**:交互式视频生成模型可能改变游戏内容制作方式,对U、RBLX、TTWO、EA等构成潜在颠覆风险,而AMZN、GOOGL等云和人工智能工具提供商可能受益 [141][143] 10. **在线交友用户增长重新加速**:经过约2-3年用户负增长后,2026年可能因产品迭代速度改善、新的对用户结果而非货币化的关注以及生成式人工智能改进匹配而最终迎来增长拐点 [150][151][154] **目标价与评级调整** * 上调EXPE目标价从180美元至270美元,评级中性,因每股收益上修及估值倍数提升 [4][171] * 上调SNAP目标价从8.50美元至9.50美元,评级中性,因新增许可/订阅收入预期 [4][171] * 下调TTD目标价从50美元至42美元,评级中性,因竞争风险和估值折扣 [11][171] * 上调RDDT目标价从250美元至265美元,评级增持 [11][174] * 上调PINS目标价从32美元至35美元,评级增持 [11][174] * 下调DUOL目标价从300美元至275美元,评级增持 [4][174] * 下调MNTN目标价从22.50美元至20.50美元,评级中性 [4][174] * 下调CRTO目标价从36美元至34美元,评级中性 [11][174] * 上调CHWY目标价从48美元至51美元,评级增持 [4][174] * 上调EBAY目标价从102美元至112美元,评级增持 [4][174] * 上调APP目标价从750美元至800美元,评级增持 [11][176] * 下调RBLX目标价从170美元至155美元,评级增持 [11][176] * 上调ABNB目标价从120美元至130美元,评级减持 [4][176] * 恢复对COMP的覆盖,评级中性,目标价10美元 [11][180][182] **具体数据与指标** * **AMZN**:AWS Connect客服代理业务收入运行率超过10亿美元 [45] Rufus购物助手拥有2.5亿活跃客户,带来100亿美元的年化增量销售额运行率 [42][45] * **META**:Reels收入运行率超过500亿美元,端到端人工智能广告工具运行额600亿美元,Meta AI月活跃用户超过10亿 [45] * **GOOGL**:Gemini API自Gemini 3发布以来每日处理1万亿个令牌,人工智能模式日活跃用户超过7500万,Google Cloud积压订单在第三季度环比增长46%达1550亿美元 [45] * **自动驾驶**:预计到2026年,自动驾驶服务覆盖城市人口比例将从2025年底的15%提升至32% [80][83] 预计到2032年,UBER/LYFT仅占美国自动驾驶市场的30% [91] * **食品配送**:平均每单30美元的订单中,约5美元(占比中双位数百分比)支付给配送员,自主配送节省的成本可提升每单息税折旧摊销前利润或降低消费者费用以刺激需求 [108][110] * **在线交友**:MTCH和BMBL的2026财年自由现金流收益率分别为11%和33% [151] 调查显示,约40%寻找关系的单身人士曾使用过在线交友但目前未使用 [159]
人均不到3元!被AI作弊逼急的教授玩“邪修”:“花105元,给全班36人办了场AI口试”
猿大侠· 2026-01-10 12:11
文章核心观点 - 生成式AI的普及导致传统课后作业和笔试等评估方式失效,教育行业面临评估模式变革的迫切需求[2] - 利用语音AI代理进行规模化口试,是应对上述挑战的有效且经济可行的创新解决方案[4][5] - AI口试系统不仅能以极低成本实现大规模实时评估,还能通过多模型评审和结构化反馈,更精准地检验学生的真实理解与能力,并反哺教学改进[13][14][29][30] AI对传统教育评估的冲击与挑战 - 学生利用LLM(大语言模型)完成作业的质量异常提升,但被随机提问时却无法解释自己的作业内容,表明传统书面作业已无法有效评估真实能力[1] - 在小组项目中,学生可利用Gemini 3.0、NotebookLM等工具生成无破绽的演示文稿,即使未参与项目也能进行完美展示,教师难以分辨[2] - 传统通过课后作业衡量学生理解程度的旧模式已经彻底失效[2] 口试作为评估新方案的价值与障碍 - 口试能要求学生进行实时推理、灵活应用知识并为自己决策辩护,且没有LLM辅助,能更真实反映学生水平[3] - 口试规模化落地的核心障碍是后勤协调困难,例如协调36名学生的考试时间已具挑战,班级规模扩大十倍后问题将更严峻[4] AI口试系统的设计与实施 - 采用ElevenLabs的对话式AI平台构建“语音口试智能体”,其基础版AI考官仅需几分钟即可搭建上线[5] - 系统关键功能包括:利用动态变量传入学生个性化信息实现“个性化口试”[6];采用多子Agent协作的工作流设计,防止对话偏离轨道并使调试可控[7][12] - 具体口试流程分为两部分:围绕学生结课项目细节提问[9];随机抽取课程案例进行现场分析提问[10] - 工作流由三个子Agent组成:身份验证Agent、项目讨论Agent、案例讨论Agent[11][12] AI口试的成本与效果数据 - 在36名学生的实践中,总成本为15美元,人均成本0.42美元(约人民币2.9元)[13][14] - 若采用纯人工口试,需2名考官,总工时30小时,按助教时薪25美元计算成本高达750美元,教授时薪成本更高[14] - 9天内完成全部口试,平均耗时25分钟,每场对话平均交互65轮[13] - 三个AI模型评分一致度达89%(误差在1分以内)[13] - 口试时长与得分完全不相关(相关系数r = -0.03),耗时最短的9分钟考试获得最高分19分(满分20分),耗时最长的64分钟考试仅得12分[13][31][32] 多模型评分委员会机制与效果 - 采用Claude、Gemini、ChatGPT组成“LLM评分委员会”,模型先独立评分,再互相参考评分和理由进行修正,最后由Claude担任主考官生成最终评分[22] - 第一轮评分一致性差:三个模型评分完全一致为0%,仅23%的评分误差在2分以内,最大平均误差接近4分[22] - 模型初始打分风格差异大:Gemini平均分17.0,Claude平均分13.4,OpenAI平均分14.0[22][23] - 进入审议环节后,评分一致性飞跃,Gemini在参考其他模型依据后平均分下调2.0分至15.0分[23][24] - 在不同考核维度上,模型评分一致率不同:“问题框架设计”和“评估指标选择”维度一致率达100%,“实验设计”维度一致率仅57%,后者反映了学生回答本身存在模糊性[26][28] AI口试系统的优势与教学反馈 - AI系统能自动生成包含“优点/不足/改进行动”的三段式结构化反馈,并直接引用学生原话作为证据,其反馈质量远超人类水平[29][30] - 通过考点成绩分析,精准暴露教学漏洞,例如“实验设计”考点平均分仅1.94分(满分4分),远低于“问题框架设计”考点的3.39分,促使教师意识到课程中A/B测试方法论讲解过于仓促[30][31] - 具体分数分布显示:8%的学生(3名)在“实验设计”考点得0分,42%的学生(15名)得2分,无人得满分4分[31] 实践中的问题与优化 - 初期选用声音过于“吓人”,优化方向是进行A/B测试,优化理解体验而非强调权威感[16][17] - AI曾一次性提出包含4个问题的复合问题,增加学生认知负荷,优化方案是在Prompt中规定一次只提一个问题[18] - AI在重复问题时擅自改写问题,导致题目变更,解决方案是要求AI在重复时必须逐字复述[19] - AI不给学生思考时间,将短暂沉默视为没听懂,优化措施是延长触发追问的超时等待时间从5秒至10秒[20] - LLM无法保证真正的随机性,例如在案例选择中“Zillow”被选中的概率异常高达8%,解决方案是将随机性逻辑从Prompt转移至代码层面实现[21] 学生反馈与未来展望 - 学生问卷调查显示:仅13%的学生更喜欢AI口试,57%倾向于传统笔试,83%认为AI口试比笔试更有压力[33] - 但同时,70%的学生认同AI口试能更准确地检验他们的真实理解水平,这是所有调查选项中认可度最高的一项[33] - 课后作业时代已经落幕,退回传统线下考试是技术倒退,教育需要能奖励真正理解、决策和实时推理能力的评估方式[35] - AI使得曾经因规模问题被淘汰的口试重新变得规模化、可落地,且系统可开放给学生用于反复练习,因为考题是实时生成的[36] - 核心思路可行,但执行细节仍需迭代优化[35]
每日机构分析:12月18日
搜狐财经· 2025-12-18 18:41
马来西亚经济与货币展望 - 澳新银行预计马来西亚2026年GDP增长4.5%,受益于强劲内需、人工智能带动的电子出口及稳健财政政策[1] - 澳新银行预测林吉特有望走强,年底美元兑林吉特汇率或达到4.00[1] 菲律宾经济与货币政策 - 马来亚银行证券预测菲律宾比索或于2026年下半年走软,主因美元重拾强势及国内负面因素持续拖累[1] - 防洪资金腐败丑闻正抑制菲律宾政府支出与经济增长,并打击外资信心,加剧资本外流和本地资产压力[1] - 增长乏力或迫使菲律宾央行在2026年底前额外降息50个基点,削弱比索利差优势[1] 美国通胀与美联储政策 - 美国银行指出,关税推高商品通胀,而医保因素或令服务通胀趋缓,这可能促使美联储在2026年1月维持利率不变[1][2] - 阿波罗资管首席经济学家指出,美联储官员在2026年展望中日益警惕滞胀风险,即增长放缓与通胀高企并存[1][2] - FOMC预测显示,通胀与失业率均面临上行风险,这一罕见组合令货币政策进退两难[2] 印度人工智能市场 - 美国银行指出,印度凭借低廉数据成本、超7亿年轻网民及电信运营商免费人工智能订阅策略,已成为全球大型语言模型普及率最高、最活跃的人工智能消费市场[2] - 印度正成为“代理人工智能”技术的关键试验田,但本土初创企业面临国际巨头加剧的竞争压力[2] 韩国汇率市场与政策 - 友利银行经济学家指出,仅靠非核心措施无法遏制韩元贬值,当局需明确干预红线并采取实质性行动抑制做多美元情绪[2] - 韩国国民年金公团自12月起抛售美元进行战术性对冲,释放前瞻性维稳信号[2] - 韩国央行行长李昌镛警告,当前韩元“不必要地”走弱,对通胀与增长构成双重风险,呼吁通过政策协调应对[2] 美国金融市场与美联储操作 - 金融博客Zerohedge指出,摩根大通单家银行的大规模提款已足以扰动全美流动性,其行为与2019年回购市场危机如出一辙,正迫使美联储重启“轻量化量化宽松”救市[3] - 美联储因向银行支付高额准备金利息(2024年达1865亿美元)引发批评;参议员Rand Paul称摩根大通一年获150亿美元“闲置资金利息”[3] 美元汇率走势 - 道富集团指出,今年初美元走弱主因是美国投资者大幅削减海外投资外汇对冲比例已减半,而非外资增持美国资产所致[3] - 地缘与政策不确定性正推动去风险化讨论[3] 通胀前景观点 - LPL金融首席经济学家罗奇认为,当前通胀高于目标属暂时现象,未来数月需求降温将缓解物价压力[1]
2026 将近,世界模型到底更「世界」了吗?
机器之心· 2025-12-13 10:30
文章核心观点 - 近期Runway发布新产品,将视频生成推向可交互的“世界模拟”,引发了关于“世界模型”本质的讨论:它究竟是面向创作的界面、用于训练的模拟器,还是面向推理的认知框架[1] - 世界模型的概念在2024至2025年间经历了快速演变,从强化学习语境中的内部环境模型,扩展到更通用的世界演化建模,并与LLM一同被视为通向AGI的关键路线[4][8] - 当前业界对世界模型的定义存在模糊与分裂,主要围绕“如何建模”展开技术路线之争,例如OpenAI的Sora强调像素级模拟,而Meta的V-JEPA强调抽象表征预测[6][7] - 国内外厂商积极布局世界模型,但其动机各异,有的为补充数据引擎,有的为搭建时空认知新框架,融资热潮进一步加剧了概念歧义[3][8] 从 RL 分支到演化建模,世界模型这两年经历了怎样的转变? - **2024年初的强化学习语境**:世界模型最初定义相对收敛,被视为智能体的“内部环境模型”,是一个从当前状态和动作预测下一状态的函数,旨在将试错成本转移到内部推演,提高样本效率和规划能力[4][5] - **工程化能力拆解**:同一时期,世界模型被定义为三类能力的组合:将高维感知压缩为可用表征、在时间上预测未来、以及利用预测进行规划和决策,Transformer和自监督学习开始被纳入讨论,但整体仍是强化学习的延展[6] - **概念外推与通用化**:进入2024年,业内理解开始延伸,将其从“针对具体子任务的动态模型”外推到更通用的世界演化建模,并认为存在“语言生成→图像生成→3D生成→世界生成(同时具备时序与空间序建模)”的趋势链条[6] - **概念边界模糊化**:同时,世界模型的概念边界变得更模糊,表征形式(视频序列还是3D表征)、物理规律的融入方式、输入关系组织等均被视为未收敛的开放问题[6] - **技术路线分化(2024年2月)**: - **OpenAI的Sora路线**:被称为“world simulators”,强调在像素空间中学习现实世界的三维结构与物理规律,并能够模拟世界演化[6] - **Meta(LeCun)的V-JEPA路线**:强调世界模型不是在像素层面补全,而是在抽象表示空间预测被遮蔽的视频片段,允许丢弃不可预测信息以换取更高训练效率,其训练更强调自监督与未标注数据预训练[6] - **核心争议转移**:主题从“要不要做世界模型”转变为“世界模型如何建模”,争议焦点在于应从像素层逐步抽象,还是直接在抽象空间跳过像素细节[7] - **对现有路线的批评**:有研究者认为当前路线(如Sora和V-JEPA)只学到了部分物理规律,距离“完整世界模型”还有差距,提出构成“连贯世界模型”还需要孤立对象的表征、跨时空的先验变化规律以及康德范畴,并指出Sora的缺陷无法通过扩大训练规模弥补,V-JEPA则仍未理解康德范畴[7] 界面、模拟器还是认知框架,世界模型的定义依旧模糊? - **地位提升至与LLM同级**:进入2025年,世界模型被推至与LLM同级的位置,分析认为Google DeepMind、Meta和Nvidia等公司正从纯LLM转向世界模型,目标是实现“Physical AI + 超级智能”,部分原因是LLM路线提升放缓[8] - **与LLM及VLA的差异**: - 世界模型的目标是在内部构建包含物理、时间、空间维度的环境表征,用于规划和决策,可应用于无人机、自动驾驶、机器人等领域[8] - 有观点指出,当前LLM更像启发式方法拼盘,离真正的世界模型还很远[8] - 与视觉语言动作模型相比,世界模型代表了更底层的认知方式,强调物理规律和空间理解,更适合长期演进[8] - **概念同名但内核分裂**:发展至今,世界模型出现了“概念同名但内核分裂”的现象,它可以指代系统内部的潜在状态、给智能体训练用的类游戏模拟器,或任何能生成可走动3D场景的内容管线[8] - **融资热潮放大歧义**:世界模型的融资热潮进一步放大了这种歧义,只要产品贴上世界模型标签,往往很少有人继续追问其是否真正支持预测、规划和泛化[8] - **技术路线三分法**:有分析将世界模型的技术路线重新划分为界面、模拟器和认知框架三条路径[9] 重押还是凑数,国内外各厂商如何布局世界模型? - **布局动机各异**:大厂布局世界模型,动机可能是在补充“数据引擎”,也可能是在搭建“时空认知”的新框架[3]
小米集团:近期豆包 AI 智能手机助手发布后的观点
2025-12-05 14:35
行业与公司 * 行业涉及智能手机与人工智能AI代理领域 公司重点关注小米集团[1][7][10][11][22] * 报告由高盛Goldman Sachs发布 涵盖对小米公司的投资评级与财务预测[23][25][33] 核心观点与论据 AI智能手机助手发展动态 * 字节跳动于12月1日发布了豆包AI智能手机助手的预览版 该系统级图形用户界面GUI代理集成豆包大模型 具备视觉屏幕内容解读和执行跨应用多步骤任务的能力[1] * 豆包AI助手采用混合处理模式 结合端侧AI用于实时任务和云侧AI用于复杂决策 并具备多模态能力[7] * 除字节跳动外 StepFun等AI初创公司也专注于硬件AI助手 并在11月底发布了首个完全开源的GUI代理GELab-Zero 其GELab-Zero-4B-preview模型在多项GUI基准测试中达到SOTA水平[2][8] * 硬件AI助手在豆包大模型上生成巨大流量 5月日均生成1.3万亿tokens 占豆包总token消耗的8%[7] 行业竞争格局与挑战 * 中国智能手机市场集中度高 前六大厂商占据90%以上的出货份额 新进入者市场空间有限[10] * AI与消费电子终端融合趋势持续 主要中国智能手机品牌年内已在操作系统升级中嵌入原生AI助手[10] * AI助手进一步集成面临三大挑战:主流手机厂商的系统级操作权限和内存能力优势 以及跨应用接口连通性问题[9] 小米公司的AI战略与进展 * 小米积极布局AI 研发端侧和云侧大模型 2025年AI研发投入预计超过70亿元人民币 占其总研发费用320亿元人民币的22%[11] * 公司已发布多个专业大模型 涵盖视觉、音频、语音等领域 并于11月21日新推出跨具身基础模型MiMo-Embodied[11][21] * 小米的AI代理"超级小爱同学"是中国市场月活跃用户数排名前三的原生AI助手之一 在小米智能手机用户中的渗透率达到71%[11][19] * "超级小爱同学"具备多场景能力 包括社交媒体互动、电商购物、生产力服务以及本地信息记忆[11] * 小米拥有全球最大规模的互联AIoT设备生态 截至2025年第三季度连接设备数约10亿台[11] 其他重要内容 投资观点与财务数据 * 高盛对小米给出"买入"评级 12个月目标股价为53.5港元 相较当前价格有33%上行空间[22][23][25] * 看好小米基于"人车家全生态"战略的长期生态系统扩张 预计2024-2027年营收和每股收益复合年增长率分别为24%和28%[22] * 财务预测显示 公司2025年预期营收为4694.089亿元人民币 每股收益为1.60元人民币[25] 市场数据对比 * 与中国智能手机市场高度集中相比 中国新能源汽车市场更为分散 前14大厂商份额总和为89% 为新进入者提供了更多机会[10][16][17] * 中国智能音箱市场也呈现高集中度 小米份额从2019年的28%扩大至2025年的45%以上[14][15]
ChatGPT三岁生日,谷歌却为它准备了“葬礼”
虎嗅APP· 2025-12-03 07:55
文章核心观点 - ChatGPT发布三年后AI行业格局发生颠覆性变化,谷歌Gemini 3的强势崛起对OpenAI形成巨大竞争压力[8][9][17][34] - AI技术演进从纯文本对话发展到多模态应用爆发,彻底重塑人类生产效率和社会结构[28][29][33][34] - OpenAI采用独特的融资模式,通过合作伙伴承担近1000亿美元债务来支撑算力扩张,自身财务风险极低[53][54][55][63] 人类被改写的三年 - 2022-2023年:ChatGPT突破图灵测试防线,主要特点是"对话"交互,Prompt Engineering成为热门技术但迅速被AI自身能力瓦解[24][25][27] - 2024-2025年:多模态AI爆发,GPT-4o、Midjourney等模型具备图像、音频、视频处理能力,Vibe Coding和Cursor等工具重塑生产关系[28][29][33] - 2025年成为"奇点体验年",谷歌Gemini 3的卓越表现引发行业格局变化[34] 谷歌重生,OpenAI变天 - 谷歌Gemini移动应用月活用户从5月约4亿激增至6.5亿,用户使用时间已超过ChatGPT[37][39] - 行业领袖评价发生逆转,Hugging Face联合创始人称"天已经变了",Salesforce CEO表示"回不去了"[42][43][44] - OpenAI面临多重压力,内部员工感到竞争压力,公司产品线扩张过快可能影响专注度[46][48][49] OpenAI的独特融资模式 - 合作伙伴为OpenAI承担近1000亿美元债务,相当于全球六大企业借款人净债务总和[53][54][58] - OpenAI自身账上几乎没有欠款,仅拥有40亿美元信贷额度且未动用[55] - 具体债务分布:甲骨文/Vantage债务380亿美元,软银债务200亿美元,CoreWeave债务超100亿美元[53][60][61] - 甲骨文已发售180亿美元债券,未来四年可能还需借款1000亿美元完成OpenAI合同[64] 技术演进对比 - GPT系列性能持续提升:GPT-5在速度、推理能力、token效率、准确性和上下文保留方面均达到最佳水平[23] - OpenAI计划未来8年投入1.4万亿美元用于算力建设,与英伟达、甲骨文、AMD等达成巨额交易[49] - 技术发展带来社会影响:CS课程教授开始教"不写一行代码的"编程课,企业开始大规模裁员[11]
Similarweb(SMWB) - 2025 Q3 - Earnings Call Transcript
2025-11-12 22:32
财务数据和关键指标变化 - 第三季度营收为7180万美元,同比增长11% [5][11] - 客户数量同比增长15%,达到超过6000个年度经常性收入客户 [5][11] - 连续第八个季度实现正自由现金流,第三季度标准化自由现金流为300万美元,自由现金流利润率为4% [5][12] - 剩余履约义务总额为2.68亿美元,同比增长26%,其中68%预计在未来12个月内确认为收入 [12] - 整体净收入留存率为98%,对于年度经常性收入超过10万美元的客户,净收入留存率为105% [12] - 重申2025财年全年营收指引为2.85亿至2.88亿美元,中点同比增长15% [13] - 提高非GAAP营业利润指引至850万至950万美元 [13] 各条业务线数据和关键指标变化 - 生成式AI智能产品年度经常性收入自4月推出后快速增长,已超过100万美元 [5][6] - App Intelligence产品客户数超过580家,年度经常性收入快速增长至超过1000万美元 [8] - AI智能体使用率持续增长,例如27%的销售情报客户使用AI Meeting Prep和新的AI Outreach Agent [7] - 数字应用数据覆盖58个国家超过400万个iOS和Android应用 [9] 公司战略和发展方向和行业竞争 - 公司聚焦于三个高影响力机会:生成式AI智能、为大语言模型销售数据、AI智能体 [5][7] - 10月推出Web Intelligence 4.0,将生成式AI能力集成到网络智能解决方案中 [6] - 9月推出Similarweb MCP Server,可将可信的数字市场情报数据直接输入AI智能体和工作流 [8] - 针对搜索引擎优化流量下降的趋势,公司认为这反而增加了客户对网络智能解决方案的需求,以了解竞争格局并弥补流量缺口 [35] - 在竞争方面,公司相信其独特的数据集和客户关系使其能在生成式AI领域占据主导地位,当前重点在于市场增长和教育而非直接竞争 [58] 管理层对经营环境和未来前景的评论 - 客户对生成式AI数据和解决方案的兴趣非常强劲,是增长最快的收入流之一 [5] - 从2024年第四季度开始的投资按计划进行,并开始看到良好结果,第三季度末销售人员数量同比增加30% [9] - 公司专注于随着时间的推移实现盈利性增长,并实现长期利润和自由现金流目标 [9] - 经营环境方面,企业高层对生成式AI如何影响业务非常感兴趣,同时领先的大语言模型公司也渴望了解公司数据如何帮助改进模型 [52] - 市场动态变化,例如搜索引擎优化流量下降,增加了对公司解决方案的需求 [35] 其他重要信息 - 58%的年度经常性收入合同为多年期合同,高于去年的45% [11] - 新任首席财务官Ron Verrett将于12月加入,拥有超过20年财务经验 [10] - 总收入留存率在第三季度连续改善,为两年来的最高水平 [12] - 新推出的Web Intelligence 4.0定价模式显示出核心产品货币化的初步良好迹象 [37] 问答环节所有提问和回答 问题: 关于总收入留存率趋势和净收入留存率所暗示的向上销售挑战 [16] - 净收入留存率反映的是过去12个月四个季度的平均值,过去一年的大部分扩张来自大语言模型数据的一次性评估项目,这些项目尚未转化为年度经常性收入交易,因此未体现在净收入留存率中 [17] - 预计这些大语言模型数据交易管道将转化为年度经常性收入交易,未来趋势将改变并上升 [17] 问题: 关于大语言模型训练数据合作伙伴关系的演变和转化时间 [18] - 确认大语言模型数据的销售是一个漫长的过程,通常从提供大量历史数据开始,用于测试和改进模型准确性 [19] - 对这些合作最终将转化为长期年度经常性收入交易充满信心,因为已有部分合作方签订了长期承诺 [19] 问题: App Intelligence客户的来源是交叉销售还是新客户 [23] - 大多数App Intelligence客户来自对现有客户的交叉销售,因为现有客户通常同时拥有网站和应用,且信任公司 [25] 问题: 关于本季度连续增长相对较低的原因 [27] - 执行情况良好,部分原因是一些评估合同收入在第二季度提前确认,如果这些收入在第三季度确认,连续增长会更平缓 [28][29] 问题: 关于每用户平均收入下降的原因和未来趋势 [32] - 每用户平均收入受新增客户数量影响,特别是大型客户端增加了一些一次性客户,而许多跨越趋势的客户低于平均水平 [32] - 预期每用户平均收入会随时间波动,对公司而言更重要的是客户数量的增长,以便后续进行向上销售和扩展 [32] 问题: 关于搜索引擎优化流量下降对核心产品需求的影响 [35] - 观察到相反的情况,数字公司需要弥补搜索引擎优化流量下降的缺口,因此对公司提供的市场可见性解决方案需求增加 [35] - 公司正在投资地理扩展和应用扩展产品,并推出了新的网络智能定价模式,对核心产品的货币化保持乐观 [37] 问题: 关于几个季度前增加的销售代表产能的进展 [40] - 看到市场推广效率逐季度改善,本季度有更多销售人员参与创收,但仍在持续优化 [40] 问题: 关于营收未超预期及指引未上调的原因 [44] - 因素包括交易时间安排、季度线性以及公司更侧重于优化息税折旧摊销前利润率,因此在利润指引上实现了超预期和上调 [45] 问题: 关于利润率提高和成本削减的具体驱动因素 [46] - 驱动力包括提高指标纪律性、AI带来的生产力提升允许在不增加研发资源的情况下运行、以及优化市场推广团队,保留高绩效人员 [47] 问题: 关于客户对生成式AI产品的反馈和驱动因素 [50] - 生成式AI优化产品是一个新的渠道,客户对其可见性和成功方法有很多疑问,该渠道对于品牌认知和购买决策非常重要 [50] - 企业高层对生成式AI的影响非常感兴趣,同时大语言模型创建者渴望了解公司数据如何改进模型 [52] 问题: 关于客户组合在企业级和中端市场之间是否有变化 [56] - 中小企业和企业级客户之间的组合基本保持不变,未观察到变化 [56] 问题: 关于竞争格局,尤其是其他公司推出生成式AI产品 [58] - 对生成式AI产品需求旺盛,但公司凭借独特数据集和客户关系有信心成为主导者,当前重点在于市场增长和教育 [58] 问题: 关于第四季度隐含营收指引范围较宽的原因 [59] - 由于拥有强大的管道和非常大的交易,希望保持在该范围内以显示信心,并观察其如何实现 [60] 问题: 关于剩余履约义务强劲增长与合同期限和营收增长的关联 [64] - 看到多年期承诺方面的成功,58%的收入为多年期合同,这显示了数据的价值,并有助于获得更好的剩余履约义务 [65] 问题: 关于销售和营销费用低于预期及销售代表生产力 [66] - 销售团队扩张按计划进行,年初进行了超额招聘,随后优化团队,淘汰低绩效人员,从而使销售和营销效率提高,销售代表产出增加 [67] 问题: 关于管道中大型交易的特征以及对下一年的展望 [70] - 大型交易主要涉及向大语言模型公司或创建最佳大语言模型的公司销售数据,公司的数字数据是构建和训练这些模型的关键要素 [72] - 关于下一年的指引将在下一季度提供 [73]
Similarweb(SMWB) - 2025 Q3 - Earnings Call Transcript
2025-11-12 22:32
财务数据和关键指标变化 - 第三季度收入为7180万美元,同比增长11% [5][11] - 客户数量同比增长15%,季度末年度经常性收入客户超过6000家 [5][11] - 实现连续第八个季度正自由现金流,过去八个季度累计产生4300万美元自由现金流 [5][9] - 第三季度标准化自由现金流为300万美元,自由现金流利润率为4% [12] - 剩余履约义务总额为2.68亿美元,同比增长26%,其中68%预计在未来12个月内确认为收入 [12] - 整体净收入留存率为98%,对于年度经常性收入超过10万美元的客户,净收入留存率为105% [12] - 重申2025年全年收入指引为2.85亿至2.88亿美元,代表中点同比增长15% [13] - 提高非GAAP营业利润指引至850万至950万美元 [13] 各条业务线数据和关键指标变化 - 生成式AI数据和解决方案收入持续扩张,是增长最快的收入流之一 [5] - 生成式AI智能产品自4月推出以来,年度经常性收入已迅速增长至超过100万美元 [6] - AI代理使用率持续增长,例如27%的销售情报客户使用AI会议准备和新AI外联代理 [7] - 类似网站应用智能产品自3月推出后采用强劲,第三季度末超过580家客户使用,年度经常性收入快速增长至超过1000万美元 [8] - 应用智能数据覆盖58个国家超过400万个iOS和Android应用 [9] 公司战略和发展方向和行业竞争 - 公司聚焦三个高影响力机会:生成式AI智能、为大语言模型销售数据、AI代理 [5][6][7] - 10月推出网络智能4.0,将生成式AI能力集成到网络智能解决方案中 [6] - 9月推出类似网站MCP服务器,可将可信数字市场情报数据直接输送到AI代理和工作流中 [8] - 针对搜索引擎优化流量下降的趋势,公司认为这反而增加了对其解决方案的需求,因为客户需要了解竞争格局并驱动更多流量 [35] - 在竞争格局方面,公司对在生成式AI领域成为主导玩家充满信心,因其拥有独特数据集和强大的客户关系 [58] 管理层对经营环境和未来前景的评论 - 客户对生成式AI数据和解决方案的兴趣非常高涨 [5] - 从2024年第四季度开始的市场进入投资正在按计划进行,并开始看到良好结果 [9] - 第三季度末销售人员数量比去年同期增加30%,并看到产量的令人鼓舞的改善 [9] - 公司持续高效运营,专注于长期实现盈利增长以及实现长期利润和自由现金流目标 [9] - 商业环境存在普遍兴奋感,企业高层非常渴望了解生成式AI如何影响业务,同时领先的大语言模型公司也非常渴望了解公司数据如何帮助改进模型 [52][53] 其他重要信息 - 58%的年度经常性收入是在多年合同下签订的,高于去年的45% [11] - 新首席财务官Ran Vered将于12月加入,拥有超过20年财务经验 [10] - 总保留率在第三季度连续上升,是两年来的最高水平 [12] - 第三季度销售和营销费用低于预期,部分原因是公司优化了销售团队,保留了表现最佳的人员 [47][67] 问答环节所有提问和回答 问题: 关于总收入保留率和净收入保留率的趋势 [16] - 净收入留存率反映的是过去12个月四个季度的平均值,过去一年的大部分扩张来自大语言模型数据的一次性任务,这些任务后续会转化为年度经常性收入交易,因此未完全体现在净收入留存率中 [17] - 公司对大语言模型数据销售管道中的大量交易未来转化为年度经常性收入交易充满信心 [17][19] 问题: 大语言模型和训练数据合作伙伴关系的演变 [18] - 向大语言模型公司销售数据是一个漫长的过程,通常从提供大量历史数据开始,用于测试和改进模型准确性 [19] - 公司对大多数这些合作未来转化为具有长期承诺的年度经常性收入交易感到非常自信,因为已经有一些成功案例 [19] 问题: 应用智能客户的来源 [23] - 大多数应用智能客户是交叉销售获得的,公司有超过6000家客户购买其数字数据,应用智能对他们来说是顺理成章的销售 [25] 问题: 本季度连续增长相对较低的原因 [27] - 执行情况良好,但一些大交易难以精确预测,此外部分评估合同收入在第二季度提前确认,影响了第三季度的序列增长 [28][29] 问题: 每用户平均收入下降的原因及未来趋势 [32] - 每用户平均收入受到新增客户数量的影响,许多新增客户低于平均水平,但公司更关注客户数量的增长,因为这为后续向上销售和交叉销售提供了基础 [32] - 季度波动很小,不影响公司的业务思路 [33] 问题: 搜索引擎优化流量下降对核心产品需求的影响 [35] - 公司认为趋势相反,数字公司需要弥补搜索引擎优化流量下降的缺口,因此对其解决方案的需求反而增加 [35] - 公司投资于搜索引擎优化和应用商店优化产品,并推出了网络智能4.0和新定价模式,看到了核心产品货币化的初步良好迹象 [37] 问题: 几个季度前增加的销售代表 ramp-up 情况 [40] - 市场进入表现季度环比改善,本季度有更多销售人员参与产生收入,公司持续优化以期更强表现 [40] 问题: 业绩和指引未像往常一样超越并提高收入指引的原因 [44] - 原因包括交易时间安排、季度线性以及公司更侧重于优化息税折旧摊销前利润率,因此在利润指引上实现了超越并提高 [45] 问题: 驱动利润率提高和成本降低的具体因素 [46] - 因素是综合性的,包括公司决定更注重该指标并更自律,AI助力提高生产力使得工程团队无需增长,以及对市场进入团队的优化,保留表现最佳者 [47] 问题: 关于生成式AI产品的客户对话和驱动因素 [50] - 生成式AI优化产品是一个新的渠道,客户需要了解如何获得可见性并取得成功,因为聊天机器人的回答正在定义品牌认知和购买决策,这对客户非常重要 [50] - 企业高层对生成式AI如何影响业务非常感兴趣,同时领先的大语言模型公司也渴望了解公司数据如何帮助改进模型 [52][53] 问题: 客户组合在企业级和中端市场之间是否有变化 [56] - 中小型企业客户和企业级客户的组合保持稳定,未观察到变化 [56] 问题: 竞争格局 [58] - 生成式AI产品需求旺盛,但公司自信能成为主导玩家,因其拥有独特数据集和强大客户关系,目前更关注市场增长和教育,而非特定竞争对手 [58] 问题: 第四季度收入指引范围较宽的原因 [59] - 原因是公司拥有强大的管道和非常大的交易,希望将指引保持在该范围内,并对实现目标充满信心 [60] 问题: 剩余履约义务指标强劲的原因及其与收入增长的关系 [64] - 公司在获得多年承诺方面取得良好成功,58%的收入以多年合同形式签订,这显示了公司数据对客户的价值,也帮助改善了剩余履约义务指标 [65] 问题: 销售和营销费用及销售代表生产力 [66] - 销售人员的 ramp-up 按计划进行,公司在第一季度过度招聘以确保规模,然后优化团队,淘汰表现不佳者,从而提高了销售和营销效率和单产 [67] 问题: 管道中的大交易特征以及明年展望 [70] - 大交易主要来自向大语言模型公司或致力于创建最佳大语言模型的公司销售数据,公司的数字数据是构建和训练这些模型的关键要素,一旦经过漫长的评估过程证明价值,就会形成非常粘性和长期的合作 [72] - 关于明年的指引将在下一季度提供 [73]