Workflow
「第二次 Token 大战」或再打响,「新全栈」或许才是内卷的「解药」
雷峰网· 2026-05-13 21:33
文章核心观点 - AI行业正从大语言模型(LLM)驱动的“Token价格战”阶段,向以智能体(Agent)为核心、追求更高价值交付的“价值战”阶段转型 [2][6] - 公司提出“新全栈AI云”战略,旨在通过构建从底层算力到上层应用的全栈、一体化生态系统,帮助客户高效开发并运行智能体,实现从单纯提供技术到共建生态的转变 [3][30][31] - 公司的目标是跳出当前以“龙虾”(OpenClaw)为代表的、以降低Token成本为核心的竞争模式,通过提供更优的模型能力、工程效率和场景化解决方案,与客户共同成长,成为伙伴而非简单的买卖关系 [6][31][32] 新全栈AI基础设施(AI Infra)的升级 - **异构算力布局**:公司与昆仑芯深度合作,昆仑芯P800已完成规模化验证,2025年以来已交付多个万卡集群,并在国产集群上成功完成文心5.1大模型的训练,集群有效训练率达97%,万卡规模线性扩展度超85% [7] - **算力集群与能效**:实现了吉瓦级AIDC(AI数据中心),支持风冷或液冷的灵活适配以降低建设与电力成本 [7] - **网络与存储优化**: - 网络层面,通过多平面技术实现大规模全二层网络,提升负载均衡与传输效率,并具备链路故障容错能力 [10] - 存储层面,推出全新KV Cache存储系统,通过分层显存、内存、SID来扩展大模型的记忆空间 [10] - **计算平台演进**:发布百舸AI计算平台6.0版本,将其升级为“算力工厂”,并推出百舸AI Stack支持私有化部署,让用户无论在公有云或私有云都能使用最新AI能力 [11] - **框架与性能提升**: - 开源全模态训练框架Loongforge,使英伟达GPU与昆仑芯可通过同一框架运行,相比典型多模态训练提速45% [13] - 依托全栈AI Infra,具身智能公司在典型VLA(视觉-语言-动作)训练上获得超70%的加速,世界模型推理时延降低近50% [13] 智能体基础设施(Agent Infra)的革新 - **架构设计**:为支撑智能体高效运行,公司设计了三层架构:底层的智能体驾驭工程(Harness)、中层的模型服务、上层的基础服务(安全、可观测性等) [20][23][24] - **底层驾驭工程(Harness)**: - 自研DuMate Harness架构,在智能体评测基准PinchBench和Deepsearch榜单登顶,能缩短任务时长、减少Token消耗,并在信通院首批认证中获得最高安全评级 [22] - 集成超过3000个精选技能(Skills),包括Office办公软件和浏览器技能,增强企业跨生态任务执行能力 [22] - **中层模型服务优化**: - 通过上下文与Cache管理及全局推理资源调度,在长链路任务中减少重复计算,调用SOTA模型的速度比行业平均高出25% [24] - 在投机解码框架中集成多Token预测(MTP)策略,使OTPS(每秒输出Token数)吞吐提升2-3倍,模型验证通过命中率超80% [24] - **上层安全与服务**:针对OpenClaw等存在的安全问题,千帆平台强化了会话隔离、数据隔离、防误删等功能以保障用户数据与权限安全 [25] 市场应用与生态案例 - **金融领域**:招商银行已上线超800个AI应用,其中超过50%运行在昆仑芯P800上,公司提供了从算力适配到应用落地的全流程协助 [9] - **能源领域**:与国家电网合作,基于千帆ModelBuilder和文心大模型4.5打造“光明电力大模型”,用于电网负载分析、智能调度与多模态巡检 [25] - **智能硬件领域**:拥有超1000家智能硬件客户,在细分赛道云厂商中排名第一,并帮助荣耀打造个人助手YOYO,集成于用户手机使用习惯中 [25] - **具身智能领域**:是具身智能领域最大的AI云供应商,市场份额占35%,超过第二、三名之和,提供从算力到全链路模型开发工具链的支持 [11] - **产业落地**:视觉智能体“百度一见”在义乌充当企业的“AI厂长”管理生产;“数字伙计Hogee”在义乌帮助商家进行智能导购、私域运营等营销工作 [27] 行业趋势与公司战略定位 - **行业范式转变**:AI Agent的普及导致Tokens消耗成数倍甚至十倍上升,推动云服务需求从基础算力转向支持高活跃、高价值、规模化智能体应用的基础设施 [2][6] - **竞争焦点转移**:行业竞争正从“Token价格战”转向“AI价值战”,客户需求从“人无我有”的功能比拼,变为对一站式、无短板全栈能力的要求 [6][19] - **生态战略**:“新全栈”的核心是构建生态系统,让客户能在其生态内高效使用算力、微调模型、开发智能体,最终实现降本增效,从而与生态深度绑定 [31] - **业务健康度**:公司不过度追求KPI,曾拒绝许多“低质调用”商单,如今随着市场对AI能力认知加深,更高质量、客户更愿付费的调用正在涌现 [31]
黄仁勋最后时刻挤上飞向北京的“空军一号”,原因揭秘→
第一财经· 2026-05-13 21:32
公司动态与高层活动 - 英伟达创始人兼CEO黄仁勋在最后一刻登上美国总统专机“空军一号”,随行前往北京,其名字最初未出现在白宫公布的16位商业巨头随行名单上 [1] - 黄仁勋的加入源于前总统特朗普在看到媒体关于其缺席的大量报道后,亲自致电邀请,黄仁勋随即飞往阿拉斯加中途搭上专机 [1] - 英伟达官方声明此次行程为“应总统邀请,支持美国及政府目标出席峰会”,黄仁勋成为美国豪华商界代表团的最后一位成员,同行的包括库克、马斯克等其他商业巨头 [1]
你还在等"准备好"再出手?顶级创始人早就按另一套逻辑在行动了
深思SenseAI· 2026-05-13 21:30
文章核心观点 - 文章提出了“10倍思维”的概念 这是一种顶尖创始人的思维方式 其核心在于以“已经领先10倍”或“已经赢了的未来”的状态来运作和决策 从而创造出超常规的结果[7][16][17] - 10倍思维与成长型思维互补但不同 成长型思维关注“未来会变好” 而10倍思维的时态是“现在” 即“我已经在那里了” 这直接改变了决策的参考系和逻辑[13][16][17] - 这种思维方式之所以有效 关键在于真实的信念 当创始人确信自己正在超出现实范围运作时 这种信念会感染周围的人 使其被视为“例外” 从而能够按不同的规则行事[30][31][32] 01 思维的起点 - 创业者的成功很大程度上取决于其信念 信念直接决定行为 进而决定成功的概率[7] - 在创始人中 有两种重要的思维方式反复出现:一种是Carol Dweck提出的成长型思维 另一种是更顶尖的创始人所具备的10倍思维[7][8] 成长型思维 - 成长型思维认为能力不是固定的 可以通过努力变好 其核心是相信努力是能力的核心 挣扎是过程的一部分 好事需要时间但终会到来[11] - 这种思维对于“坚持”非常有价值 是很多人撑过创业早期艰难阶段的地基 但它是一个必要条件 而非充分条件[12][13] 03 什么是10倍思维 - 10倍思维的创始人以“我已经领先10倍”的状态运作 他们视障碍为需要穿过的节点 而非终点 并认为世界的物理规律可能不适用于自己[17] - 其决策逻辑与成长型思维完全不同 关键在于真实地相信这个状态 而非假装或自欺欺人 这导致“已经赢了的你”和“还在等许可的你”做出的决定截然不同[17][18] 04 拒绝10亿美金 - 2006年 Facebook创始人扎克伯格拒绝了雅虎10亿美金的收购要约 尽管当时公司不到两岁 用户规模不大 且周围几乎所有投资人和顾问都建议接受[19][22] - 拒绝后 扎克伯格与微软谈成了一笔战略投资 该投资对Facebook的估值高达150亿美金 尽管当时他手中并无支撑此估值的实质资产[20][21] - 这体现了10倍思维 他的决策框架是基于Facebook未来必将到达的那个宏大愿景 而非当时的现实状况[22] 05 闯进出租车行业 - Uber创始人Travis Kalanick面对的是整个出租车行业的利益方、监管机构和城市政府构成的系统性障碍[24] - 他的处理方式不是寻找阻力小的切入点慢慢推进 而是直接在城市上线服务 面对诉讼并继续推进 因为他坚信这件事应该存在 障碍只是路上的节点[24] - 这种做法改变了整个出行经济 做到了大多数人不敢想的事[25] 06 干掉实体键盘 - 2007年 iPhone发布时 乔布斯决定去掉实体键盘 尽管当时所有运营商和硬件厂商都认为用户习惯按键 没有按键会失败[26] - 乔布斯没有在“用户现在喜欢什么”的框架里决策 而是在“未来应该是什么样子”的框架里决策 他提出“整个屏幕都是键盘”[27] - 这重新定义了一代计算范式 他直面的是“用户习惯”这一最难改变的东西[28] 07 信念感染周围 - 10倍思维有效的核心是真实的信念 创始人需要确信自己正在超出现实的范围运作[30] - 当这种信念是真实的 周围的人能感受到 并开始将其视为“例外” 而“例外”可以按照不同的规则行事[31] - 这种确信感具有很强的传染性 能吸引投资人、合作伙伴和顶尖员工[31][32] 08 三个具体做法 - **第一:直面最大的障碍** 不绕开 而是将那些被认为“花时间太长”、“难度太高”的问题放到最前面解决[35] - **第二:按照10倍估值要求今天的自己** 假设公司估值已是现在的10倍 并以此标准来要求今天的招聘、决策和里程碑[36] - **第三:按照10倍团队容量来思考组织架构** 即使团队只有10人 也按100人的思路设计架构和流程 从而改变今天的招聘优先级[36] - 10倍思维不是关于工作量乘以10 而是关于改变决策时的参考系 例如按10倍估值行事会改变招聘标准、会议议程和谈判姿态[38] 09 操作系统,不是信仰 - 思维方式在某个节点会从一套信念体系转变为像“操作系统”那样在底层自动运转[40] - 10倍思维就像开车五年后的状态 参考系已经改变 不需要每次都做“要不要勇敢”的刻意选择 行动已经自动化[40] - 扎克伯格拒绝10亿美金收购的决定 并非在会议室里艰难做出 而是其“操作系统”已经就位的结果[41] 这是质变而非量变[42] 10 对我们意味着什么 - 10倍思维容易走歪 被用来合理化不负责任的行为 如掩盖准备不足或逃避现实约束[46] - 因此 10倍思维需要一个未写明的前提:所做之事必须是真正值得做的 而不是为任何决定找借口[46] - 成长型思维与10倍思维是互补关系 最顶尖的创始人同时拥有这两种思维[46][47] - 对于非创业者 其启示在于可以主动打破“等到条件成熟再行动”的模式 按照“想成为的状态”来即刻决策[48] - 实践10倍思维的关键在于拥有清晰、具体的愿景 如果愿景模糊 10倍思维就缺乏真实锚点 可能陷入更大的幻觉而非未来[49]
阿里巴巴,最新业绩出炉!AI业务新消息
券商中国· 2026-05-13 21:28
核心观点 - 公司AI业务已跨越初期投入阶段,正式迈入商业化回报周期,AI相关产品收入连续第十一个季度实现三位数增长,云智能集团外部商业化收入增长加速至40% [2][9] - 公司整体收入增长平缓,但若剔除已处置业务影响,同口径增长强劲;利润端因战略投入加大而承压,但净利润因投资收益等因素同比大幅增长 [3][4][5] - 公司宣布派发2026财年年度现金股息,总额约25亿美元 [7] 财务表现 - **季度收入**:截至2026年3月31日止季度,公司收入为人民币2433.80亿元,同比增长3% [1][4]。若不考虑已处置的高鑫零售和银泰业务,同口径收入同比增长为11% [4] - **季度利润**:报告期内,公司经营亏损为8.48亿元,而2025年同期为经营利润284.65亿元 [4]。经调整EBITA为51.02亿元,同比下降84% [4]。归属于普通股股东的净利润为254.76亿元;净利润为235.02亿元,同比增长96% [4] - **非公认会计准则净利润**:季度非公认会计准则净利润为0.86亿元,相较2025年同期的298.47亿元下降100% [5]。非公认会计准则摊薄每股美国存托股收益为0.62元,同比下降95% [5] - **现金流**:季度经营活动产生的现金流量净额为94.10亿元,同比下降66% [5]。自由现金流为净流出173.00亿元,而2025年同期为净流入37.43亿元,下降主要归因于对即时零售、千问App用户获取及云基础设施的投入 [5] - **全年业绩**:2026财年(截至2026年3月31日止财务年度)收入为10236.70亿元,同比增长3% [5]。经营利润为501.50亿元,同比下降64% [5]。归属于普通股股东的净利润为1059.04亿元;净利润为1021.27亿元,同比下降19% [5] - **现金储备**:截至2026年3月31日,公司现金及其他流动投资为5208.24亿元 [5] 业务与战略进展 - **中国电商集团**:新财年已将淘宝天猫电商业务与千问App打通,并在淘宝App中推出千问AI购物助手 [9]。在商家端推出了企业级AI原生智能体“悟空” [9] - **国际数字商业集团**:本季度亏损同比大幅收窄并接近盈亏平衡,主要由于物流优化和运营效率提升 [9]。速卖通Choice业务的单位经济效益环比继续显著改善 [9] - **云智能集团**:季度收入为416.26亿元,同比增长38% [9]。外部商业化收入同比增长加速至40% [9]。AI相关产品收入达89.71亿元,实现连续第11个季度三位数同比增长,占外部收入比重首次超过30% [9] - **AI与芯片进展**:平头哥GPU芯片已实现规模化量产,截至2026年2月累计规模化交付47万片 [10]。在阿里云的实际业务场景中,超过60%的平头哥芯片服务于外部商业化客户,已完成规模化外部客户AI任务适配,支持了400多家企业客户的AI任务 [10]。4月发布的Qwen3.6-Plus大模型在多项能力上实现跃升 [10] 股东回报 - 董事会批准派发2026财年年度定期现金股息,每股普通股0.13125美元或每股美国存托股1.05美元,股息总额约为25亿美元 [7]
AI投入全面加码!腾讯,最新发布!马化腾:显著突破!
券商中国· 2026-05-13 21:28
2026年第一季度财务表现 - 公司实现营收1964.6亿元人民币,同比增长9% [2] - 权益持有人应占净利润为580.93亿元人民币,同比增长21%;非国际财务报告准则下权益持有人应占净利润为679亿元人民币,同比增长11% [2] - 一季度自由现金流达567亿元人民币,经营活动产生现金净额为1014亿元人民币,期末现金净额从去年末的1071亿元增长至1469亿元人民币 [2][11] 核心业务板块收入分析 - **增值服务**收入961.1亿元人民币,同比增长4%,占总收入49% [7] - 本土市场游戏收入454亿元人民币,同比增长6%,剔除春节假期错期影响后流水同比增长达十几个百分点 [7] - 国际市场游戏收入188亿元人民币,同比增长13% [8] - 社交网络收入同比下降2%至319亿元人民币,同样受春节错期影响 [8] - **营销服务**收入381.71亿元人民币,同比增长20%,占总收入19% [4][7] - **金融科技及企业服务**收入598.85亿元人民币,同比增长9%,占总收入31% [7] - 企业服务收入同比增长20%,得益于云服务收入增长及微信小店交易额上升带动商家技术服务费增加 [8] AI战略进展与商业化 - 2026年是公司AI战略从投入期迈向商业转化的关键一年 [3] - 一季度研发开支约225.42亿元人民币,同比增长19%,主要用于AI相关投入 [3] - 重组后的AI研发团队重构了AI基础设施,搭建了Hy3 preview模型,在同等参数规模模型中性能领先,自4月28日以来在OpenRouter的token消耗量排行榜上稳居前列 [3][9][10] - AI驱动核心业务提效转化,营销服务增长20%主要由微信生态流量与AI驱动的广告推荐模型升级推动 [4] - AI技术已融入游戏研发与体验链路,覆盖3D资产、画面质量与NPC交互等环节 [7] AI应用产品与投入 - 加速AI应用上新节奏,“龙虾”体系成为新品发布重点,一季度以来密集推出WorkBuddy、QClaw、ClawPro、Marvis等多款面向企业和用户的Agent产品 [10] - WorkBuddy以日活计,已成为目前中国使用最广的效率AI智能体服务 [10] - 为支持AI原生应用程序及新游戏发展,销售及市场推广开支达113.43亿元人民币,同比大增44% [9] - 为支撑模型迭代和AI基础设施建设,本季度资本开支319.4亿元人民币,同比增长16% [9] 微信生态与用户数据 - 微信及WeChat合并月活跃用户数增长至14.32亿,同比增长2% [11] - 视频号扩大内容推荐模型参数规模并优化算法,带动整体用户时长同比增长 [11] - 微信搜索整体搜索量上行,小程序升级底层架构以方便开发者借助CodeBuddy等工具 [11] - AI小程序成长计划启动以来,生态内已涌现超2.7万个AI小程序 [11] - QQ移动终端月活账户数同比下降3%至5.16亿,但环比回升2% [11] 股东回报与资金动向 - 一季度共回购1265万股股份,总代价约76亿港元,而2025年第四季度回购金额约为120亿港元,环比力度有所减弱 [11] - 业内分析认为,公司或正将更多现金用于AI基础设施投资 [11]
缺墨了?零食巨头多款产品将变黑白包装
券商中国· 2026-05-13 21:28
公司核心决策 - 日本零食巨头卡乐比公司宣布,由于中东冲突导致油墨原料价格飙升,将暂时把旗下14款产品的包装改为黑白配色,其中包括薯片、麦片等知名产品 [1] - 新包装产品将于5月25日正式上架开售 [1] - 公司表示,在无法预判中东局势未来走向的情况下,将把稳定供货放在首位 [1] 行业影响与趋势 - 日本多家食品饮料企业均面临相同问题,伊藤火腿-米久控股公司社长表示,今后彩色包装生产可能出现困难,有可能采用黑白简单包装 [4] - 自霍尔木兹海峡运输受阻以来,印刷油墨和塑料生产所需的重要原料石脑油价格飙升,石脑油是石油产品之一 [1] - 日本约四成的石脑油消费依赖中东进口 [1]
刚刚,集体大涨!芯片,再传利好!三星突遭“变数”,影响几何?
券商中国· 2026-05-13 21:28
AI驱动存储芯片市场繁荣 - 市场处于“AI早期采用阶段”,科技股盈利前景有支撑 [2] - 韩国海关数据显示,2026年4月1日至5月10日期间,DRAM与NAND闪存价格大幅跳涨 [2][4] - 裸DRAM芯片价格环比涨幅超过20%,同比涨幅接近500% [2][4] - NAND闪存产品价格环比飙升63.1%,同比涨幅达351.6% [4] - HBM(高带宽存储器)价格环比上涨18.7%,同比涨幅达165.5% [4] - 市场研究机构TrendForce预计NAND价格在本季度内将累计上涨70%至75% [6] 主要公司表现与动态 - **SK海力士**:股价持续上涨,年内累计涨幅扩大至204%,总市值升至1408.3万亿韩元(约合人民币6.4万亿元) [4] - **SK海力士**:股价盘中一度大涨超8%,再创历史新高 [2] - **三星电子**:因劳资谈判未达成协议,股价一度大跌超6%,收盘时转为上涨1.79% [2][8] - **英特尔**:美股盘前涨超4% [2] - **闪迪**:美股盘前涨超5% [2] - **英伟达**:美股盘前涨近2% [2] 行业趋势与厂商布局 - AI算力扩张深度拉动DRAM需求 [4] - HBM是英伟达等AI芯片平台的关键存储解决方案 [4] - 行业重心明显向AI导向的存储产品倾斜,美光、三星、SK海力士、铠侠等厂商加速布局 [5] - 企业级合同价格涨势突出:基于MLC颗粒的SSD合同价格上涨约50%,SLC颗粒SSD合同价格上涨约20% [5] - SK集团旗下SKC计划筹资1.17万亿韩元(约人民币53亿元),其中约5896亿韩元(约人民币27亿元)将投向子公司Absolix,以支持未来三年的玻璃基板量产计划 [6] - Absolix生产的样品正接受AMD和亚马逊云服务(AWS)等公司测试,或于今年年底前启动量产,成为全球首个此类项目 [6] 三星电子劳资谈判风险 - 三星电子与工会未能在最后一刻达成工资协议,加剧罢工风险 [8][9] - 工会要求将15%的营业利润用于员工奖金并写入合同,公司提出10%的利润用于奖金并提供一次性特别补偿 [9] - 工会重申若诉求未满足,逾5万名工人将于5月21日起展开为期18天的全面罢工 [10] - 分析警告生产中断可能波及全球半导体供应链,加剧存储芯片供需紧张 [10] - 罢工可能导致客户出货延迟、芯片价格进一步上涨,并使美光、SK海力士等竞争对手受益 [10] - 韩国水原地方法院定于5月13日就三星电子申请的禁令举行第二次听证,预计在5月20日(罢工前一天)前作出裁决 [10][11]
【财闻联播】沙特原油产量再度下滑,创1990年以来新低!MSCI中国指数新纳入22只成份股
券商中国· 2026-05-13 21:28
★ 宏观动态 ★ 预告:国新办5月18日举行新闻发布会,介绍2026年4月份国民经济运行情况 国务院新闻办公室将于2026年5月18日(星期一)上午10时举行新闻发布会,请国家统计局新闻发言人、总经 济师、国民经济综合统计司司长付凌晖介绍2026年4月份国民经济运行情况,并答记者问。 央行公开市场今日净回笼255亿元 央行今日开展5亿元7天逆回购操作,操作利率为1.40%,与此前持平。因今日有260亿元7天期逆回购到期,当 日实现净回笼255亿元。 上期所调整白银期货相关合约涨跌停板幅度和交易保证金比例 上期所发布关于调整白银期货相关合约涨跌停板幅度和交易保证金比例的通知。经研究决定,下述合约自上市 时起,涨跌停板幅度和交易保证金比例调整如下:白银AG2705合约的涨跌停板幅度为17%,套保持仓交易保 证金比例为18%,一般持仓交易保证金比例为19%。如遇《上海期货交易所风险控制管理办法》第十三条规定 情况,则在上述涨跌停板幅度、交易保证金比例基础上调整。关于涨跌停板和交易保证金的其他事项按《上海 期货交易所风险控制管理办法》及相关业务规则执行。 上期所对部分客户采取限制开仓监管措施 上海期货交易所5月13日 ...
8岁小孩哥「聊出」操作系统,一部手机、几句话,原生App直接生成
机器之心· 2026-05-13 21:25
文章核心观点 - AI编程的门槛被大幅降低,使得没有代码基础的个人(如8岁儿童)也能通过自然语言对话生成功能完整的软件应用,这标志着“超级个体”时代的到来[1][2][3][4] - 百度秒哒3.0的发布是一次系统性重构,其核心目标是“降低门槛到极致,提升能力到生产级”,旨在为AI应用开发提供一个真正的全栈解决方案[5][6][7][12] - 该产品通过四个维度的升级,打破了从创意到交付的多重壁垒,使AI生成的应用从可演示的Demo走向可上架、可协作、可商用的真实产品[23][40][65] 秒哒3.0的系统性升级 - **移动端独立App双端上线**:正式上线Android端,iOS版即将上线,成为国内首款专业级AI应用开发App,用户可通过语音或文字在手机上完成应用生成、修改、调试到发布的全流程[17][24] - **原生支持iOS/Android应用生成**:支持生成iOS和Android原生应用,提供安卓一键打包、在线热更新能力,是国内首个实现移动端全链路开发的AI编程平台[33][34][36] - **企业版正式发布**:提供企业、团队、成员三级权限,支持资源配额、数据隔离、测试与生产环境分离,并承诺企业级SLA保障,是行业首家对AI生成应用做出企业级高可用许诺的产品[45][47][48] - **Agent能力全面扩展并开放自定义Skill接入**:将信息调研、数据分析、PPT制作等上下游能力打通,并允许用户将内部API、私有数据库等封装成自定义Skill接入,让Agent能执行更贴近具体场景的任务[54][56][58] 秒哒的核心优势与能力 - **全栈应用,一键分发**:支持生成网页、微信小程序、小游戏、原生APP等多种应用形态,并可一次性生成多种形态,实现一键分发[15] - **端到端全栈生成**:不仅能生成前端界面,还能自动生成后端逻辑与数据存储系统,提供持续运维能力,使应用从“可看”的页面变为“可运转”的完整应用[19][20][21] - **丰富的插件与生态**:通过插件机制接入更多AI功能和业务功能(如语音输入、图片识别、数据统计),并打通百度搜索、微信生态等分发渠道[14][22] - **高效的移动端与协同体验**:手机端与PC端核心能力一致、项目进度无缝衔接,用户可随时随地用手机捕捉灵感并开始创作,大幅压缩从灵感到实现的等待时间[26][29][30][31] - **极简的开发与调试体验**:支持在线调试与实时预览,无需本地反复打包编译;其移动端App自身90%的代码由秒哒智能体自动生成,展示了强大的自我构建能力[28][37] 产品影响与市场定位 - **服务对象从个人扩展到企业**:产品不仅服务于个人创作者和“超级个体”,还通过企业版切入更复杂的企业级商业场景,满足其对安全、稳定、可管理和多人协作的需求[41][44][50][53] - **重塑应用开发流程与成本**:使个人开发者凭借一部手机和一段对话就能完成过去需要一个技术团队才能推进的产品雏形与打包交付;帮助中小企业以更低成本将业务需求转化为专属APP,完成产品验证与流程数字化[35][40] - **推动“超级个体”与“一人公司”(OPC)崛起**:产品累计生成的应用已服务用户超1000万,应用总价值达50亿元,平台上正成长着近百万超级个体和OPC,其中最高收入可达1000万[64][67] - **体现百度新全栈AI能力**:秒哒3.0是百度从芯片、云、模型、智能体到应用层的新全栈AI能力在应用创造场景中的集中体现与释放[60] 行业趋势与概念 - **AI编程(Vibe Coding)的新范式**:其核心价值不在于培养更多程序员,而在于让无数没有代码基础的人能够将想法落地成软件,参与软件生产[4][64] - **“超级个体”时代到来**:AI智能体编队使得“一个人加上一支智能体编队”成为最小生产力单元,人人都有潜力成为超级个体[60] - **新的行业度量标准——日活智能体数(DAA)**:百度创始人提出,未来衡量平台生态繁荣度应关注DAA指标,并预测全球日活智能体数可能超过100亿[62]
ICML 2026 | 将多教师冲突转化为动态约束,破解多模态大模型推理对齐难题
机器之心· 2026-05-13 21:25
文章核心观点 - 悉尼科技大学研究团队提出了一种名为自主偏好优化(APO)的新框架,旨在解决多模态大模型在多教师知识蒸馏中因“概念漂移”导致的对齐难题 [1] - APO框架的核心创新在于,它将多源教师模型间不稳定甚至冲突的推理轨迹(即“概念漂移”)转化为动态负约束,同时将模型间的“共识”作为正向偏好引导,从而驱动学生模型实现稳健的推理对齐 [1][4] - 在医疗诊断等高动态、高风险领域的实验中,采用APO框架训练的7B参数学生模型,其平均诊断准确率达到0.78,超越了包括GPT-5在内的所有教师模型,证明了该框架在整合集体智慧、提升模型稳健性方面的有效性 [20][22] 方法:APO框架设计 - **问题定义**:研究团队将多源MLLM蒸馏定义为非平稳条件下的约束满足问题,正式提出了“非平稳多流概念对齐”问题 [4][9] - **两阶段协议**:APO框架通过两阶段协议工作。第一阶段是“监督引导的共识合成”,学生模型吸收所有教师模型的异构知识,并自主提炼出一条高度逻辑自洽的共识轨迹 [9][14]。第二阶段是“约束感知的偏好优化”,将共识轨迹作为正向引导,将教师模型相互冲突的推理轨迹重构为动态负约束,通过扩展的DPO进行优化,强制模型提升共识概率并压制漂移模式 [15][16][17] - **技术核心**:该框架的关键在于将教师模型间的推理冲突从干扰噪声转化为强有力的监督信号,从而在无需外部标注的情况下,自主勾勒出大模型鲁棒的推理流形 [17] 实验验证与效果 - **数据集**:为评估APO效果,研究团队构建了CXR-MAX基准数据集。该数据集基于MIMIC-CXR扩展,汇集了来自GPT-5、Gemini-2.5等7个主流MLLM的推理轨迹,包含170,982个实例,涵盖14种胸部疾病 [19] - **性能表现**:在胸片疾病诊断任务中,APO训练出的7B学生模型取得了0.78的最高平均准确率,超越了所有参数量更大的教师模型(如GPT-5平均准确率0.75) [20][22] - **稳定性优势**:在教师模型表现分歧巨大的疾病类别上(如实变和水肿,模型间准确率落差超过70%),APO学生模型在几乎所有类别中都稳居前二,展现出极强的稳定性 [22] 行业意义与应用前景 - **范式转变**:APO的提出标志着多教师蒸馏学习从“静态学习”向“动态约束”迈出了关键一步,为解决模型间的概念对齐问题提供了新思路 [23] - **应用价值**:该框架为高风险、高动态的复杂领域(如医疗诊断)的模型自主演化与稳健推理提供了一种全新的解决方案 [1][23] - **技术潜力**:通过将“概念漂移”转化为可利用的约束,APO框架展示了如何有效整合多个大模型的差异化优势,使紧凑型模型能够“站在巨人的肩膀上”实现性能突破 [22]