Workflow
Software and Internet
icon
搜索文档
姚顺雨腾讯首篇论文:给AI下半场指路“上下文学习”
搜狐财经· 2026-02-04 18:20
文章核心观点 - 当前最先进的大型语言模型在真实世界的复杂任务中表现不佳,其核心缺陷在于严重依赖预训练获得的静态“参数化知识”,而缺乏从给定上下文中实时学习并应用新知识的能力,这阻碍了AI从“做题家”向实用工具的转变 [4][6][27] - 腾讯混元与复旦大学团队推出的CL-bench基准测试量化了这一差距,测试显示即便最强的GPT-5.1 (High)模型,在必须从上下文中学习新知识才能解决的任务上,总体解决率也仅为23.7% [4][19][23] - 该研究呼应了“AI下半场”的判断,即行业重点应从盲目扩大模型规模转向提升模型在真实任务和系统中的评估与实用能力 [2][27] AI模型能力评估与瓶颈 - **整体表现堪忧**:在CL-bench的500个复杂上下文、1899个任务上,评估的十个前沿语言模型平均仅解决了17.2%的任务,表现最好的GPT-5.1 (High)解决率为23.7%,最差的DeepSeek V3.2 Thinking解决率为13.2% [19][23] - **跨场景能力不均**:模型在四类上下文学习场景中表现存在差异,在“经验发现与模拟”这类需要归纳推理的任务上表现最差,GPT-5.1 (High)在此类任务上的解决率仅为18.1%,而多数模型在此类任务上的解决率通常低于10% [8][23][25] - **错误根源分析**:模型失败的主要原因是忽略或误用上下文,而非信息缺失。例如,GPT-5.1 (High)有55.3%的错误源于忽略上下文,65.4%的错误源于误用上下文。模型倾向于依赖预训练的静态知识,而非学习上下文中的新规则 [23][24] - **推理强度作用有限**:增加模型的推理强度对提升上下文学习能力效果有限。例如,GPT-5.1在部分任务上提升约6%,但其他模型提升有限甚至可能下降,表明仅靠更多推理步骤并不足够 [29] CL-bench基准测试设计 - **测试目标明确**:基准旨在量化模型从上下文中学习预训练中不存在的新知识并加以应用的能力,其设计原则是解决任务必须依赖上下文学习 [6] - **内容构建严谨**:基准包含500个由领域专家精心制作的复杂上下文、1899个任务和31607个验证标准。为确保无数据泄露,内容采用完全虚构、修改现实或整合极小众资料的方式构建,每个上下文平均耗时约20小时标注 [6][19] - **覆盖场景广泛**:测试涵盖四种现实世界场景:1) 领域知识推理(如新法律、金融工具);2) 规则系统应用(如新游戏机制、编程语法);3) 程序性任务执行(如工作流手册);4) 经验发现与模拟(从数据中归纳规律) [8] - **有效性验证**:在不提供上下文的情况下,GPT-5.1 (High)仅能解决不到1%的任务,有力证明了任务设计有效,模型几乎无法凭记忆解决 [19] 行业发展趋势与公司动向 - **研究方向转变**:行业研究重点正从“训练大于评估”的上半场,转向“评估大于训练”的下半场,更关注模型在真实任务中的检验而非单纯堆叠规模 [2][27] - **腾讯的布局**:提出“AI下半场”判断的姚顺雨已正式加盟腾讯,担任总办首席AI科学家,并向总裁刘炽平汇报,同时兼任AI Infra部、大语言模型部负责人,此项CL-bench研究由其提供建议并由腾讯混元与复旦大学团队合作完成 [27] - **未来目标明确**:研究团队指出,当前明确的目标是让上下文学习能力真正走向现实,这将是推动AI实用化的关键一步 [27]
Match Group: Tinder Is Bleeding Users, And Hinge Has Stopped Growing (NASDAQ:MTCH)
Seeking Alpha· 2026-02-04 12:18
行业趋势变化 - 科技行业正在发生重大转变 投资者正在抛售软件和互联网股票 转而追捧半导体和芯片股票 [1] - 这一转变的驱动力是数据中心热潮所带来的需求 [1] 分析师背景 - 分析师加里·亚历山大在华尔街和硅谷拥有覆盖科技公司的综合经验 并担任多家种子轮初创公司的外部顾问 [1] - 该分析师自2017年以来一直是Seeking Alpha的定期撰稿人 其观点被多家网络媒体引用 文章也被同步至Robinhood等流行交易应用的公司页面 [1]
微信“封杀”,元宝回应
新浪财经· 2026-02-04 12:02
事件概述 - 微信平台于2月4日发布公告,宣布对腾讯元宝的违规链接进行处置,限制其在微信内直接打开 [1] - 处置原因为元宝的春节营销活动存在诱导用户高频分享链接至微信群等违规行为,干扰平台生态秩序、影响用户体验 [1][3] - 元宝官方微博随后回应,称正在紧急优化调整分享机制,将尽快上线以确保用户体验 [2] 违规行为定性 - 微信依据《微信外部链接内容管理规范》进行研判,认定元宝活动属于“诱导分享违规” [4] - 具体违规形式包括:通过“做任务”、“领红包”等方式,以金钱奖励(红包)诱导用户分享及传播外链 [3][4] - 其他违规形式示例还包括:通过签到打卡、邀请好友协助(助力、砍价)、设置收集任务(集赞、集卡)等形式诱导分享 [4] 涉事产品背景 - 腾讯元宝是腾讯公司基于自研混元大模型开发的C端AI助手App,于2024年5月上线 [7] - 该产品于2025年11月接入了微信支付 [7] - 本次涉事的“春节10亿红包”活动于今年2月1日上线,用户可通过活动页面抽取或通过好友分享的链接、口令领取红包 [7] 平台监管行动 - 此次处置是微信近期发布的《针对第三方违规行为的打击公告》的一部分,旨在打击以春节为主题集中爆发的过度营销、诱导分享等违规行为 [3] - 微信表示将持续关注各项春节营销活动运行情况,结合用户反馈并依据平台规则进行管理 [5] - 处置措施自公告发布之日(2月4日)起生效 [5] 相关方回应与澄清 - 在微信公告发布前一日(2月3日),腾讯元宝曾发布“辟谣”帖,澄清“抢元宝红包会导致微信闪退,余额清零”的说法不实 [7] - 元宝方面澄清其App与微信是两个独立应用,不存在直接导致微信闪退的技术关联,并强调用户在元宝内获得的现金红包奖励受严格金融安全保障 [7]
腾讯姚顺雨团队发布署名论文,让模型“上下文学习”真正走向现实
扬子晚报网· 2026-02-03 23:09
行业技术挑战与现状 - 当前最先进的大语言模型在利用上下文进行实时学习方面存在显著能力短板 即使抹平信息差也未必能解决问题[2] - 研究构建的CL-bench基准测试显示 全球排名前十的语言模型平均任务解决率仅为17.2% 表明模型尚不善于从上下文中学习新知识并应用[3] - 大语言模型虽在解决结构化难题方面表现优异 但在应对需要从文档、规则或日志等上下文中实时学习的真实世界任务时 表现仍有待提升[2] 腾讯混元的研究与方向 - 腾讯混元团队联合复旦大学发布研究 指出让大模型学会“从上下文中学习”远比想象中困难 并首次公开其技术博客[1][2] - 该研究是首席AI科学家姚顺雨加入腾讯后团队首次发布成果 其研发思路侧重于打造实用模型和评估能力[1][4] - 团队推出的CL-bench基准包含500个复杂上下文、1,899个任务和31,607个验证标准 专门用于评估模型从上下文中学习新知识的能力[3] 未来技术演进与行业影响 - 研究指出 强化模型的上下文学习能力是大语言模型后续迭代的一个重要方向[3] - 若上下文学习能力得到提升 人类在AI系统中的角色可能从主要数据提供者转变为上下文提供者[3] - 行业竞争焦点可能从“谁能把模型训练得更好”转向“谁能为任务提供最丰富、最相关的上下文”[3] - 模型如何记忆可能成为2026年大模型发展的核心主题之一 可靠的上下文学习与记忆可能使模型实现自主学习[4]
刚刚,腾讯姚顺雨团队首个成果发布,揭示大模型真正瓶颈
36氪· 2026-02-03 22:26
腾讯混元发布CL-bench基准 - 腾讯混元团队正式上线了由首席AI科学家姚顺雨团队主导开发的基准CL-bench,专门用于评测大语言模型从上下文学习新知识并正确应用的能力,这是该团队加入腾讯后的首个研究成果[1] 基准核心目标与设计理念 - CL-bench的核心目标是要求模型在解决每个任务时,都必须从上下文中学习模型预训练中不存在的新知识并正确应用,旨在弥合模型依赖静态记忆与人类实时学习能力之间的差距[6][7] - 基准包含由专家制作的500个复杂上下文、1899个任务和31607个验证标准,所有知识均为新构建或取自不可能出现在当前模型训练数据中的小众长尾来源[9] - 每个上下文都是完全自包含的,解决任务所需的所有信息都显式地提供在上下文本身之中,无需外部检索[26] - 为确保无数据污染,基准采用虚构创作、修改现有内容及整合小众新兴内容的设计,在不提供上下文的情况下,表现最好的GPT-5.1(High)仅能解决不到1%的任务[28] - 基准设计具有高复杂性,其中51.1%的任务需要序列依赖,增加了任务难度,每个上下文平均关联63.2个验证标准以确保质量[28][29] 模型评测结果与关键发现 - 在评测的十个主流大语言模型中,平均任务解决率仅为17.2%,表现最好的GPT-5.1(High)解决了23.7%的任务,表明当前最先进的模型几乎都不会从上下文中学习[5][15] - 模型失败的主要原因是忽略或误用上下文,而非信息缺失,例如GPT-5.1(High)有55.3%的错误是忽略上下文,61.5%是误用上下文[17][18] - 长上下文推理和指令遵循能力是必要的,但不是充分条件,上下文学习需要的能力远不止于此[19] - 模型在需要归纳推理的“经验发现与模拟”类任务上表现明显更差,任务解决率通常低于10%,表明从数据中发现规律远比应用既定规则更具挑战性[20] - 更高的推理强度通常能提升上下文学习效果,例如GPT-5.1在部分任务上的表现可提升约6%,但并非对所有模型都有效[23] - 上下文学习的难度与长度相关,但短上下文若信息密集、规则隐含,同样极具挑战性,难度不仅源于长度也源于复杂度[25] 基准任务分类体系 - CL-bench涵盖四种广泛的现实世界上下文学习场景:领域知识推理、规则系统应用、程序性任务执行、经验发现与模拟[11] - 这些类别包含了大部分现实世界工作中常见的演绎推理和归纳推理任务,能全面衡量模型的上下文学习能力[14] 行业影响与未来展望 - 该研究指出,如果模型的上下文学习能力得到提升,人类在AI系统中的角色可能从主要的数据提供者转变为上下文提供者,行业竞争焦点可能从模型训练转向上下文提供[30] - 大模型如何记忆很可能成为2026年的核心主题,充分发挥大语言模型的潜力可能需要新的架构和优化方式来决定知识的保留[30] - 未来,一旦大模型的上下文学习与记忆变得可靠,模型或许就能实现自主学习,自主准备上下文并从中学习巩固[30]
刚刚,腾讯姚顺雨署名首篇论文发布,「下半场」先搞上下文学习
机器之心· 2026-02-03 18:35
文章核心观点 - 当前最先进的大语言模型在“上下文学习”能力上存在显著短板,即使提供了完整且自包含的上下文信息,模型也普遍无法有效从中学习新知识并解决依赖于此的任务,这揭示了当前模型训练范式与真实世界应用需求之间的根本性不匹配 [5][12][32][41] - 腾讯混元团队与复旦联合团队发布的CL-bench基准测试表明,即便是表现最好的模型GPT-5.1 (High),其任务解决率也仅为23.7%,所有测试模型的平均解决率仅为17.2%,这证明当前SOTA模型几乎不会从上下文中学习 [16][31][32] - 模型能力的未来发展方向需要从依赖静态“参数化知识”的推理者,转变为能够实时从“当下”环境中吸收信息的“上下文学习者”,这要求从根本上改变模型的优化方向 [12][42] 上下文学习的重要性与现实困境 - 行业专家认为,模型迈向高价值应用的核心瓶颈在于能否“用好上下文”,上下文决定了模型与人类认知的边界 [1] - 人类在工作与生活中擅长从实时上下文中学习,例如阅读新文档、学习新游戏规则或分析实验数据,而当前语言模型主要依赖预训练阶段压缩的静态“参数化知识”,缺乏从新输入信息中主动学习的能力 [9][12] - 研究表明,即便抹平了上下文带来的信息差,模型也未必能解决问题,关键在于模型是否具备从上下文中学习新知识、掌握新技能的能力 [5] CL-bench基准测试的设计与发现 - **测试目标与规模**:CL-bench是首个专门评测语言模型上下文学习能力的基准,包含500个复杂上下文、1899个任务和31607个验证标准,其核心设计原则是要求模型必须从上下文中学习预训练中不存在的新知识 [16][27] - **任务场景**:测试涵盖四大类现实世界场景:1) 领域知识推理;2) 规则系统应用;3) 程序性任务执行;4) 经验发现与模拟(归纳推理) [19][28] - **确保无污染**:在不提供上下文的情况下,GPT-5.1 (High)仅能解决不到1%的任务,证明了数据无污染,模型必须通过学习上下文才能解题 [29] - **任务复杂性**:51.1%的任务具有序列依赖性,后续任务依赖早期交互结果;领域专家平均花费约20小时标注每个上下文,以确保任务深度与质量 [29] 前沿模型在CL-bench上的表现分析 - **整体表现低迷**:在CL-bench评估的十个最先进模型中,整体任务解决率平均仅为17.2%,表现最好的GPT-5.1 (High)也仅达到23.7% [31][32] - **各场景表现差异**:模型在“经验发现与模拟”这类需要归纳推理的任务上表现最差,解决率通常低于10%,波动也最大,表明归纳推理比演绎应用规则更具挑战性 [31][39] - **主要错误类型**:模型失败的主要原因是忽略或误用上下文,而非信息缺失。例如,GPT-5.1 (High)有55.3%的错误源于忽略上下文,61.5%源于误用上下文 [34][35] - **其他影响因素**:提高推理强度(如GPT-5.1)对部分任务(如管理类和实验数据类)有约6%的提升,但并非对所有模型都有效;长上下文处理和指令遵循能力是必要的,但并非实现有效上下文学习的充分条件 [38][39] 对未来AI发展的启示与展望 - **行业竞争焦点转移**:如果上下文学习能力得到显著提升,人类在AI系统中的角色将从“训练数据提供者”转变为“上下文提供者”,行业竞争焦点可能从“训练更好的模型”转向“为任务提供最丰富、最相关的上下文” [42] - **面临的新挑战**:当前上下文学习获得的知识是临时性的,一旦上下文窗口清空,知识随之消失。因此,如何实现从上下文中习得知识的“持久化”或“记忆巩固”将成为未来关键研究方向 [43][46] - **终极愿景**:可靠的上下文学习与记忆能力可能使模型实现“自主学习”,即模型能够自主准备上下文、从中学习并自我巩固知识 [47]
AI入口成大厂“兵家必争高地”
南方都市报· 2026-02-03 11:58
AI行业战略与竞争格局 - 行业焦点正从“会答”的聊天机器人转向“会做”的智能体,旨在成为能执行跨应用任务甚至融入社交关系的“新成员”[2] - 各大厂商正围绕AI入口展开争夺,目标是将用户交互从点开特定App转变为直接向智能体提出需求,这可能导致流量入口的重新转移和集中[2] - 当前手机端智能体发展出三条主要技术路线:字节跳动与中兴的“读屏+模拟点击”通用执行路线、阿里的“API接口调用”生态内路线、以及腾讯的“社交关系链+互动”路线[6][7] - AI入口争夺战已进入“产品竞速+规则定义”的新阶段[8] 字节跳动(豆包手机助手)战略与动态 - 公司选择与中兴通讯合作,将AI助手“直接塞进手机”,通过“读屏+模拟点击”方式实现通用执行,无需等待每个App开放接口[2] - 该路线的优势在于“通用”,但体验高度依赖平台风控策略,并面临生态壁垒[2] - 针对隐私安全争议,豆包手机助手回应称,仅在用户明确授权下调用必要能力,云端处理遵循“不存储、不训练”原则,传输过程加密并设置严格防护[1][5] - 2025年12月产品开售后,曾引发微信“登录环境异常”提示,随后淘宝、支付宝及多家银行类App也对其进行了限制或禁用[1][5] - 公司已下线手机助手操作微信的能力,并表示相关账号正陆续解封[5] - 抖音集团副总裁李亮表示,豆包和中兴的探索是一个开始,AI一定是未来[6] 阿里巴巴(千问)战略与动态 - 公司将AI入口“修在自家生态里”,于2025年1月15日为C端应用“千问”上线生活助理功能[2] - 该功能可实现跨生态服务调用,例如点咖啡调用淘宝闪购并引导至支付宝支付,订机票酒店接入飞猪[2] - 公司将购物推荐作为重点场景,结合淘宝评价辅助决策,并观察到相关询问次数短期内明显增长[3] - 其采用的API路线核心是“可控链路”,对交易和风控更友好,但扩展到外部平台面临接口和能力谈判的现实门槛[3] 腾讯战略与动态 - 公司将AI战局拉入自身擅长的“社交场”,试图通过“元宝派”开启新的人与AI交互模式[3] - 公司于2025年1月26日开启“元宝派”内测,并在前一天宣布将在元宝App内派发10亿元现金红包,显示出在AI赛道加速的决心[3] - 公司押注“关系链+互动频次”,希望通过引入真实社交关系来解决当前AI应用用户黏性不足、使用场景单一的挑战[3] - 腾讯董事会主席马化腾在内部年会上,罕见地强硬批评“录屏上传云端处理”的路径,将其与“黑产外挂”相提并论,认为其“不安全”、“不负责任”[1][4] - 马化腾在点评阿里模式时,肯定其发挥体系化优势,但也提醒“全家桶”未必符合所有用户偏好,且生态内服务并非都处于行业最优水平[1] 行业挑战与规则探讨 - 隐私安全是产品落地的核心挑战,尤其是当入口接近系统底层时,涉及“传不传、怎么传、传输链路如何证明可信”以及是否会打破应用间隔离等问题[4] - 平台侧风控严格,在社交、支付等高危场景,平台基于行为特征进行风控,在缺乏统一标准时更倾向“先拦再查”[5][6] - 行业缺乏针对“跨App代理操作”的专门规则,包括用户授权标准化记录、敏感场景下的“可中断、可回滚”门槛、以及“不存储、不训练”的可验证审计机制等[7] - 有从业者建议推动形成行业标准,对系统权限调用、云端传输等提出统一最低要求,对高风险操作建立强制“人工确认”规则,并在监管沙盒机制下为创新留出探索空间[7] - “读屏”路线要规模化,需将“权限最小化、可视提示、可中断、敏感环节强制人工接管”等做成标配[7] - “API”路线要做大,则需要更多平台开放接口与能力,否则易被限制在单一生态内[7]
未知机构:中信证券计算机团队2月度思路重视全球AI创新进展Moltbot等海-20260203
未知机构· 2026-02-03 10:15
纪要涉及的行业或公司 * **行业**: 全球人工智能行业,特别是Agent(智能体)应用、大模型、云计算及算力基础设施 [1][2] * **公司**: 海外创新公司如Clawdbot (Moltbot)、Cowork;海外大厂如OpenAI、Google;国内大模型厂商如DeepSeek、Kimi(月之暗面)、Minimax、阿里巴巴(千问)、智谱AI;国内上市公司如海光信息、浪潮信息、京东健康、深信服、税友股份、金山办公、万兴科技、晶泰控股、光云科技 [1][2][3][4][6][7] 核心观点与论据 * **核心观点一:全球AI创新加速,Agent规模化落地成为重要趋势** * 海外创新如Clawbot (Moltbot) 等开源、可本地部署的个人AI助手“爆火出圈”,具备7×24小时独立工作、AI主动找人、操作自主、记忆可靠、扩展方便等优势,为Agent发展提供直接蓝本 [1] * 结合2026年以来模型能力和工具生态的发展,具备直接操作能力、部署成本可控的行业化Agent方案有望成为产业重要趋势 [1] * Agent规模化落地有望带来全球云计算产业新一轮机遇 [2] * **核心观点二:国内外大厂进入新一轮技术与产品创新高峰期** * 预计OpenAI、Google等海外大厂将持续推出相关Agent应用,带动AI生态繁荣 [2] * 预计从2月起,国内大厂及创新企业将进入技术及产品创新官宣高峰期,围绕多模态、推理、Agent、代码等方向展开竞逐 [2][3] * 近期国内厂商技术及产品加速更新,为下一代模型和产品奠定基础 [4] * **核心观点三:云计算作为中间层,发展趋势明确且面临价格调整** * Agent应用与算力需求相向而行,云计算发展趋势明确 [2] * 根据谷歌云官网,公司将于2026年5月1日对多项服务涨价,其中CDN服务在北美由0.04美元/GB上调至0.08美元/GB,欧洲由0.05美元/GB上调至0.08美元/GB,亚洲由0.06美元/GB上调至0.085美元/GB [2] 其他重要内容 * **国内主要厂商近期进展**: * **DeepSeek**: 1月以来多次迭代模型,R1证明复杂推理可借强化学习涌现,Engram验证静态知识适合查表替代计算,OCR2展示2D图像理解能通过因果排序适配1D语言模型 [2] * **Kimi (月之暗面)**: 发布并开源KimiK2.5模型,视觉代码融合能力可自动拆解交互逻辑、复现代码;Agent集群可调度多达100个分身并行处理1500个步骤,成本显著下降 [3] * **Minimax**: 模型升级至MiniMaxM2.1,强化多语言编程能力,并接入Clawdbot;发布MiniMaxAgent 2.0,定义为AI-native Workspace,能感知本地环境、自主拆解复杂任务 [3] * **千问 (阿里巴巴)**: 1月中旬进行最大规模版本更新,上线400+项能力,围绕“生活+办事”重构,并深度打通淘宝、支付宝、飞猪、高德等阿里系生态 [3] * **智谱AI**: 与滴滴达成战略合作探索出行Agent场景;联合华为开源新一代图像生成模型GLM-Image;发布并开源混合思考模型GLM-4.7-Flash [3] * **投资建议与关注方向**: * 强烈建议重视2月度全球AI创新进展,有望开启新一轮行情机遇 [4] * 国内建议关注模型进展显著、应用贡献有显著变化、出海贡献有增量的方向及公司 [5] * 给出了季度、月度、周度三个时间维度的“金股”名单 [6][7]
千问APP发起春节攻势,30亿请全国人民吃喝玩乐
雷峰网· 2026-02-02 18:21
千问APP春节营销活动与战略意图 - 千问APP宣布投入30亿元人民币启动“春节请客计划” 以吃喝玩乐免单形式吸引用户 活动将于2月6日正式上线[3] - 该计划是阿里巴巴历史上春节活动中投入最大的一次 也是今年春节各大厂AI营销战中投入金额最高的活动[3] - 活动将联合淘宝闪购、飞猪、大麦、盒马、天猫超市、支付宝等阿里生态业务共同展开[1][3] AI助手的功能演进与生态整合 - 千问APP已于1月15日接入淘宝闪购、支付宝、淘宝、飞猪、高德等阿里生态场景 测试AI购物功能[3] - 该次接入被视为对春节营销攻势的准备 旨在将AI助手从聊天工具融入真实生活消费场景[3] - 目前AI购买电影票功能正在进行灰度测试 并已能在主对话页面实现 即将全面上线[3] 战略目标:培养用户习惯与定义行业趋势 - 公司希望通过巨额资金投入 培养用户形成“有事找AI”的使用习惯[2][4] - 目标是让用户无需在多个APP间跳转 仅通过向AI表达意图即可完成从消费决策到履约的全过程 提供全新消费体验[4] - 此举旨在彻底引爆AI购物 公司希望开启“全球AI购物元年” 并普及AI时代的生活方式 将今年春节定义为“AI生活Agent”出圈的千问时刻[4]
腾讯回应“元宝崩了”,春节AI大战日益激烈
搜狐财经· 2026-02-02 16:51
腾讯元宝红包活动 - 腾讯旗下AI助手“元宝”在2月1日启动春节红包活动,提供10亿现金红包,活动迅速占领社交媒体,用户晒出抢红包战绩 [1] - 活动初期因瞬时流量激增导致部分服务出现短暂不稳定,但公司回应称已恢复 [1] - 红包活动设计深度捆绑腾讯社交基因,用户可将“分享红包”一键转发至微信、QQ好友,旨在借春节高频社交场景激活AI助手这类相对低频的应用需求 [4] - 活动效果显著,截至发稿时,元宝在苹果商店免费App排行榜上已超过字节跳动的豆包升至第一名 [4] 行业春节AI竞争加剧 - 春节期间的AI应用竞争日益激烈,各大科技公司投入巨额资金进行红包营销 [7] - 阿里巴巴旗下千问APP于2月2日开启春节红包活动,投入30亿元,采取免单政策覆盖淘宝、闪购、飞猪、大麦、高德、盒马等核心业务 [7] - 百度文心助手宣布在春节期间投入5亿元现金红包 [7] - 字节跳动旗下的火山引擎和豆包也借助首次上春晚的机会参与竞争 [7]