模型 - 2025年是Agentic Model能力提升的关键一年,大模型的推理、编程和多模态能力持续进步,为复杂智能体应用奠定了能力基础,2025年普遍被认为是Agent应用元年 [27][64] - 推理模型在2025年崛起,标志性事件是DeepSeek-R1于2025年1月20日发布,其影响力远超同日发布的Kimi K1.5和更早的OpenAI o1,成为全球首个在大参数规模上复现o1的推理模型 [7][59] - DeepSeek-R1的成功得益于三个关键因素:完全开源最强旗舰版本、技术报告极其详细、以及高亮了仅557万美元的最后一次训练成本,极低的成本引发了美国政商界广泛关注 [7][59] - 推理模型的效果提升主要体现为多步推理能力,背后的新技术范式是“测试时计算”的扩展,即将更多算力放在模型推理阶段 [9][61] - 编程能力成为支撑通用智能体的关键,Anthropic在2025年2月发布的Claude Code本质上是一个通用智能体,领先于3月初发布的“世界首个通用Agent”Manus,OpenAI、x.ai和Google等巨头也在2025年相继发布了各自的编程应用 [10][62] - 多模态模型已演进为原生多模态,即用单一模型处理文字、图片、语音等信息,代表模型包括2024年的OpenAI 4o、Gemini 1.5以及2025年的Gemini 3和Kimi 2.5,同时中国公司在视频生成模型领域表现突出 [11][63] - 模型竞争的底层是研发组织方式的竞争,“协同设计”成为巨头关键战略,即从芯片、基础设施、算法到应用的垂直整合与优化,Google、阿里和腾讯均在推进此类整合 [13][14][65][66] - DeepSeek展示了极致的工程优化能力,其开源周披露的推理成本引发行业争议,数据显示在24小时内用1800多张GPU卡支持了6000多亿输入Token和近1700亿输出Token,据此计算的毛利率高达84.5% [15][16][67][68] - 算力发展的趋势从比拼单颗芯片性能转向优化多芯片互联系统,华为的384 Matrix超节点和英伟达的NVL72均体现了这一思路 [22][74] - AI研究界已开始深度思考下一代学习范式,认为当前基于海量数据预训练和后训练的方法将触达瓶颈,新的研究方向包括持续学习、在线学习和世界模型等,旨在实现更接近人类的高效、节能学习方式 [23][24][75][76] 应用 - 2025年是智能体应用大规模爆发的元年,主要分为两条主线:以编程能力为核心的通用智能体,以及深入特定行业的垂直智能体 [29][81] - 通用智能体的核心转变是编程从目的变为手段,代表产品包括Anthropic的Claude Code、Claude Cowork、近期风靡的OpenClaw,以及字节跳动的Trae Solo模式、蚂蚁灵光、马卡龙等,它们旨在满足个人工作与生活的自动化需求 [30][31][82][83] - 智能体生态催生了工具链的繁荣,基础设施层出现细分机会,涵盖语音与多模态交互、记忆管理、评估测评等方向,美国硅谷的软件水平分工为此提供了成熟土壤 [40][41][42][43][92][93][94][95][96] - 智能体数量激增后,分发与交易成为新需求,Youware和MuleRun等公司尝试构建社区化平台或交易市场,但目前正从平台模式转向强化工具属性以降低使用门槛 [34][86] - 通用智能体正向移动端渗透,引发手机厂商、超级App与AI公司之间的三方博弈,例如字节豆包手机预览版的自动回微信、比价点外卖功能曾遭微信、美团等超级App封禁 [35][87] - 不同场景的App受智能体影响程度不同,点外卖、订机票等提效需求强的场景受影响更大,但超级App出于广告收入和数据安全考虑对开放接口持谨慎态度,而抖音、小红书等娱乐内容平台受影响较小 [36][88] - 垂直领域智能体正改变商业模式,从“卖服务”转向“为结果收费”,例如法律领域的艾语智能直接承接金融机构案件并按最终收回款项收费,教育领域的爱为舞则将AI老师嵌入在线大班课商业模式 [38][39][90][91] - Sora App代表了AI在非提效类消费端场景的新尝试,其核心功能Cameo允许用户生成数字角色进行创作或合拍,发布初期热度高但留存挑战大,30天留存率低于8%,远低于TikTok的42%和Instagram的38% [44][45][97][98] - 特定创作者群体正在Sora App上沉淀,例如日本创作者Matsumaru利用该工具探索二次元与视觉特效,粉丝量已突破10万 [46][99] - 传统消费端场景也在被AI重塑,例如聊天应用Intent利用大模型实现“默认全局翻译”,语音输入应用Typeless凭借更精准的识别和语境理解脱颖而出 [48][101] - AI for Science领域存在多种探索路径:一是利用机器学习加速第一性原理计算,如深势科技的DeePMD;二是利用生成式AI解决特定科学问题,如AlphaFold;三是发展能够覆盖完整科研流程的科研智能体,迈向“AI发明家”时代 [49][50][51][102][103][104]
年末 AI 回顾:从模型到应用,从技术到商战,拽住洪流中的意义之线(上)