Workflow
AGI
icon
搜索文档
DeepSeek母公司去年进账50亿,够烧2380个R1
猿大侠· 2026-01-14 12:11
公司核心状况与战略定位 - 公司(DeepSeek)自其标志性模型R1发布一年以来,未进行任何新的外部融资,也几乎没有商业化的动作,在行业内显得特立独行 [1][2] - 公司是全球唯一一家未接受外部融资、且不隶属于任何大型科技公司的独立AI实验室,其研发经费完全来自母公司幻方量化的研发预算 [36][39] - 公司坚持纯粹的研究导向,专注于通用人工智能(AGI)的研发,模型开源、不急于产品化,资源分配上全仓押注底层训练而非高并发的应用场景 [27][28][31] 母公司财务支持与可持续性 - 母公司幻方量化在2025年业绩表现极为突出,旗下基金平均收益率达56.6%,管理的资产规模超过700亿元人民币 [8][9] - 据估算,幻方量化2025年通过管理费和业绩提成,为创始人梁文锋赚取了超过7亿美元(约50亿人民币)的利润 [4][10] - 基于母公司强大的盈利能力,公司拥有充足且可持续的研发资金,其模型训练成本极低:V3训练成本为557.6万美元,R1训练成本仅为29.4万美元 [15] - 按此成本计算,母公司去年的利润理论上可支持再生产125个V3模型或2380个R1模型,资金充裕 [16][17][18] 研发成果与团队稳定性 - 公司在学术研究上持续高产,不断产出高水平论文,例如OCR、V3.2等技术报告,并在年底为R1模型补充了长达60多页的干货内容 [33][34] - 公司团队极其稳定,R1论文发表近一年后,18位核心贡献者全部仍在职,总计100多位作者中仅有5位离开,人才流失率极低 [53][54] - 团队甚至出现了人才“回流”现象,一位去年已离开的作者(Ruiqi Ge)今年已回归团队 [3][55][56] 独特的商业模式与行业对比 - 公司的商业模式独特,背靠幻方量化成熟的量化投资业务进行交叉补贴,使其在AGI研发道路上没有短期盈利压力,内外均无阻力 [37][38][40][42] - 与OpenAI相比,公司拥有稳定的内部现金流支持,无需像OpenAI那样为融资和商业化绞尽脑汁(如寻求芯片厂商投资、探索广告等)[22][26][48] - 与谷歌相比,公司的AI业务是原生且与主营业务(量化投资)相辅相成的,不存在传统业务拖累创新或战略冲突的问题 [45][50] - 这种“既有商业模式、又AI原生”的模式,被认为集成了谷歌(稳定收入)和OpenAI(创新敏捷)双方的优势 [50] 行业影响与外部效应 - 公司的技术动态已成为二级市场的投资风向标,其发布的“硬件设计建议”能直接影响相关芯片公司的股价 [62][67] - 例如,在V3.2模型发布仅四分钟后,寒武纪宣布完成对其框架的适配,次日股价开盘跳涨近5% [68][71] - 许多投资者将公司的技术论文当作行业研究报告来解读,并据此进行投资获利 [62][72]
深度共创 绝影与英伟达推进AGI开发
中国经济网· 2026-01-14 11:26
合作核心与战略意义 - 绝影与英伟达在CES2026期间宣布深度合作,以英伟达Drive AGX高算力平台为基石,在算子开发、模型量化等核心技术领域进行共创,共同推动智能汽车迈向AGI时代 [1] - 合作旨在赋能舱驾融合座舱、自动驾驶与端侧多模态大模型落地,通过端到端的高效解决方案推动车载AI技术规模化商业落地 [1] - 英伟达汽车业务副总裁表示,此次合作彰显了其汽车生态的实力,即将前沿AI转化为实用的车载创新 [1] 核心技术平台与工具 - 双方合作基于英伟达全新的开源C++框架TensorRT Edge-LLM,该框架专为LLM和VLM推理设计,旨在满足高性能边缘端推理需求 [1] - 通过集成支持视觉语言模型和优化推理能力的TensorRT Edge-LLM,绝影显著提升了自动驾驶系统对复杂交通场景的认知与决策能力 [1] - 经过优化的工具链使模型可快速适配英伟达DRIVE AGX Orin和Thor等主流车载计算平台 [1] - TensorRT Edge LLM的开源发布将进一步降低车载大模型的开发门槛 [2] 智能座舱应用成果 - 在智能座舱领域,绝影通过结合先进的KV-cache管理、动态序列调度及轻量化部署能力,构建了高性能的多模态智能交互系统 [2] - 采用优化的自定义注意力算子与支持FP8、INT4等多种精度的多精度量化技术,使系统在算力受限的车载平台上能对语音、视觉等多模态输入实现低延迟响应 [2] - 该系统实现了自然语言对话、智能场景推荐以及跨屏无缝指令编排,为用户提供从复杂路线规划到个性化座舱环境调节的即时、直观反馈 [2] 自动驾驶能力提升 - 长上下文支持使系统能够精准处理非结构化道路、罕见交通事件等具有挑战性的边缘场景 [2] - 工具套件的交叉编译与基准测试能力,使绝影能够快速迭代并优化自动驾驶算法,在保障安全性的前提下实现更强的场景泛化能力 [2] 未来合作方向 - 绝影将持续深化与英伟达的生态协同,依托工具链的灵活扩展能力,探索更多AI在智能出行领域的创新应用 [2]
深度解读 AGI-Next 2026:分化、新范式、Agent 与全球 AI 竞赛的 40 条重要判断
36氪· 2026-01-14 08:17
模型与行业发展趋势 - 模型分化已成为显性趋势,分化原因多元,包括To B与To C场景需求差异、对竞争格局的押注以及不同AI实验室的战略选择 [1] - 在To B领域,强模型与弱模型的分化会越来越明显,企业用户愿意为“最强模型”支付溢价,因为强模型(如Opus 4.5做10个任务能对8-9个)能减少错误监控成本,而弱模型(可能只对5-6个)即便更便宜也带来额外管理负担 [2][3] - 在To C场景,任务瓶颈往往不是模型不够大,而是上下文(Context)与环境(Environment)的缺失,例如回答“今天吃什么”需要个性化数据,因此利用好合规的上下文数据(如微信聊天记录)比盲目追求更强预训练模型能带来更大价值 [2] - To C场景适合模型与产品进行垂直整合的All-in-one路线,而To B(生产力应用)因涉及复杂生产环节,给了应用公司优化空间,出现了模型公司与应用公司之间的分层 [3] - 模型分化也是自然演化的结果,源于与客户的高频交流,例如Anthropic进入金融领域就是在交流中发现的机会 [3] - 模型分化的时机与竞争格局判断相关,例如智谱AI在DeepSeek出现后判断“Chatbot取代搜索”战局已定,从而选择押注编程(Coding)领域 [4] 技术新范式与自主学习 - Scaling(规模扩展)仍会继续,但需区分已知路径(通过增加数据和算力探索能力上限)与未知路径(寻找新范式,让AI系统自主定义奖励函数、交互方法和训练任务) [5][6] - Scaling Law的核心是将能源高效转化为智能,是技术、数据与品味(taste)共进的过程,探索前沿智能不会因潜在风险而停止 [8] - 自主学习是共识性极强的新范式,目标是让模型具备自反思与自学习能力,通过持续自我评估与批判来优化行为路径 [8] - 新范式的发生是一个“渐变”过程,已有信号显现,例如Cursor的Auto-complete模型每几小时用最新用户数据学习,ChatGPT拟合用户聊天风格,Claude Code编写了自己项目95%的代码 [8] - 新范式发展的最大瓶颈是想象力,即需要构想出证明其实现的具体任务,例如变成一个赚钱的交易系统或解决未解科学问题 [8] - 从实际角度看,强化学习(RL)的潜力尚未被充分挖掘,下一代范式包括自主学习以及AI具备更强的主动性,未来模型可能不再需要人类提示(Prompt),而是由环境直接触发 [9] - 主动学习(Active Learning)会带来严重的安全挑战,风险不在于“讲不该讲的话”,而在于“做不该做的事”,因此必须为其注入正确的方向 [9] - 持续学习(Continual Learning)中,对于多智能体(Agent)串联的长程任务,若单个智能体能力未达100%,后续能力会呈指数级下降,可能需要探索类似人类睡眠的“清噪”与新计算模式 [9] - 提出了“智能效率”(Intelligence Efficiency)概念,未来范式应关注“投入多少资源能获得多少智能增量”,以解决成本瓶颈 [10] - 大模型发展借鉴人脑认知,在多模态、记忆与持续学习、以及反思与自我认知这几类人类显著领先的能力上,可能是新的突破方向 [10] - 智谱AI参考人类认知提出AI系统三模块结构:系统1(模式匹配与知识提取,对应数据与模型规模的Scaling-up)、系统2(知识融合与推理,对应Reasoning的Scaling)、自主学习(对应Environment Scaling,让模型从与外界交互中获得反馈) [10] 多模态与感知能力 - 原生多模态模型与人类的“感统”相似,能汇集视觉、声音、触觉等信息进行综合感知,但当前模型的感统能力并不充分 [11] - 多模态感统是智谱AI今年的重点方向之一,具备此能力后,AI才能在真实工作环境中执行长链路、长时效任务,如在手机、电脑等设备上持续协作 [11] - 多模态同样是Qwen的持续发展方向,认为真正智能的东西天然应该是多模态的,但存在多模态能否驱动智能的争论 [11] - 从第一性原理出发,为模型提供更多生产力、更好地帮助人类,发展视觉、语音等多模态能力是自然而然的选择 [11] - 视频是更广义的表达,理解长视频是一个有意义的探索方向 [12] 智能体(Agent)的发展与产品化 - 编程(Coding)是通往智能体(Agent)的必经之路,例如智谱AI的GLM-4.5虽跑分高但写不出“植物大战僵尸”游戏,通过引入RLVR和大量真实编程环境训练,GLM-4.7才解决了该问题 [13] - 模型即智能体,智能体即产品,实现复杂任务对模型要求极高,因此做基础模型本身就是在做产品 [13] - 模型在To B和To C的分化同样体现在智能体上:To C产品的指标有时与模型智能不相关甚至相反;To B的智能体则更依赖模型智能提升来解决真实世界任务、创造价值 [14] - 生产力场景的智能体才刚开始,除了模型进步,环境与部署(deployment)同样重要,是创造价值的关键,即使模型不再变好,将现有模型部署到各公司也能带来10倍甚至100倍的收益,但目前AI对GDP的影响还远不到1% [14] - 未来的智能体将变成“托管式”,用户设定通用目标后,智能体在后台长时间独立运行直至完成任务,这需要自我进化(Self-evolution)与主动学习(Active Learning)能力支撑 [15] - 在通用智能体开发中,解决长尾任务更值得关注,用户感知AI的价值常因某个长尾任务被解决,今天的AGI本质上也在解决长尾问题 [15] - 通用智能体的开发见仁见智,若应用公司没有比模型公司做得更好的信息优势,那么“模型即产品”对模型公司是机会,因为许多工程问题可能只需“烧卡”即可解决 [15] - 智能体的发展可从两个维度划分四象限:目标定义(人为/自动)和任务规划(人为/自动),目前处于初级阶段(目标与规划皆由人定义),未来将发展为由大模型内生定义 [16] - 决定智能体未来走势的重要问题包括:能否真正解决人类任务并创造价值、成本有多大、以及应用公司的迭代速度是否能拉开时间窗口 [17][18] 全球AI竞赛与中美对比 - 对于中国AI在3-5年内进入全球第一梯队持乐观态度,因为中国在制造业、电动车等领域已证明,一旦某事可行,就能以极高效率复现甚至做到局部更好 [19] - 长期挑战在于文化差异,即“敢突破新范式、敢冒险的人不够多”,并面临两个现实瓶颈:光刻机突破决定的算力瓶颈,以及是否能诞生更成熟的To B市场并在国际竞争,应避免过分刷榜,更关注做“正确的事”和用户体验 [20] - 相对冷静的观点认为,中国AI超过美国的概率最乐观情况为20%,中美算力差异不仅是绝对量级(美国算力比中国大1-2个数量级),更是结构性的:美国将相当一部分算力投入下一代研究,而中国仍在解决任务交付爆发带来的算力瓶颈 [21] - 但“穷则生变”,作为“算力穷人”,中国团队更有紧迫感和动力去思考算法与基础设施(Infra)的联合优化,这可能倒逼创新发生 [21] - 面对光刻机瓶颈,有可能从软硬结合的角度,通过下一代模型结构和芯片实现端到端(End-to-End)的突破 [21]
DeepSeek母公司去年进账50亿,够烧2380个R1
36氪· 2026-01-13 21:02
公司核心情况 - 自R1模型发布一年以来,DeepSeek未进行任何新融资,也几乎没有商业化的动作 [1] - 公司是全球唯一一家未接受外部融资且不隶属于任何大型科技公司的AI实验室 [11] - 公司的研究经费完全来自其母公司幻方量化的研发预算,不受外部股权结构或损益预期的约束 [6][14][15] 母公司财务与业绩表现 - 母公司幻方量化在2025年业绩表现极为突出,旗下基金收益率普遍在55%以上 [3] - 据彭博社报道,幻方量化在2025年可能为创始人梁文锋赚取了超过7亿美元(约50亿人民币)的利润 [2][8] - 公司管理的资产规模超过700亿人民币,2025年平均收益率达到56.6%,在百亿级量化基金中位居第二 [5][7] 研发投入与成本效率 - DeepSeek模型训练成本极低,V3训练仅花费557.6万美元,R1训练仅花费29.4万美元 [6] - 按此成本计算,幻方量化2025年的收入足以再生产125个V3模型或2380个R1模型 [6] - 公司持续改善训练效率,拥有充足的现金储备支持其AGI研究 [6] 研发战略与学术成果 - 公司战略纯粹,专注于AGI研究,未将资源大规模转向需要高并发推理的商业应用产品 [9] - 公司持续产出高水平学术论文,团队稳定,R1论文的18位核心贡献者在发表近一年后仍全部在职 [2][29] - 在总计100多位的论文作者中,仅有5位标注已离开团队,甚至出现人才回流的情况 [30][31][33] 行业对比与商业模式优势 - 与OpenAI等积极寻求商业化(如引入广告、获取芯片厂商投资)的同行不同,DeepSeek坚持非商业化研究路径 [6] - 公司背靠幻方量化成熟的量化投资商业模式,拥有稳定且强大的内部现金流支持,无需为短期投资回报担忧 [6][15][20] - 这种模式结合了谷歌(有成熟业务支撑)和OpenAI(AI原生)的优势,使公司在AGI研发上拥有更大的战略定力和容错空间 [26] 市场间接影响 - DeepSeek发布的“硬件设计建议”等技术动态,会直接影响相关国产芯片公司的股价,例如寒武纪在V3.2发布后宣布完成适配,次日股价跳涨近5% [34][36][39] - 部分投资者将DeepSeek的技术论文作为投资半导体行业的研究报告来参考 [34]
深度解读 AGI-Next 2026:分化、新范式、Agent 与全球 AI 竞赛的 40 条重要判断
海外独角兽· 2026-01-13 20:33
文章核心观点 - 华人已成为AGI领域的重要力量,中国开源模型是全球Tier 1,预计到2026年地位将更加牢固[1] - 大模型行业正经历显著分化,主要体现在To B与To C场景、以及垂直整合与分层路线上[3] - 自主学习是行业共识性极强的新范式,预计2026年将成为主要投入方向[1] - Scaling(规模扩展)将继续,是技术、数据与品味共进的结果,探索前沿智能不会停止[1] - 模型即Agent,Agent即产品,两者趋于一体化[1] - 中美AI竞赛存在结构性差异,美国算力比中国多1-2个数量级,且更多投入下一代技术探索[1] 模型分化趋势 - 分化趋势显性,原因多元,包括To B和To C场景需求差异、对竞争格局的思考以及不同AI实验室的战略选择[1] - To B领域会出现强模型与弱模型的分化,且会越来越大[1] - To C场景的任务瓶颈往往不是模型不够大,而是上下文(Context)和环境(Environment)的缺失[1] - 在To C逻辑下,大多数用户大多数时候不需要很强的智能,模型智能提升的体验不强烈[3] - To C问题的解法在于真正的个性化数据,例如在合规前提下利用微信聊天记录等上下文,比追求更强预训练模型带来更大价值[3] - 在To B市场,用户(企业)愿意为“最强模型”付出溢价,因此强模型与弱模型的分化会越来越明显[3] - 例如,Opus 4.5这类强模型做10个任务能对8-9个,而弱模型只能对5-6个,即使后者更便宜,但企业因监控错误成本高而更倾向于选择强模型[4] - To C场景中,模型做All-in-one的垂直整合成立,模型与产品可强耦合迭代;而To B(生产力应用)因涉及多生产环节,给了应用公司优化空间,出现了模型公司与应用之间的分层[4] - 模型分化并非预设路线图,更多是自然演化的结果,通常源于与客户的高频交流[4] - 分化与模型竞争的时机相关,例如智谱AI押注Coding是基于对当时模型竞争格局(如DeepSeek出现后Chatbot取代搜索之战基本结束)的判断[5] 新范式:自主学习 - Scaling会继续,但需区分两种方向:Scaling已知路径(增加数据和算力)和Scaling未知路径(寻找新范式,让AI系统自己定义奖励函数、交互方法等)[5] - 当下AI社区对新范式尚无统一定义,自主学习、主动学习、持续学习等概念本质都预期模型能在人类不介入下提升智能[6] - Scaling Law被总结为一种将能源转化为智能的视角,核心在于高效逼近智能上限,是技术、数据与审美的共进[6] - 自主学习的目标是让模型具备自反思与自学习能力,通过持续的自我评估与批判来优化行为路径[6] - 新范式的发生是一个正在发生的“渐变”过程,2025年已出现信号,例如Cursor的Auto-complete模型每几小时用最新用户数据学习,ChatGPT利用用户数据拟合聊天风格,Claude Code写了自身项目95%的代码[6] - 新范式的最大瓶颈是想象力,即需要构想出证明范式实现的具体任务(如赚钱的交易系统或解决未解科学问题)[7] - 从更实际角度看,强化学习(RL)的潜力尚未被充分挖掘;下一代范式存在两个维度:自主学习和AI具备更强的主动性(未来模型可能不再需要人类提示,而是环境本身就能提示它)[7] - 主动学习会带来严重的安全挑战,风险不在于“讲不该讲的话”,而在于“做不该做的事”,因此必须为其注入正确的方向[7] - 自主学习能体现到个性化上,但衡量其是否“变好”会变得困难,因为当AI覆盖生活方方面面后,评估指标变得极其模糊[7] - 对于多Agent串联的长程任务,一旦Agent能力未达100%,后续能力往往呈指数级下降;人类通过睡眠“清理噪音”,AI可能需要探索类似的清噪与新计算模式[8] - 提出了“智能效率”(Intelligence Efficiency)概念,即关注投入多少资源能获得多少智能增量,这是解决成本瓶颈的关键[8] - 大模型发展路径借鉴人脑认知学习过程,而在多模态、记忆与持续学习、反思与自我认知这几类能力上,人类显著领先于当前模型,这些可能是新的突破方向[8] - 智谱AI在2020年参考人类认知规划了AI系统结构图,包含三个模块:系统一(模式匹配与知识提取)、系统二(知识融合与推理机制)、自主学习,分别对应数据与模型规模的Scaling-up、推理的Scaling、以及环境Scaling(让模型从与外界交互中获得反馈)[9][10] 原生多模态 - 原生多模态模型和人的“感统”相似,能汇集视觉、声音、触觉等信息,但当前模型的感统能力并不充分[11] - 多模态感统是智谱AI今年的重点方向之一,具备此能力后,AI才能在真实工作环境中执行长链路、长时效任务[11] - 多模态同样是Qwen持续要做的事情,认为真正智能的东西天然应该是多模态的,但存在多模态能否驱动智能的争论[11] - 从第一性原理出发,为模型提供更多生产力、更好帮助人类,做视觉、语音等多模态能力是自然而然的选择[11] - 视频是更广义的表达,图片可理解为单帧视频,理解很长视频是很有意思的事情[11] Agent发展 - Coding是通往Agent的必经之路,例如智谱AI的实践中,GLM-4.5虽跑分高但写不出“植物大战僵尸”游戏,通过引入RLVR和大量真实编程环境训练,GLM-4.7才解决了该问题[11] - 模型即产品,Agent要实现复杂任务对模型要求相当高,模型就是Agent本身,Agent就是产品本身,做基础模型也就是在做产品[12] - 模型To B和To C的分化同样体现在Agent上:To C产品的指标有时与模型智能不相关甚至相反;To B的Agent甚至不需要做太多创新,模型智能提升、解决真实世界任务能力提高就能创造更多价值[12] - 生产力场景的Agent才刚开始,除了模型进步,环境和部署同样重要,是Agent创造价值的关键:即使模型不再变好,只要把现有模型部署到各公司,也能带来10倍甚至100倍的收益,但今天AI对GDP的影响还远不到1%[13] - 教育非常重要,会使用AI工具的人正在替代那些不会使用工具的人[13] - 未来的Agent将变成“托管式”,用户设定通用目标后,Agent在后台长时间独立运行直至完成任务[13] - Agent要做到这一点离不开前面提到的自我进化以及主动学习,在此逻辑下,“模型即Agent,Agent即产品”[13] - 做通用Agent过程中,长尾任务更值得关注,用户感受到AI的价值与魅力往往因为某个长尾任务被解决,今天的所谓AGI本质上也在解决长尾问题[13] - 做通用Agent是见仁见智的问题,如果作为“套壳”方没有比模型公司做得更好的信息,那么通用Agent就是“模型即产品”的机会,因为对模型公司来说,很多工程问题可能只是“烧一烧卡”就可解决[14] - Agent发展可划分为四个象限,从两个维度看:目标定义(人为/自动)和任务规划(人为/自动);今天处于初级状态(目标与规划皆由人定义),未来会出现大模型观察人的工作并使用人的流程数据,最终目标与规划皆可由大模型定义,Agent应是大模型内生的原生系统[14] - 决定Agent未来走势的几个重要问题:是否能真正解决人类任务并创造价值及价值大小;Agent成本有多大(成本过高是问题,若调用API就能解决,模型厂商意识到价值大时就会自然做进去,这是基座模型与应用之间的矛盾);应用公司的迭代速度(若Agent团队有能力拉开半年时间窗口满足用户需求,就有机会持续往前走)[14][15] 全球AI竞赛 - 对于中国AI在3-5年内进入全球第一梯队持乐观态度,因为中国最大的优势在于一旦证明某件事可行,就有能力以极高效率复现、甚至做到局部更好[17] - 但长期视角中更核心的问题在于“敢突破新范式、敢冒险的人不够多”的文化差异,此外还需面对两个现实瓶颈:算力瓶颈(核心在于光刻机是否有突破)和是否能诞生更成熟的To B市场并在国际市场竞争(应更关注“正确的事”和用户体验,而非过分刷榜)[17][18] - 另一种观点认为,中国AI超过美国的概率最乐观情况为20%[18] - 中美AI之间算力差异不只是绝对量级上的,还是结构性的:美国算力比中国大1-2个数量级,但最关键的差异在于,美国有相当一部分算力投入到了下一代的研究中,而中国今天还在解决任务交付爆发带来的算力瓶颈[1][18] - 但从历史经验看,“穷则生变”,作为“算力穷人”,中国团队更有紧迫感和动力去思考算法与基础设施的联合优化,这个出发点可以倒逼创新发生[18] - 面对光刻机的现实瓶颈,有可能在下一代的模型结构和芯片上从软硬结合的角度端到端地实现突破[18]
不追DAU的AI公司火了!MiniMax港交所上市,技术路线成关键
搜狐财经· 2026-01-13 18:39
公司上市与创始人背景 - MiniMax于2025年1月9日在港交所正式挂牌上市 [1] - 创始人闫俊杰将公司成功上市归因于坚持技术信仰且未中途放弃 [1] 战略转折与认知转变 - 2024年初公司核心目标是技术达到GPT-4水平、用户规模翻十倍并突破千万日活跃用户 [3] - 2025年春节前竞品DeepSeek-R1发布后,公司认识到大模型性能提升依赖算法迭代和算力投入,而非用户数据,因此放弃单纯追求日活跃用户的战略 [3] 核心技术路线与突破 - 公司自创立起即坚持研发混合专家系统技术路线,期间经历两次失败 [5] - 2025年1月发布的M1模型是国内首个线性注意力千亿参数大模型,能够轻松处理百万字文本 [5] 早期创业与资源分配 - 公司成立于2021年底,当时通用人工智能概念在国内不受投资人青睐 [7] - 早期将80%的算力资源投入混合专家系统研发,曾面临资源紧张,需通过其他方式补贴运营成本 [7] 产品演进与市场应用 - 产品路线从早期的3D数字人转向多模态交互,融合文本、图像和语音 [9] - 当前拥有三个核心产品:Glow主打情感陪伴,星野服务企业客户,海螺AI专攻长文本处理 [9] - 企业客户反馈显示,使用星野系统后质检效率提升40%,并降低了人力成本 [9] 技术优化与核心能力 - 公司在算力受限环境下采取“十倍优化”策略,用100张显卡完成同行需1000张显卡的实验 [11] - 长文本处理是核心技术优势,线性注意力机制使其能处理整本书内容,例如十分钟内从数百页案卷中整理出关键证据链 [11] 公司管理与行业挑战 - 公司采用三层架构的“函数优化式管理”,目标明确且参数透明 [15] - 行业挑战包括算力资源获取困难以及高端人才竞争激烈 [15] - 中国市场机遇在于用户对AI产品接受度高、应用场景丰富,例如海螺AI能根据学生错题本生成个性化讲义 [15] 未来趋势与公司愿景 - 多模态交互是未来趋势,交互方式将扩展至图片、旋律等 [17] - 公司愿景是“Intelligence with everyone”,让普通人也能使用顶级AI能力 [17] - 中国AGI创业公司的独特优势在于既能追赶技术前沿,又擅长本土化落地 [19]
人形机器人再迎政策催化!中控技术涨近10%,资金连续11日涌入机器人ETF基金(159213),合计净流入超3亿元!机器人4年后将完胜人类医生?
搜狐财经· 2026-01-13 17:43
市场表现与资金流向 - 1月13日A股市场震荡回调,沪指止步17连阳,机器人ETF基金(159213)当日收跌1.37% [1] - 尽管市场回调,资金持续涌入机器人板块,该ETF基金全天吸金超5500万元,并已连续11日强势吸金,累计超3亿元 [1] - 标的指数成分股当日涨跌不一,其中中控技术大涨9.9%,绿的谐波涨超3%,科大讯飞涨超2%,而大族激光跌超5%,机器人、汇川技术等跌超3%,大华股份、石头科技等回调 [2][4] 政策与行业动态 - 工信部表示,“十五五”时期将实施“人工智能+”行动,并聚焦人形机器人、脑机接口等领域,加强技术攻关、产品开发和生态建设 [3] - 在近期的CES展中,机器人获得重点关注,中国的人形机器人制造商占据主导地位,在38个人形机器人展位中,中国企业占据21个,比例超过一半 [5] - 资本市场方面,自变量机器人宣布完成10亿元A++轮融资,投资方包括字节跳动、红杉中国等,成为目前公开披露的唯一一家同时获得阿里、美团、字节投资的创业公司 [5] 技术发展与产业观点 - 东方证券观点认为,人形机器人简单的量产叙事边际影响将变弱,而具有通用人工智能(AGI)属性的叙事边际影响将变强 [7] - 根据Omdia报告,2025年FigureAI的人形机器人在全球市占率不到2%,但其估值在25年9月达390亿美元,远超排名靠前的中国公司,市值反差说明“大脑”的估值更高 [7] - 产业面临三大挑战:灵巧的手、理解现实世界的AI大脑、大规模量产能力,其中AI大脑是产业量产最关键、尚不成熟的挑战 [8] - 特斯拉采用多种方式推动大脑进化,并预计在26年2-3月准备好生产原型机,东方证券看好26年上半年左右的机器人量产投资机会 [9] - 国金证券指出,限制人形机器人大规模量产的重要因素是大脑进化,大模型是现阶段“大脑”的最佳解决方案,伴随着AI大模型迭代,机器人大脑有望实现跨越式发展 [9] 未来展望与市场预期 - 马斯克近期称,通用人工智能(AGI)在2026年就将到来,并预测3年内机器人在手术技能上将超越人类,4年后将达到“完胜任何人类医生”的水平 [6] - 从CES展看,英伟达CEO黄仁勋多次强调“物理AI”,预言“物理AI的ChatGPT时刻即将到来”,并表示“具备人类级别技能的机器人将在今年出现” [7] - 全球科技巨头与新秀全面下场布局人形机器人,行业量产奇点已至,市场存在万亿成长空间 [9]
【全网无错版】上周末,唐杰、杨强、林俊旸、姚顺雨真正说了什么?
机器人圈· 2026-01-13 17:41
文章核心观点 文章记录了2026年初中国AI领域一场汇聚顶尖学者与产业界核心人物的圆桌讨论,探讨了中国大模型行业的发展分化、AGI的下一个技术范式、Agent战略以及中国AI的未来前景[1][6]。核心观点认为,中国AI行业在经历了2025年开源模型的爆发式增长后,正进入一个关键的分化与战略选择期,行业需从追随转向引领,通过聚焦特定方向、探索新范式、发展Agent应用并改善创新环境,以在全球竞争中占据领先地位[6][22][57][70]。 话题1:中国大模型将如何分化? - **市场出现To C与To B的明显分化**:ChatGPT和Claude Code分别被视为To C和To B的典范。To C应用对智能强度的需求增长放缓,而To B应用则因智能直接关联生产力,对最强模型有明确的付费意愿溢价[8][9][10][11]。 - **技术路径出现垂直整合与模型应用分层分化**:在To C场景,模型与产品强耦合的垂直整合模式依然有效(如ChatGPT、豆包)。但在To B生产力场景,趋势是模型层与应用层分离,强大的基座模型被多样化的应用层产品所利用[12]。 - **企业战略分化基于自身基因与数据优势**:腾讯作为To C基因强的公司,其瓶颈在于为模型提供更多上下文(Context)和环境(Environment),而非单纯追求模型规模[13][14]。大公司可利用其内部多样化的真实场景数据来训练模型,这相比依赖外部数据标注商能获得独特优势[15]。 - **分化是自然演进与客户需求驱动的结果**:行业分化并非完全预设,而是在与客户频繁交流中自然发现机会(如Anthropic聚焦Coding和Finance),中国SaaS市场环境与美国不同也影响了分化路径[17][18]。 - **学术界与工业界的分化与协作**:工业界在资源投入上主导发展,学术界应跟进解决基础科学问题,如智能上界、资源分配效率、哥德尔不完备定理下的幻觉消除极限等[19][20]。 话题2:AGI的下一个范式 - **自主学习(Self-learning)成为硅谷共识与热点方向**:该方向已被广泛讨论,但其具体形态因场景和奖励函数不同而多样,例如聊天个性化、编码环境适应、科学探索等[23]。 - **自主学习已在特定场景下以渐变形式发生**:例如ChatGPT利用用户数据优化聊天风格,Claude Code项目95%的代码由自身编写以实现自我改进,这被视为一种特定场景下的AGI体现[24]。 - **新范式的瓶颈在于想象力与评估标准**:实现突破的关键条件可能已部分具备(如Cursor的模型利用实时用户数据更新),但更大的挑战是如何定义和验证“实现了自我学习”的成功标准[25][26]。 - **OpenAI仍被视为最有可能引领新范式的公司**,尽管其商业化可能削弱了部分创新基因[26]。 - **强化学习(RL)的潜力尚未充分释放**:RL的计算规模(Compute)尚未充分扩展,仍存在基础设施(Infra)问题,其潜力有待进一步挖掘[27]。 - **Task-time Scaling(任务时间缩放)与主动性(Active Learning)是关键探索方向**:让AI在单次任务中通过消耗更多计算时间(Token)变得更强,以及让AI能根据环境信号自主启动并规划任务,是重要的范式候选,但伴随安全担忧[27][28]。 - **个性化(Personalization)可能是自主学习早期落地的场景**,但如何衡量AI时代的个性化效果成为新的技术挑战[29][30]。 - **记忆(Memory)技术的突破可能是线性发展后的感知临界点**:技术本身线性发展,但当记忆能力达到某个临界点,用户体验可能发生跃迁,类似电影《Her》中的效果,这可能需要一年左右时间[31]。 - **联邦学习(Federated Learning)代表的协作范式前景广阔**:通过“多个中心协作”模式,能结合通用大模型与本地专业化模型,在医疗、金融等隐私要求高的领域具有应用潜力[34]。 - **2026年出现新范式变革的驱动力增强**:学术界算力资源提升使其具备创新基础;工业界持续投入的边际效率下降,催生对“智能效率”(Intelligence Efficiency)提升新范式的需求[35][36][37]。 话题3:Agent战略 - **To B的Agent已进入价值上升曲线**:Anthropic的路径表明,在To B领域,模型智能提升与解决任务数量、商业收入增长高度一致,使得生产力Agent的发展势头强劲[41]。 - **当前Agent发展的两大瓶颈是环境部署与用户教育**:即使模型能力停滞,通过更好部署到各行业也能带来巨大经济收益(潜在影响GDP 5%~10%,目前远低于1%)。同时,会使用AI工具的人与不会使用的人之间的能力差距正在拉大,教育至关重要[41][42]。 - **产品哲学趋向“模型即产品”(Model as a Product)或“研究即产品”(Research as a Product)**:成功的Agent产品(如Manus)以及OpenAI的模式显示,研究员端到端地将研究转化为产品是重要趋势[43]。 - **未来的Agent将是“托管式”且与自我进化、主动学习强相关**:能够执行长时间、通用任务的Agent,需要在任务过程中自我进化并主动决策,这对模型能力提出更高要求[44]。 - **Agent的终极潜力在于与复杂物理环境交互**:超越电脑环境,指挥机器人进行湿实验等操作,才能实现自动化人类更长时间工作流的愿景,这可能需3-5年并与具身智能结合[45][46]。 - **通用Agent的机会在于解决长尾需求**:与推荐系统类似,解决海量个性化、非标的长尾问题是AI和通用Agent的核心魅力与挑战所在[46][47]。 - **强化学习(RL)降低了修复模型问题的难度**:相比以前,现在只需少量查询(Query)和奖励(Reward)数据,就能通过RL快速优化模型在特定问题上的表现[48][49]。 - **Agent将经历从人工定义到内生自动化的四个阶段**:从当前目标与规划皆由人定义,最终发展为目标和规划均由大模型自主定义的内生(Native)系统[51][52]。 - **Agent成功的三要素是价值、成本与速度**:需解决有真实价值的问题、控制实现成本,并在快速迭代的时间窗口内建立优势[54][55]。 话题4:中国AI的未来 - **中国在技术追赶和工程复现方面具备强大能力**:一旦技术路径被证明可行,中国团队能快速跟进并在局部做到更好,制造业和电动车已有先例[57]。 - **突破新范式需要更多冒险精神与前沿探索**:中国拥有大量顶尖人才,但相较于美国,愿意从事高风险、探索性前沿研究的人可能还不够多,这受经济、商业环境和文化因素影响[58]。 - **研究文化更倾向于做确定性高和看重榜单排名**:国内研究更聚焦已被验证的路径(如预训练),对探索性方向(如长期记忆)相对谨慎。同时,相较于海外更注重实际体验(如Claude的实用性),国内有时对刷榜数字看得更重[60][61]。 - **算力资源分配存在差距,但可能催生“穷则思变”的创新**:美国在用于下一代研究的计算资源上领先中国1-2个数量级,中国大量算力用于产品交付。资源紧张可能反而激励算法与基础设施的联合优化等效率创新[62][63][64]。 - **年轻一代冒险精神增强与营商环境改善是积极信号**:90后、00后的冒险精神更强,结合中国营商环境的持续改善,为创新提供了可能[65][70]。 - **对中国团队3-5年内成为全球AI领导者的概率判断存在分歧**:林俊旸认为概率低于20%,主要因历史积淀和算力差距[66]。姚顺雨表示乐观,认为关键在于能否引领新范式[57][58]。杨强回顾互联网发展,认为中国在应用层面,尤其是To C领域,有望百花齐放并领先[66][68]。 - **成功的关键条件包括人才、环境与坚持**:需要敢于冒险的聪明人、更有利于创新的营商环境(减少交付压力、鼓励竞争),以及从业者在选定的道路上笨拙而持久的坚持[69][70][71]。
中金:受模型层情绪外溢 AI应用端迎来估值重塑
智通财经· 2026-01-13 16:29
文章核心观点 - AI大模型层近期催化不断,从AI基础设施、AI模型到AI应用均迎来估值抬升及新的投资机遇 [1] AI模型层 - 海内外基座模型加速更新,同时独立模型厂商上市形成双重催化 [2] - 国内模型方面,DeepSeek、字节豆包等有望在春节前后更新基座模型 [2] - DeepSeek开源模型V4计划于2月中旬发布,根据内部测试,其在代码能力方面已比肩Anthropic Claude [2] - 预计海外模型Anthropic、OpenAI、Gemini等也有望在第一至第二季度更新模型能力 [2] - 今年头部模型厂商仍会聚焦通过强化学习、长上下文工程优化等突破智能上限,收入端预计加速增长 [2] AI应用层 - 受模型层情绪外溢影响,应用端迎来估值重塑 [3] - 今年随着模型能力持续提高及垂类场景数据整合,AI应用渗透率将提升 [1][3] - 可重点关注业绩确定性高的AI Coding、用户付费意愿较强的AI健康、以及AI for Science中的AI医药等垂类赛道 [1][3] - 目前AI收入在应用公司总收入占比较低,市场可能对各公司AI业务给予分类加总估值,整体估值体系或将重塑 [3] AI基础设施层 - 长上下文与模型记忆能力的发展仍将拉动存储叙事延续 [4] - 长上下文是智能体实现多步长链任务的基础,导致键值缓存所需的内存量增加 [4] - 模型厂商正在探索如何优化模型记忆以实现持续学习和在线学习,例如将长期记忆写入模型参数,因此存储及数据库相关需求或仍将提升 [4] 相关投资标的 - 推荐AI应用相关厂商:金山办公(688111.SH)、鼎捷软件(300378.SZ)、福昕软件(688095.SH)、税友股份(603171.SH) [5] - 推荐AI基础设施相关厂商:深信服(300454.SZ) [5]
DeepSeek母公司去年进账50亿,够烧2380个R1
量子位· 2026-01-13 15:21
DeepSeek的独特发展模式与资金状况 - 自R1模型发布一年以来,DeepSeek未进行任何新融资,也未开展明显的商业化动作[1][2] - 公司持续产出高水平学术论文,研发团队保持高度稳定,新版R1论文作者甚至出现“回流”[3] - 公司是全球唯一一家未接受外部融资且不隶属于任何大型科技公司的AI实验室[35] 母公司幻方量化的财务支撑 - 母公司幻方量化在2025年业绩表现极为突出,旗下基金收益率普遍在55%以上[6] - 幻方量化管理的资产规模超过700亿元,其量化基金在2025年平均收益率达56.6%,在百亿级量化基金中排名第二[8][9] - 据彭博社报道,幻方量化在2025年可能为创始人梁文锋赚取超过7亿美元(约50亿元人民币)[10] - DeepSeek的研究经费直接来自幻方量化的研发预算,这笔巨额收入为其提供了充足的“弹药”[13] 极致的研发效率与成本控制 - DeepSeek的模型研发成本极低,V3模型研发仅花费557.6万美元,R1模型仅花费29.4万美元[15] - 按此成本计算,幻方量化2025年的收入足以支持训练125个V3模型或2380个R1模型[16] - 公司在持续改善训练效率,资金储备充足[16] 与行业主流商业化路径的对比 - 行业其他主要玩家如OpenAI正积极寻求商业化,包括探索广告、以算力换取芯片厂商投资(据称从英伟达等公司获得超1万亿美元支持)以及推动多种产品矩阵[18][20][21][22] - 相比之下,DeepSeek专注于AGI研究,即使发布如R1这样的强大模型也选择开源,并未急于产品化或商业化[25][26] - 公司将资源主要集中于底层模型训练,而非高并发的应用场景推理[29] 独特的公司结构与战略优势 - DeepSeek的资金完全依赖母公司输血,而幻方量化已停止接受外部资金,这使得DeepSeek不受外部股权结构或短期盈利预期的约束[38][39] - 公司最初是作为辅助量化投资的“副业”启动,与母公司业务相辅相成,没有内部转型阻力[40] - 这种模式集成了成熟商业模式(如谷歌的搜索广告)的现金流优势与AI原生公司(如OpenAI)的专注度优势[43][49] 稳定的团队与科研文化 - 由于无需为资金发愁,DeepSeek能维持纯粹的科研环境,让团队全身心投入AGI研究[51] - R1论文发布近一年后,18位核心贡献者全部仍在团队,总计100多位作者中仅有5位离开,团队稳定性极高[52][53] - 与去年相比,作者名单中离开标记减少一个,出现人才“回流”现象[54][55] - 公司能为研究员提供顶级资源和丰厚薪酬,吸引并留住有志于AGI研究的人才[57] 对相关产业的溢出效应 - DeepSeek发布的技术报告和硬件设计建议被部分投资者视为“研报”,用于指导投资决策[61] - 国产芯片公司会迅速针对DeepSeek的新模型进行适配,相关消息常引发股价波动,例如寒武纪在V3.2发布四分钟后宣布完成适配,次日股价跳涨近5%[65][67][70]