多模态
搜索文档
未知机构:弘则研究科技国内外AI应用冰火两重天模型和应用的矛盾加剧发布于2026年-20260120
未知机构· 2026-01-20 10:40
行业与公司 * 行业:全球人工智能产业,涵盖上游算力、中游模型与下游应用[1] * 公司:涉及海内外多家科技公司,包括Anthropic、OpenAI、Google、字节跳动、腾讯、阿里巴巴、美图等[1][3][5][6][7] 宏观趋势与市场分化 * 中美AI应用市场呈现“冰火两重天”格局[1] * 美股软件股自2026年1月以来大幅下跌,主要原因是Anthropic发布具备全自动工作流能力的Agent产品,引发市场对软件开发成本和功能价值被颠覆的担忧[1] * 中国AI应用生态更偏向“闭环整合”,头部厂商依托自有流量与生态快速落地Agent功能[2] * 自2025年8月起,上游算力(芯片、设备、存储)持续走强,下游应用侧(互联网、软件公司)表现疲软[2] * 市场对短期算力资本开支确定性高,但担忧中长期需求可持续性[3] 技术演进与模型格局 * 基础模型进入线性增长阶段,未出现突破性跃迁,整体能力稳步提升[3][4] * 第一梯队模型包括Anthropic、OpenAI、Gemini[3] * 第二梯队模型包括Grok、智谱、Kimi[3] * 国内通义千问版本滞后,Deepseek V4有望冲击第一梯队[3] * 多模态成为关键突破点,例如Google的NanoBanana等图像编辑模型具备视觉交互能力,显著提升Agent在浏览器自动化、GUI操作、机器人、医疗影像等场景的连续任务执行能力[4] * 垂直模型转向“后训练+强化学习”模式,不再依赖RAG外挂检索,而是将专家思维链内化至模型,实现类人推理[4] * 医疗、金融、编程等领域需大量专家标注数据支撑[5] 国内外AI应用落地对比 * **国内(闭环生态驱动)**: * 字节跳动:豆包手机采用“OS+APP”模式,通过读屏理解操作APP,但效率偏低[5] * 腾讯:开放小程序生态,将小程序转化为Agent(“超级应用+Agent”)[5] * 阿里巴巴:通义千问新版本深度整合阿里生态(飞猪、饿了么等),实现无需跳转的闭环服务,被视为首个真正落地的C端Agent,显著提升其AI叙事确定性[5] * **海外(平台+第三方生态)**: * Anthropic:聚焦编程工作流,实现“仅需产品设计即可自动生成完整产品”,颠覆传统软件开发逻辑[5] * OpenAI /JIMI:仍以Chatbot为主,侧重一次性输出,缺乏任务规划能力[5] * Google:拥有自有模型,推出Sketch(对标Figma)、Opa Notebook等工具,但偏C端,专业场景影响有限[5] 投资逻辑与标的推荐 * **上游(受益明确)**:存储(DRAM/HBM/SSD)、半导体设备、电力设备——受益于AI推理需求迁移与台积电扩产(2026年CAPEX预计增长30%-40%)[5] * **平台型公司(生态+模型+流量)**: * 海外:Google[6] * 国内:阿里巴巴(已验证闭环)、腾讯(待观察)、快手[6][7] * **终端场景类(AI赋能而非替代)**:推荐美图、Roblox、Reddit[7] * **ToB工具类(存在错杀机会)**:Adobe、Figma等正与大模型公司合作转型,需观察2026年Q1产品落地与业绩兑现[7] 核心判断与展望 * 2026年是“第三个Agent元年”,但成败未定,市场给予极高溢价[7] * Agent的核心竞争力从“通用对话”转向“自动化工作流执行”,尤其在编程、医疗等垂直领域[7] * 国内AI应用因生态闭环+快速迭代,在C端落地速度领先;海外则在B端工作流自动化上更具颠覆性[7] * 存储需求正从训练侧向推理侧迁移,SSD作为“个人记忆体”将成为下一代Agent基础设施[7] * 总结:AI产业正经历从“模型竞赛”到“应用落地”的关键转折,中美路径分化明显,技术突破(多模态、强化学习)与生态整合能力成为胜负手[7]
中信证券:看好算力芯片及系统级厂商投资机遇 关注政策对卫星、医疗、消费等内需科技的持续支持
智通财经网· 2026-01-20 08:45
算力发展趋势与投资主线 - 核心观点:展望2026年,算力发展具备高确定性,超节点技术升级和CSP大厂资本开支持续高增将驱动行业增长,看好算力芯片及系统级厂商投资机遇 [1] - 投资主线建议关注四大方向:AI算力、AI应用、算力卫星、AI医疗 [1] 算力趋势:超节点技术与系统级竞争 - 算力竞争正从单卡算力比拼过渡到超节点等系统级别竞争,系统级能力将成为下一阶段重要竞争要素 [2] - 超节点时代助力集群性能提升,海外头部服务器公司已验证可凭此获取超额份额与利润 [2] - 国产算力超节点竞争力迅速提升,有望在超节点时代获得更多采购 [2] - 各大CSP厂商持续加速资本开支投入以及tokens需求持续释放,为算力发展提供高确定性背景 [2] AI应用:拐点已至与价值重估 - 下一代大模型(如Gemini 3.0/GPT5)将实质利好复杂推理、多模态类场景,助力AI产业走向规模化落地 [3] - 伴随模型能力提升,AI应用将从Chatbot、Coding等场景,更多走向广泛的多模态、Agent、具身智能等场景 [3] - 2025年以来海外AI应用年度经常性收入数据持续增长,商业化加速落地 [3] - 国内AI应用公司正加速布局海外市场,抢占全球份额,海外业务带来全新商业价值 [3] 内需支持:政策驱动的结构性机会 - 2025年以来政策持续支持科技内需,预计2026年支持力度将持续加大 [4] - 在卫星互联网领域,政策加大对卫星算力等方向支持,带动卫星科技公司需求 [4] - 在医疗领域,政策持续关注民生AI及医疗便利性,带动医疗科技公司需求 [4] - 在消费、财税领域,政策不断促进消费、规范财税制度等,带动消费科技公司需求 [4] - 结构性内需修复将成为计算机板块2026年值得重点关注的方向 [4] 结构性亮点方向 - 预计从2026年起,算力卫星建设将逐步提速,星算产业化进程加快 [1] - AI医药电商领域不断创新,场景落地加快 [1]
日均停留近2小时,这个AI内容产品拿捏了县城青少年
36氪· 2026-01-19 15:48
公司定位与核心业务 - 公司定位为“AI角色厂牌”或“AI native的角色/IP厂牌”,本质上是一个“无限大的无忧传媒”,旨在孵化和管理AI生成的虚拟角色IP [8][37][40] - 公司官方对外定位是“AI内容社区”,核心业务是将大模型能力转化为可被消费的多样化内容体验,包括文字、音乐、视频、短剧等 [2][35][37] - 公司不强调产品的AI属性,致力于隐藏“AI味儿”,以消除与大众用户的距离感,产品设计为无性格的、可承载任何内容形态的万能平台 [37][45][48] 用户画像与增长策略 - 截至2025年6月,公司累计用户超1000万,核心用户为00后、10后的年轻女性,年龄段主要在12-35岁,核心在14-20岁 [8][15] - 用户日均停留时长高达1小时50分钟,粘性极强 用户地域分布以河南、河北、广东为主,安卓设备占比超95% [8][23] - 增长策略是跟随大模型能力演进,匹配不同阶段的用户群 早期(2024年2月上线)从四五六线城市的低龄女性用户(中小学生)切入,利用Character模型满足其丰富想象力 [7][25] - 随着多模态模型能力发展,公司通过增加视频等互动内容,将用户年龄段向上扩展至大学生及更年长群体 [7][27][36] 运营数据与行业地位 - 公司是大模型厂商的重要客户,在2024年假期峰值时是豆包大模型最大的客户 [2] - 2024年6月,公司上线仅4个月,其日均token消耗峰值已达200亿,而当时豆包大模型能找到日均消耗1亿的客户已属不易 [2] - 近期数据显示,公司日均模型调用量高达6000多万次,日均token消耗达“千亿级别” [2] - 公司作为连接模型生态与用户生态的“桥梁”,其将模型能力转化为大规模用户消费场景的价值受到模型厂商高度重视 [49][50] 产品演进与内容逻辑 - 产品从AI互动故事起家,用户可参与编写剧情,由AI扩充完成 随着模型多模态能力发展,内容形态扩展至生成漫画、音乐、MV、视频互动等 [3][7][35] - 产品底层逻辑是围绕“角色IP”构建内容,一个角色下可支持多种内容类型,最终目标是让用户对角色产生情感连接,形成IP价值 [9][37][42] - 公司致力于降低创作门槛,通过设计用于拼接模型的workflow,并利用模型的推理能力简化创作,目标是让初中生都能使用AI进行创作 [7][14][30] 技术合作与成本策略 - 公司在早期与相熟的模型厂商(如商汤)合作,共同承担早期算力成本,待大厂开始降价时再切换,以支撑其追求大规模用户群的产品战略 [7] - 公司创作工具需要兼容并快速迭代无数模型,以周为单位跟进模型能力更新,第一时间将最佳模型能力转化为内容体验 [28] - 技术突破如Nano Banana解决了“角色一致性”这一核心问题,为角色IP的丰富内容扩展(如换装、故事性内容)奠定了基础 [32] 创始人理念与市场认知 - 创始人认为应跟随时代浪潮尽早行动,“面对一波新的浪潮的时候,你一定得早,你晚就会很被动” [9] - 创始人明确不服务挑剔的“产品蝗虫”或Geek用户,认为“挑剔的用户不是大众”,公司专注于服务主流大众用户的娱乐需求 [16][17][19] - 创始人反对“教育用户”,认为公司责任是确保内容合规,在底线之上尊重用户的审美和趣味,提供工具让用户将想法变成内容 [24] - 创始人经历过“逻辑自恰,但与事实不符”的创业失败(如人脸识别项目),因此更注重用真实数据和用户反馈验证方向 [48][49][51]
王小川时隔一年多再露面谈医疗行业痛点:百川智能一定会“出海”,也会走上IPO道路
新浪财经· 2026-01-14 20:26
公司战略聚焦 - 百川智能将全面收缩战线,集中资源押注医疗AI赛道,公司创始人王小川表示从创立之初就希望深耕医疗,未来将确保新员工都认同此方向 [1] - 公司计划于2026年上半年推出两款面向消费者(To C)的医疗AI产品,并明确其商业化路径,认为只要能为患者提供辅助决策价值即可收费 [10] - 公司未来有明确的上市(IPO)计划,但表示相较于已上市的通用模型公司,其准备时间可能更长,希望构建更优的商业模型,预计还需一两年时间 [11][12] 行业趋势与竞争格局 - 国内外头部模型公司正密集进入医疗AI场景,例如OpenAI正式上线健康能力,Claude发布医疗计算与智能体相关技术,行业竞争加剧 [3] - 医疗被视为大模型“皇冠上的明珠”,其应用已开始进入实际范畴,AI医生正成为可能 [3][4] - 在医疗AI领域,大厂更注重行业共识,而小厂则可能依靠切入高价值严肃场景来实现大创新,百川智能选择了一条与大厂不同的创新节奏 [11] 对医疗行业痛点的洞察 - 当前医疗行业的核心问题在于“供给不足”与“结构失衡”,好医生长期短缺,且存在医患权利不平等,患者是受益方而医生是决策方 [4] - AI的价值在于填补医患信息鸿沟,推动决策权逐步向患者让渡,使患者能更明白地参与诊疗,而非简单取代或辅助医生 [4][5] - 中外医疗体系存在关键差异,中国患者倾向于直接选择三甲医院,未来趋势是医疗场景将发生变化,轻症和日常健康问题将转向居家场景,从而提升整体基层(包括居家)诊疗能力 [5][6] 技术路线与核心观点 - 公司不认同“多模态是主战场”的主流观点,认为符号与语言才是中轴,智力体现在将具体问题抽象化的能力,而非图像识别 [7][8] - 在医疗领域,大量问题本质是决策问题,未来影像解读可能由专门小模型完成,其结果符号化后再交由语言模型进行推理,感知模型与认知模型需结合 [9] - 公司对数据的重要性持有争议性观点,认为智力是本质问题,高质量院内数据并非决定模型上限的唯一关键,真正的核心在于评测体系和训练方法,以及从论文中萃取知识 [9] 产品定位与市场选择 - 公司判断未来医疗大模型的巨大增量在院外而非院内,院内空间有限,过去以医生为中心的AI服务模式是“隔山打牛” [9][10] - 公司产品定位清晰,专注于帮助患者理解信息、权衡方案和参与决策的辅助工作,不会越线进行诊断或开具处方 [10] - 公司明确其护城河在于模型领先一代、切入高价值严肃场景以及坚持独特的创新节奏,并确认未来一定会出海 [11]
王小川时隔一年再露面谈行业痛点:医疗大模型进入医院内是“隔山打牛” 不认可多模态是主战场
每日经济新闻· 2026-01-14 14:53
公司战略聚焦 - 百川智能将全面收缩战线,未来战略核心聚焦于医疗AI赛道,公司创始人王小川表示从第一天起就想做医疗,现在将确保新员工都认同此方向 [1] - 公司判断医疗是大模型“皇冠上的明珠”,并已进入应用范畴,因此选择集中资源只做医疗这一件事 [1] 行业痛点与市场机会 - 医疗行业的核心问题被归结为“供给不足”和“结构失衡”,具体表现为好医生长期短缺以及医患权力不对等 [2] - AI的价值在于填补医患信息鸿沟,推动决策权向患者让渡,从而改变医疗关系结构,而非简单取代或辅助医生 [2][3] - 中外医疗体系存在关键差异,中国患者倾向于直接选择三甲医院,未来趋势是医疗场景向居家转移,提升居家诊疗能力 [3][4] - 行业风向变化,OpenAI、Claude等国内外头部模型公司正密集进入医疗场景 [1] 技术路线与研发理念 - 公司不认同“多模态是主战场”的主流观点,认为符号与语言才是中轴,智力(将具体问题抽象化的能力)是核心 [5] - 在医疗领域,大量问题本质是决策问题,未来影像解读可能由专门小模型完成,其结果符号化后再交由语言模型推理,感知模型与认知模型需结合 [6] - 公司认为数据并非决定模型上限的唯一关键,智力是本质问题,核心在于评测体系和训练方法,以及从论文中萃取知识体系 [6] - 公司创始人批评市面上有500多个垂直医疗模型,但认为他们“都不知道什么叫做模型” [6] 产品场景与商业化路径 - 公司判断未来医疗大模型的巨大增量在院外而非院内,院内空间有限,过去以医生为中心的AI服务模式是“隔山打牛” [7] - 百川智能选择明确的To C路径,计划直接帮助患者,将于今年上半年推出两款产品 [7] - 商业化上,只要能为患者提供辅助决策价值就可以收费,模式包括直接向患者收费或通过服务包整合医疗资源和药械 [7] - 在监管边界上,公司定位为帮助患者理解信息、权衡方案、参与决策的辅助角色,不会进行诊断或开具处方 [7] 公司竞争优势与未来规划 - 公司的护城河总结为三点:模型领先一代、切入高价值严肃场景、坚持与大厂不同的创新节奏 [8] - 公司明确表示未来一定会出海,认为“不能出海的医疗公司不是好公司” [9] - 公司未来计划上市,但时间上会晚于近期已上市的同行,希望用一两年时间准备以优化商业模型,包括收入与成本结构 [9]
智谱IPO后唐杰首次公开亮相:「Chat之战」已结束,押注Coding的选择非常正确
IPO早知道· 2026-01-12 10:04
行业技术范式与竞争格局 - 行业普遍认为Chat范式的探索已基本结束,未来更多是工程和技术优化问题[4][5] - 中美大模型之间的差距可能仍在拉大,因美国模型更多闭源,而中国模型主要在开源领域竞争[9] - 多模态和AI for Science被视为2026年将迎来爆发的重点方向[11] 公司战略与产品发布 - 智谱团队基于对Chat范式见顶的判断,决定将战略重点转向Coding领域[4][5] - 公司于2025年7月28日推出新一代旗舰模型GLM-4.5,首次在单模型中实现推理、编码和智能体能力的原生融合[5] - 公司计划在2026年专注于技术创新,包括探索新的模型架构、解决超长上下文和高效知识压缩问题,并实现知识记忆与持续学习[9][11] 产品性能与市场反馈 - 2025年12月上线的GLM-4.7在多项基准测试中表现领先:在Code Arena盲测中位列开源第一、国产第一,超过GPT-5.2;代码能力对齐Claude Sonnet 4.5;在AA智能指数中以68分综合成绩荣登开源与国产模型双料榜首[7] - 同期开源的基座智能体模型Open-AutoGLM创下3天达成10000 Stars的成绩,成为2025年继DeepSeek-R1后第二款爆发式增长的开源项目[7] - 中信证券研报指出,GLM CodingPlan、AutoGLM等新产品性能优异,2026年高性价比代码工具可能对公司的云端收入产生更大影响[8] 公司发展里程碑 - 智谱于2026年1月8日登陆港交所,成为“全球大模型第一股”[3] - 公司创始人唐杰在上市后首次公开亮相于AGI-Next前沿峰会[2][3]
AI圈四杰齐聚中关村,都聊了啥?
首席商业评论· 2026-01-11 12:57
文章核心观点 - 清华大学主办的AGI-Next前沿峰会汇集了中国AI领域的核心人物,包括智谱AI唐杰、Kimi杨植麟、阿里林俊旸和腾讯姚顺雨,共同探讨了通用人工智能(AGI)的当前进展与未来范式转变 [2][4][6] - 行业共识认为,以Chat为代表的对话模型时代已基本结束,AI发展的下一步核心是“从对话走向做事”,即让AI具备执行具体任务的能力,特别是通过智能体(Agent)和编码(Coding)来提升生产力 [6][12] - 中国在开源大模型领域已形成显著影响力,但在整体AI赛道上实现反超仍面临巨大挑战,需要持续在技术创新、新范式探索上投入 [6][19] 大模型发展轨迹与能力演进 - 大模型智能水平发展轨迹类似人类成长:2020年前后解决简单问答,2021-2022年进入数学计算和基础推理,2023-2024年走向复杂推理并能处理研究生层级问题,在真实世界编程任务中表现出可用性 [9] - 模型能力正从知识记忆走向复杂推理,并开始通过人类终极测试(HLE)等极高难度基准的检验,2025年模型整体能力仍在快速提升 [9][10][11] - 代码能力是典型进步领域:从2021年模型写十个程序才能跑通一个,发展到如今在复杂任务中往往可以一次性跑通,能实质性地辅助高级工程师 [12] 下一代范式:从Chat到Agent - DeepSeek的出现标志着Chat这一代问题基本被解决,优化空间正在迅速收敛,行业需要思考新范式 [12] - 新范式的核心是让AI完成具体事情,主要思路有两条:一是强化思考(Thinking)能力,结合编码与智能体;二是让模型更深度地与环境交互 [12] - 智谱AI优先选择了强化思考能力并引入编码场景的路径,通过整合编码、智能体和推理能力,并在真实环境中通过可验证强化学习(RLVR)来提升模型稳定性 [13][14] - 智能体(Agent)的基础能力可理解为编程,但更复杂的任务涉及几十步、上百步的异步超长链路,需要AI具备设备使用层面的能力 [15][16] 技术挑战与解决方案 - 可验证强化学习(RLVR)的挑战在于可验证场景(如数学、编程)正逐渐耗尽,需探索如何进入半自动或不可验证的任务空间 [11] - 训练体系挑战:强化学习任务种类多样,序列长度和时间尺度差异大,智谱AI开发了全异步强化学习训练框架以实现不同任务的并行运行与动态收敛 [15] - 冷启动问题:许多应用场景几乎没有现成数据,解决方案是采用API与GUI操作的混合方案,在真实环境中采集交互数据并进行全异步强化学习 [16] - 能力平衡问题:在9B规模模型上引入大量智能体数据后,其智能体能力显著增强,但部分通用语言和推理能力会下降,未来需解决在强化智能体能力的同时避免损害通用能力的问题 [18] 未来突破方向与行业思考 - 多模态:建立类似人类视觉、听觉、触觉的原生多模态“感统”机制是关键方向 [21] - 记忆与持续学习:如何将个体记忆扩展到群体级、文明级的记忆结构,并纳入模型可持续学习框架 [22] - 反思与自我认知能力:学界存在分歧,但值得探索,可能参考人类双系统认知(系统一与系统二)并引入“自学习”模块 [23] - 继续Scaling的三个维度:Scaling数据与模型规模以提升智能上限;Scaling推理以延长思考时间;Scaling自学习环境以增加与外界交互的机会 [24] - 需要寻找超越单纯Scaling的新范式,让机器能独立定义奖励函数、交互方法甚至训练任务来进行Scaling [24] 智谱AI(唐杰)的实践与展望 - 公司发展源于2019年在清华的成果转化,长期专注于两件事:早年做AMiner以及当前的大模型 [8] - 2025年是GLM模型的开源年,从1月到12月陆续开源了多条模型线,涵盖语言模型、智能体及多模态模型 [19] - 在Artificial Analysis榜单上,前五名中的蓝色模型几乎全部来自中国,显示中国在开源大模型领域的影响力 [19] - 2026年及以后的三个重点方向:继续Scaling但需区分已知路径与探索未知新范式;推进全新模型架构探索以解决超长上下文、高效知识压缩等问题;将多模态感统作为重点方向,以执行长链路、长时效的真实任务 [27] - 判断2025年很可能成为AI for Science的重要突破年份 [28] Kimi(杨植麟)的技术路径与世界观 - 大模型发展的第一性原理是Scaling Law,即把能源转化为智能,拥有更多算力、数据、参数可使模型损失(loss)线性下降 [30][32] - Transformer成为主流架构的核心原因是在Scaling Law上表现优于LSTM,能用更少的FLOPs或参数获得更好的Scaling效果 [33] - 优化围绕两个核心维度:Token效率(用尽可能少的Token获得相同效果)和长上下文(Long Context)能力,两者结合可实现优秀的智能体智能 [35][36] - 公司采用了MUON优化器(一种二阶优化器),相比传统Adam优化器能带来2倍的Token效率提升,相当于用50%的数据达到相同的测试损失,或用相同数据获得更低的损失 [36][38] - 最新研究的kimi Linear架构是一种新的线性注意力机制,旨在长程任务上效果优于全注意力机制,同时端到端速度有显著优势(如100万上下文下快6到10倍) [44][45] - 做模型的本质是在创造一种世界观,追求智能的“品位”(Taste),智能具有不可交换性,不同领域产生的智能不同,因此模型不会趋同,存在指数级的Taste空间 [47] 阿里千问(林俊旸)的进展与多模态探索 - 公司目标从通用模型(Generalist model)转向通用智能体(Generalist Agent),强调AI应像人一样自主使用工具 [53] - 2025年文本模型(Qwen3系列)的主要特点是总体能力提升,特别是推理能力增强,并支持119种语言及方言 [58][59] - 在编码(Coding)能力上,重点从解竞赛题转向软件工程,关注在真实环境中完成多轮交互的复杂任务,在SWE-bench等基准上取得高分(如70分) [61][62][64] - 坚信智能体天然应该是多模态的,致力于构建统一理解与生成的多模态基础模型 [55][56] - 在视觉语言模型上取得进展,使模型在拥有视觉理解能力的同时,语言智力不降低,与其235B纯文本模型能力持平 [65] - 在图像生成方面,从2025年8月到12月,生成图像的真实感显著提升,从“AI感重”到“接近真人”,并具备准确的图像编辑能力 [68][70] - 在语音模型上,开发了能听能说的Omni模型,其文本能力可达Qwen2.5水平,语音能力对标Qwen2.5 Pro水平 [71] - 未来方向包括构建全模态模型(理解并生成文本、视觉、音频),以及利用环境反馈进行多轮强化学习以实现长视野推理 [72][73][74] 行业路线分化观察 - 观察到to C和to B市场发生明显分化:对to C而言,大部分人大部分时候不需要用到那么强的智能,更多是搜索引擎的加强版;对to B而言,智能越高代表生产力越高,价值越大,用户愿意为最强模型支付溢价 [82][83] - 观察到垂直整合与模型应用分层出现分化:在to C应用上,模型与产品强耦合的垂直整合依然成立;但在to B场景,趋势似乎是模型越来越强,同时有许多应用层产品利用这些模型服务于不同生产力环节 [84] - 大公司做编码智能体的一个潜在优势是能利用自身庞大的内部应用场景和真实世界数据来改进模型,这不同于依赖有限标注商的创业公司 [85][86] - 中美市场存在差异:在美国,编码消耗量非常大;而在中国,这一现象尚不明显 [87] - 学术界与工业界存在分化:工业界领头狂奔,学术界需要跟上,解决工业界未及深入的理论问题,如智能上界、资源分配、持续学习中的噪音清理(类似人类睡眠机制)等 [88][89] - 对话模型替代搜索的战役在DeepSeek出现后已基本结束,行业需要寻找下一战,即让AI真正做事 [91] 关于自主学习(Self-Learning) - 自主学习是当前热门共识,但每个人对其定义和看法不同,它更关乎在何种场景下基于何种奖励函数执行何种任务,而非单一方法论 [93] - 自主学习已在多种场景下发生:例如ChatGPT利用用户数据弥合聊天风格,Claude编写自身项目95%的代码以帮助自己变得更好 [94] - 当前AI系统通常由模型和如何使用模型的代码库两部分组成,自主学习正在这些特定场景下渐变式发生,2025年已能看到信号,例如Cursor每几个小时就用最新用户数据学习 [94][95]
MiniMax上市大涨109%,29岁“商汤系”跑赢清华精英
搜狐财经· 2026-01-10 02:03
上市表现与市场反响 - MiniMax于1月9日上市,首日股价收盘涨幅高达109.09%,市值飙升至1054亿港元,超越前一日上市的智谱[1] - 智谱于1月8日上市,首日股价一度破发,最终以13.17%的涨幅收盘,次日继续上涨20.61%,两日累计涨幅36.49%[3] - 市场反响差异源于商业模式不同:智谱主要面向B端企业市场,增长稳健;MiniMax凭借C端AI应用和超过70%的海外收入,讲述了全球化高增长的故事[3] 财务与运营数据对比 - 截至2025年第三季度,MiniMax现金储备达25.7亿元人民币,加上45亿元交易性金融资产,合计超70亿元,是智谱同期现金储备的两倍多[3] - MiniMax营收从2023年的346万美元飙升至2024年的3052万美元,增幅达782%;2025年前三季度营收已达5344万美元,超越智谱同期水平[3] - 2025年前三季度,MiniMax来自中国大陆、新加坡、美国和其他地区的收入占比分别为26.9%、24.3%、20.4%和28.4%,海外市场收入合计占比高达73.1%[7] - 2022年至2025年9月30日,MiniMax累计亏损约13.2亿美元;2025年前三季度研发开支达1.8亿美元,相当于总收入的337.4%,但训练成本占收入比例已从2023年的超过1365%大幅降至266.5%[8] 创始团队与公司基因 - 智谱脱胎于清华大学计算机系知识工程实验室,创始团队多为清华教授和博士,首席科学家唐杰是清华大学计算机系教授,团队学术气息浓厚[4] - MiniMax创始团队为平均年龄29岁的“商汤军团”,创始人闫俊杰曾任商汤科技副总裁,团队其他核心成员周彧聪、贠烨祎同样出自商汤[4] - MiniMax研发团队占比高达73.8%,以“95后”为主,并吸纳了大量“00后”工程师;公司四位执行董事平均年龄仅32岁[4] 产品路径与商业模式 - 智谱走深耕基座模型、通过MaaS服务企业和开发者的路线,GLM系列模型在开源社区拥有广泛影响力,其客户包括中国前十大互联网公司中的九家[4][8] - MiniMax选择了“模型即产品”的道路,直接面向全球C端用户推出AI原生应用,产品矩阵包括AI虚拟社交应用Talkie、AI视频生成平台海螺AI以及语音、音乐生成等多种模态产品[6] - 截至2025年9月30日,MiniMax已扩张至全球200多个国家和地区,拥有超过2.12亿个人用户和10万余家企业开发者[6] - 智谱近期密集开源了GLM-4.6V多模态模型、AutoGLM智能体模型等多个先进模型,通过开源生态扩大影响力;其面向开发者的工具和模型业务已获得超过1亿元人民币的年度经常性收入[8] 技术布局与行业意义 - MiniMax展示了全栈式技术能力:文本模型M2在Artificial Analysis榜单中刷新国产模型历史最好成绩;语音模型被ChatGPT高级语音模式选为底层引擎;视频模型在多个国际评测中位居第一梯队;公司还推出了国内首款全栈通用智能体MiniMax Agent[7] - 两家公司的上市填补了港股市场纯AI大模型标的的空白,标志着中国大模型赛道进入了资本市场检验的新阶段[3][9] - 行业观察指出,两家公司的不同路径反映了AI商业化的多元可能性:智谱代表的ToB路线聚焦产业数字化;MiniMax践行的全球ToC路径则直接触达终端用户[8]
最"佛系"的创始人,最"凶猛"的上市: MiniMax为何被资本市场选中?
凤凰网财经· 2026-01-09 18:15
公司上市表现与市场认可 - 公司于1月9日在港交所挂牌上市,收盘股价达345港元/股,较发行价165港元/股上涨109%,市值超过1000亿港元 [3] - 该IPO是近4年唯一一宗首个交易日上涨超100%的科技行业港股IPO项目,公开发售吸引约42万人认购,录得超额认购高达1838倍 [3] 创始人闫俊杰的性格与特质 - 创始人给外界留下“温和”、“佛系”的第一印象,但在技术路线与核心决策上异常笃定甚至凶猛 [1][3][4] - 其性格兼具“佛系”同理心与“凶猛”执行力,在理想与现实约束中摸索可持续路径 [5] - 创始人认为AI模型不同的对齐目标反映了不同公司的价值观,并直接影响AI的“性格” [3] 创始人的背景与创业驱动力 - 创始人1989年出生于河南小县城,凭兴趣考入中科院读博 [5] - 2019年因观看OpenAI开发的AI在《刀塔2》中战胜人类冠军战队而“非常激动”,意识到行业将变,于2022年初创立公司 [5] - 曾在商汤科技用七年时间从实习生做到最年轻副总裁,展现了系统拆解目标和实现的战斗力 [8] 公司的战略决策与产品技术路线 - 公司确立了“产品与技术并进”的双线策略 [9] - 2023年下半年,公司将超过80%的算力和研发资源投向当时不确定性更大的MoE(混合专家系统)架构,没有Plan B [12] - 2024年1月,公司发布了国内首个MoE大模型;同年4月,开创了将MoE架构用于大规模商业化部署的先河 [12] - 公司坚持“多模态”技术路线,要求团队至少将每个模态走通,为最终融合做准备 [21][22] 公司的商业化路径与财务表现 - 公司采用“反惯性”竞争思维,早期绕开文本大模型率先布局语音模型,并聚焦具备付费习惯的海外市场 [13] - 公司营收实现三级跳:2023年收入346万美元;2024年收入3052万美元,同比增速782.2%;2025年前三季度收入5344万美元,同比增长174.7% [13] - 营收构成动态演变:2023年B端企业服务贡献78.1%营收;2025年前三季度C端产品贡献超过七成收入,规模达千万美元级别 [14] - 收入地域来源快速全球化:2023年收入80.8%来自中国大陆;2025年前三季度海外收入占比已上升至约70% [14] 公司的产品矩阵与用户规模 - 公司已形成完整产品组合,包括MINIMAX开放平台、AI交互应用Talkie(星野)、AI视频创作工具Hailuo AI以及语音产品 [15] - 截至2025年9月30日,公司拥有超过200个国家及地区的逾2.12亿名用户,以及超过100个国家的13万企业客户 [14] - 2024年8月发布的Video-01模型,曾依靠一个展示Demo的网页使海螺AI在海外迅速走红,并长达半年占据视频生成模型赛道全球第一的位置 [9] 公司的组织管理与人才策略 - 公司保持扁平化结构,CEO之下职级不超过三层 [18] - 创始人不迷信高薪聘请“天才”,而是投入大量时间招聘具备优秀基础素质的同道中人 [18] - 公司全员385人,平均年龄29岁,其中研发人员占比达73.8% [19] - 在关键决策上风格果断,曾因与长期技术路线不符而叫停已组建的3D数字人项目,并经历组织阵痛与人员流动 [19] 公司的成本控制与效率 - 从成立至今,公司累计花费约5亿美元,约为OpenAI花销的百分之一 [21] - 以300多人的规模,做出了覆盖文本、语音、视频、音乐等多个核心领域的产品,人效比显著 [19] 公司的核心愿景与定位 - 公司slogan为“Intelligence for Everyone”,认为真正的AGI应当服务于所有人 [8][21] - 公司名“MiniMax”体现了在现实约束与宏大理想之间寻找平衡的哲学 [8]
北京成为全球AI科研核心策源地
新浪财经· 2026-01-09 00:57
文章核心观点 - 北京凭借其顶尖的人才密度、丰富的科研与产业资源、前瞻性的政策支持以及独特的创新生态,已从全球AI科研的“追赶者”转变为“核心策源地”和“引领者”,并正在打造“AI第一城”,为中国及全球人工智能发展贡献核心力量 [1][4][9][10] 北京AI产业的人才优势与创新氛围 - AI行业员工工作强度高,由AGI(通用人工智能)愿景驱动,乐于沉浸于技术探索 [1][3] - 北京以7340.3篇调整后论文数和402.59的AI指数位列全球AI科研城市第一,显著领先于中国香港和旧金山湾区 [4] - 北京依托清华、北大等顶尖高校,人才密度极高,便于学生就近在AI公司实践,形成了天然的高端、跨学科技术人才池 [2][3] - 与南方偏重商业化不同,北京对短期无收益的基础技术研发和创新容忍度高,更适合前沿探索 [4] - 创新发生在人才密集度高的地方,北京的人才密度从国际范围看都足够高,预期未来将发生更多创新 [4] 北京AI产业的生态与集群效应 - 北京聚集了大量科研和产业资源,拥有完善的人工智能自主生态系统,便于企业协同创新,避免闭门造车 [2][5] - 北京AI公司数量众多且多元,2025年全市人工智能核心产业规模预计达4500亿元,企业集聚超2500家 [6] - 截至2025年末,全国共有748款生成式AI服务完成备案,其中北京市备案模型数量为209个,占比28% [6] - 以海淀区“原点社区”为代表,形成了浓厚的AI创业氛围,工程师、创业者、投资人在办公区乃至街边酒馆咖啡店进行高频技术交流 [7] - 北京市打造以海淀为核心的“一核多点”布局,并首批发布了包括海淀原点社区、经开区模数世界、朝阳区光智空间等在内的多个“人工智能创新街区” [8] 代表性企业、机构与技术进步 - 智源人工智能研究院发布面向多种AI芯片的系统软件栈“众智FlagOS 1.6”,旨在解决不同芯片训练大模型的兼容问题 [2] - 智源研究院被誉为中国AI企业的“黄埔军校”,月之暗面、智谱AI、生数科技等公司的核心创始人均曾在此工作 [2] - 光轮智能作为仿真合成数据企业,其全栈自研仿真平台为全球前三的世界模型团队及超过80%的国际主要具身智能团队提供仿真资产和合成数据 [5] - 北京在各类模型产品上全面领先:豆包、文心、GLM、Kimi等基础模型持续迭代;生数科技Vidu、快手可灵等多模态产品受关注;面壁智能的端侧模型MiniCPM-o 2.6性能比肩GPT-4o;中科院自动化所发布全球首个全流程国产化类脑脉冲大模型“瞬悉1.0” [6] 政策支持与发展规划 - 北京市政府对科技前沿认知深入,沟通效率高,愿意支持长期投入和早期创业项目 [2][8] - 政策支持具体案例:海淀区推动全球首个高端数据标注示范基地,强调高阶人才参与数据生产 [8] - 北京市鼓励形成“一委一业、一区一品”发展格局,推动各部门、各区结合自身优势先行先试“人工智能+” [8] - 已在医疗健康、政务服务、法律服务、计算视听、电力保障等领域落地一批典型示范应用,并取得商业闭环、企业培育等阶段性成效 [9]