基础模型
搜索文档
智谱-AutoClaw会谈纪要:智能体的价值真实存在,变现和采用取决于模型、工作流和管控
2026-03-16 10:20
**涉及的公司与行业** * **公司**: 智谱 (2513.HK) [1][5][14] * **行业**: 人工智能 (AI)、基础模型、智能体 (AI Agent)、互联网 [5][10] **核心观点与论据** **关于AI智能体行业** * **智能体价值与现状**: 智能体的价值真实存在,其重要性在于**大大降低了非技术用户体验智能体工作流的门槛**,而非意味着自主AI已完全成熟 [1] * **驱动因素**: 近期智能体产品 (如 OpenClaw) 的流行主要由**产品设计与可用性改进**驱动,包括与现有通信工具的集成、持久记忆和更广泛的系统权限,而非模型智能的突变 [2] * **变现时机**: 智能体市场短期内仍处于**探索阶段**,大规模商业变现可能还需要**6到12个月**的模型改进、工作流训练数据和产品迭代 [6] * **早期采用领域**: 最清晰的早期变现路径是**结构化任务**,按优先级排序为:1) **技术工程** (编码、测试、部署等);2) **信息和内容工作流** (研究、报告生成等);3) **个人生产力** (邮件、日历管理等) [7] * **基础模型的关键性**: 智能体的商业上限**仍然在很大程度上取决于基础模型的质量**,模型是决定任务准确性、一致性和推理深度的核心因素 [3] * **开放架构趋势**: 智能体层可能不是赢家通吃的专有模型渠道,**开放架构** (支持多模型提供商) 可能成为主流,这拓宽了市场但也意味着单一模型供应商无法仅凭智能体接口保证独家价值捕获 [8] * **护城河构成**: 智能体公司的长期防御能力不在于可快速复制的功能,而在于**产品洞察速度、基础模型质量以及累积的智能体功能** (如工具、记忆系统) [9] * **受益者**: AI价值链的多个部分将受益于智能体采用:1) **模型供应商** (因token消耗增加);2) **推理基础设施与云提供商**;3) **协作与工作流平台** (通过集成智能体) [10] * **潜在受干扰者**: 价值主张为浅层中介或低门槛信息处理、**护城河有限**的企业可能面临AI带来的压力 [12] * **安全与监管**: 提示词注入、权限错误等安全问题是实际约束,将促使企业初期采用**更严格的权限和受控部署**,这可能减缓短期变现但提高受信供应商的重要性 [13] **关于智谱公司的具体分析** * **投资评级与目标价**: 给予智谱 **“增持”评级**,目标价 **800港元** (基于30倍2030年预期市盈率,以15%的WACC折现) [1][5][16][17] * **投资理据核心**: 长期价值取决于公司能否使其模型能力**保持全球一线水平**,商业模型和利润率是此能力的下游表达 [14] * **公司拐点与战略**: 公司已到达重要拐点,特别是其全球API业务,通过发布GLM-4.5/4.6/4.7系列模型,并向**智能体系统、工具增强推理和开发者基础设施**战略性转变,技术路线图与前沿能力 (如生产级编码、长上下文推理) 相结合 [14] * **业务架构优势**: * 在中国受监管行业拥有巨大的**本地化部署基础**,构成结构性持久需求池,可转化为升级驱动的经常性收入 [15] * **基于云的API**是可扩展的增长引擎,预计随着GLM-4.7获得开发者认可,使用率将快速提高,尤其是在支付意愿高的编码工作流中 [15] * **财务预测**: 预计2030年收入为 **67,063百万元人民币**,调整后净利润为 **17,146百万元人民币**,对应每股收益 **37元人民币/股** [17] * **增长预期**: 2026-2030年预期收入**年复合增长率超过100%**,这是其估值溢价 (30倍2030年市盈率) 的主要依据 [16] * **风险因素**: * **下行风险**: 包括出口管制、地缘政治风险、被列入实体清单;竞争加剧;高研发投入带来的执行风险和盈利压力;商业化与客户采用的不确定性;对计算基础设施和外部供应商的依赖 [18] **其他重要信息** * **报告方**: 摩根大通证券(中国)有限公司 [5] * **报告日期**: 2026年3月12日 [6] * **股价基准**: 报告发布时股价为 **609.50港元** [5] * **评级历史**: 2026年2月9日评级为增持,目标价400港元;2026年2月27日评级为增持,目标价上调至800港元 [23]
Nature子刊:上海交大陈晓军团队等开发AI新模型,用于显微眼科手术识别与导航
生物世界· 2026-03-14 16:30
研究背景与挑战 - 人工智能基础模型正在利用大规模未标注数据进行预训练,从而彻底改变医疗健康领域[3] - 然而,由于高质量手术数据有限以及实时部署的计算瓶颈,其在术中的应用仍处于探索阶段[3] - 在医疗AI领域,基础模型已在疾病筛查与诊断等术前任务中取得进展,但由于高质量手术数据匮乏和实时部署的计算瓶颈,其在术中的应用面临巨大挑战[6] 研究发布与核心成果 - 2026年3月3日,上海交通大学陈晓军教授等作为共同通讯作者在Nature子刊Nature Biomedical Engineering上发表了相关研究论文[3] - 该研究开发了一种专为显微眼科手术识别与导航设计的眼科视频基础模型(OVFM),以及基于该模型研发的增强现实显微手术导航系统[3] 数据与方法 - 研究团队联合8家医疗中心,构建了一个包含11426个显微手术视频的大规模眼科手术视频数据集[6] - 该数据集涵盖144种眼前段与眼后段手术类型,并被采样为约110万个手术视频片段[6] - 研究团队提出了一种基于自监督视频Transformer架构的预训练策略,通过预测同一视频的不同时空视图,引导OVFM模型学习眼科手术中复杂的时空运动特征[6] 模型性能与优化 - OVFM模型在包括手术步骤识别、器械存在识别、并发症检测及手术场景分割等7个下游任务中,全面超越了现有的视频基础模型[6] - 为满足术中导航的实时响应需求,研究团队设计了一种“从通用到特定任务”的双阶段知识蒸馏框架[6] - 该策略将模型规模最高压缩15.8倍的同时,依然保持了约95%的原始识别精度,成功实现了OVFM在手术显微镜边缘处理单元中的直接部署[6] 系统应用与验证 - 基于轻量化模型,研究团队研发了一套具备场景感知能力的智能手术导航系统[7] - 该系统能够在无需人工干预的情况下自动识别当前手术步骤,并以稳定速率实时投射切口引导线、撕囊范围圆等个性化导航信息[7] - 10位具备不同临床经验的眼科医生参与了离体猪眼白内障手术实验[7] - 实验结果表明,该系统显著改善了主副切口角度误差及连续环形撕囊中心偏差等关键手术指标[7] - 新手医生在系统辅助下展现出了比专家医生更大幅度的性能提升[7] 研究意义与前景 - 这项研究通过跨中心数据构建、核心算法设计与软硬件系统开发,展示了眼科视频基础模型在场景理解、实时响应和眼科医生技能增强等方面的潜能[9] - 该研究为下一代高性能、智能化的超显微外科手术导航及机器人系统的研发提供了全新的技术路径[9]
马斯克从Cursor挖走两位天才少年
量子位· 2026-03-13 14:10
xAI最新人事变动与战略方向 - 马斯克旗下人工智能公司xAI从AI编程工具Cursor挖来两名资深高管Andrew Milich和Jason Ginsberg,两人将直接向马斯克汇报[5][6][7] - 两位新高管的加盟正值xAI联合创始人持续流失之际,近期又有两位华人联创Zihang Dai和Guodong Zhang离职,使得除马斯克外的11位联创中仅剩两人留守[52][53][54] - 马斯克对近期的人员流失做出回应,暗示将“重新造一个xAI”[8] 新加盟高管的背景与动机 - Andrew Milich是马斯克的长期追随者,曾于2017年在SpaceX实习,此次以产品与工程负责人身份回归SpaceX并加入xAI[11][13] - Jason Ginsberg对技术变革更感兴趣,他认为软件行业正迎来巨大变革,人们开始自己构造工具,不再依赖SaaS打包的工作流,这意味着重做所有软件的机会[14] - 两人是长期的工作搭档,曾共同创办加密通讯软件Skiff(后被Notion收购),后又一同加入Cursor负责Agent相关工作,此次再次共同跳槽至xAI[30][31][32][36][37] 新高管的技术专长与xAI战略关联 - 两位高管在Cursor负责网页版Cursor Agent的开发,其产品思路包括支持移动设备随时随地“vibe coding”以及通过Slack等通讯软件主动汇报进度,这些是一年前提出的Agent产品化思路[22][25][27] - 他们的专长与马斯克近期披露的“数字擎天柱”项目目标高度契合,该项目旨在将依赖键盘、鼠标、屏幕的决策型工作数字化,并模拟完整公司的运作[17][19][21] - 此次人事变动可能预示着xAI将加速开发类似“Grok Claw”的AI Agent或数字员工产品[29][30] Cursor的现状与行业竞争 - Cursor曾是炙手可热的AI编程助手,从上线到实现1亿美元年度经常性收入(ARR)用时不到两年,到2025年11月ARR达到惊人的10亿美元[40][41] - 然而,随着Anthropic和ChatGPT等基础模型公司下场推出Claude Code和Codex等应用,Cursor面临巨大竞争压力,市场份额迅速流失,其“大模型套壳”模式的护城河受到质疑[43][44][45] xAI的吸引力与内部挑战 - 对于人才而言,xAI具备强大吸引力:拥有SpaceX作为后盾,资金充足;具备自研基础模型和算力资源;同时保留了创业公司般的“闪电文化”,能让新员工快速获得资源开展工作[47][48][49] - 但xAI内部存在显著挑战:马斯克追求极致“硬核”和扁平化的管理风格导致工作强度极高,员工疲于奔命;也有前员工指责公司存在严重官僚主义[55][56][58][59] - 公司呈现出“围城”现象,内部资深员工不断离职,外部仍有大量人才怀揣抱负希望加入[60][62]
【播客】又有神秘模型海外走红 智谱股价暴拉40%
Datayes· 2026-02-09 19:52
Pony Alpha 模型上线引发市场关注 - 全球模型服务平台OpenRouter于2月6日上线名为“Pony Alpha”的神秘模型,凭借强大的编码能力和对智能体工作流的优化迅速走红,搜索量登顶并引发开发者关注 [1] - 该模型被定位为尖端基础模型,在编码、代理工作流、推理及角色扮演领域表现突出,支持通过Claude Code等工具调用,可完成耗时数小时的复杂项目开发 [1] - 社区实测显示,Pony Alpha配合Claude Code运行MineCraft项目,在2小时内生成了170KB的高质量JavaScript代码,输出结果超出预期 [1] - 在SVG生成等细节任务中,该模型的表现达到了“Claude Opus 4.5级品味”的水平 [1] 模型背景与来源推测 - 业内推测“Pony Alpha”可能为DeepSeek-V4、智谱GLM新模型(如GLM-5)、Grok4.2或Claude5 [1] - 由于“Pony”(小马)与马年存在关联,且OpenRouter合作方Kilo Code暗示其为“某全球实验室热门开源模型的专项进化版”,市场更倾向认为其出自中国企业,或为智谱或深度求索(DeepSeek)的新产品 [1] 对相关公司股价的直接影响 - 受“Pony Alpha”模型上线及市场对其来源猜测的影响,2月9日午后,智谱公司股价出现大幅拉升 [2] - 智谱公司股价在盘中涨幅一度超过40%,最终收盘上涨36%,报收于276.8港元 [2]
字节跳动CEO梁汝波:豆包距离全球最头部同行还有差距
第一财经· 2026-01-29 20:54
公司战略与目标 - 公司将2026年的年度关键词设定为“勇攀高峰” [1] - “高峰”在短期内具体指代豆包/Dola助手应用 [1] 业务与产品表现 - 公司基础模型的综合实力处于中国第一梯队 [1] - 公司图像和视频生成模型的综合能力处于国际第一梯队 [1] - 豆包用户规模和增长均较快 [1] - 豆包与全球最头部的同行相比仍存在差距 [1]
那个用半成品刷爆SOTA的Qwen3超大杯推理版,现在正式上线
量子位· 2026-01-26 23:30
阿里千问发布Qwen3-Max-Thinking模型 - 阿里千问正式发布Qwen3-Max-Thinking模型,在涵盖科学知识、数学推理、代码编程的19项权威基准测试中,赶上甚至超越了GPT-5.2-Thinking、Claude-Opus-4.5和Gemini 3 Pro等顶级闭源模型 [1] - 该模型的总参数超过1万亿(1T),预训练数据量高达36万亿(36T)Tokens,并进行了大规模强化学习后训练 [3] - 模型通过引入“自适应工具调用”和“测试时扩展”两项技术创新,显著提升了推理性能和调用工具的原生Agent能力 [3][13] 模型性能与基准测试结果 - 在知识能力方面,于C-Eval基准测试中得分为93.7,超越GPT-5.2-Thinking的90.5和Claude-Opus-4.5的92.2 [2] - 在推理能力方面,于IMO难度级别的数学能力测试基准IMO-AnswerBench上取得91.5分,为全场最高分 [32] - 在启用工具的“人类最后的测试”HLE中得分为58.3,超过GPT-5.2-Thinking的45.5以及Gemini 3 Pro的45.8,刷新SOTA [31] - 在指令遵循与对齐方面,于Arena-Hard v2基准测试中得分为90.2,显著高于其他对比模型 [2] - 该模型的“早期预览版”曾在AIME 25和HMMT 25(哈佛-MIT数学竞赛)中达到100%的准确率 [2] 核心技术创新细节 - **自适应工具调用**:模型能在对话中自主选择并调用其内置的搜索、记忆和代码解释器功能,无需用户手动选择 [22] - 该能力允许模型自主上网收集资料,并调用代码解释器进行数据分析和绘图,以完成复杂任务 [15] - 搜索和记忆工具能有效缓解幻觉,提供实时信息访问,代码解释器允许执行代码片段以解决复杂问题 [25] - **测试时扩展技术**:一种在推理阶段分配额外计算资源以提升模型性能的技术 [27] - 阿里团队采用“经验积累式、多轮迭代的测试时扩展策略”,限制并行推理路径数量,将节省的计算资源用于由“经验提取”机制引导的迭代式自我反思,专注于未解决的不确定性,提升了推理效率和上下文利用效率 [28][29][30] - 实验证明,在大致相同的token消耗下,该方法优于标准的并行采样与聚合方法 [31] 实际应用能力展示 - **复杂代码生成**:能够根据复杂提示词创建基于浏览器、结合摄像头手部追踪的气球射击游戏,并实现细节要求如状态提示和高亮提醒 [7][8][12] - **金融研究与分析**:能够根据用户指令(如分析内存涨价对股票的影响),自主完成资料收集、数据分析和报告生成,在一分钟内产出包含原因、产业分析和走势判断的完整报告 [14][16] - **多工具协同**:能够理解复杂指令(如搜索《醉翁亭记》全文并用代码解释器替换文字),并自主调用搜索引擎和代码解释器完成任务 [23][24] 中国开源AI模型影响力 - 根据MIT-Hugging Face数据,在全球220亿次模型下载行为中,中国开源AI模型的采用份额已跃升至17.1%,超过了美国的15.8% [36] - 在过去一年内新发布的模型中,中国模型的下载量稳居第一 [37] - 阿里千问系列衍生模型数量突破20万个,成为全球首个达成此目标的开源大模型 [39] - 千问系列模型下载量突破10亿次,平均每天被下载110万次,完全超越Llama,成为全球AI开源界的新标杆 [39] - 从迭代频率、下载量和社区影响力来看,千问系列拔得头筹 [40] 模型生态与商业化结合 - Qwen3-Max-Thinking模型已在千问APP的PC端、网页端免费上线,同时开放了API(qwen3-max-2026-01-23) [4] - 千问APP已全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里生态业务 [43] - 行业趋势显示,模型厂商的新着力点是将顶尖模型能力与应用生态体系做更深入的结合 [42] - 预计2026年基础模型将持续增强,并更深入地与垂直领域及实际生活结合,展现更多应用可能 [44]
50亿,AI大消息!
中国基金报· 2026-01-26 11:50
融资与公司动态 - 上海AI大模型独角兽阶跃星辰于1月26日完成B+轮融资,融资金额为50亿元人民币,刷新了过去12个月大模型赛道的单笔融资纪录 [2] - 公司宣布印奇正式出任董事长,负责整体战略节奏与技术方向制定,他将与CEO姜大昕、首席科学家张祥雨、CTO朱亦博组成核心管理团队 [3] - 印奇同时担任千里科技董事长,阶跃星辰将与千里科技深化合作,共同推进“AI+终端”战略落地 [3] 公司战略与愿景 - 公司的首要使命是成为中国基础模型领域最优秀的公司之一,做好基础模型并探索智能上限 [4] - 公司自成立之初即选择清晰的商业模式,专注于大模型与终端的结合,无论是To B还是To C业务均围绕终端这一核心应用场景展开,旨在成为商业闭环的公司 [4] - 公司进入下一阶段后,董事长印奇首要关注研发和终端,并强调人才密度是支撑AGI(通用人工智能)愿景与商业化落地的根本 [4]
阿里Qwen技术负责人林俊旸:模型即产品,做模型就是在做产品
新浪财经· 2026-01-11 10:40
行业核心理念 - 基础模型即产品 研究人员需像产品经理一样将研究成果转化为真实世界可用的系统 [1][3][5] - 伴随主动学习发展 Agent将具备长时间托管式工作能力 在执行通用任务中自行进化并决定行动路径 [3][5] - Agent的潜力取决于其与环境的深度交互 持续理解用户与环境至关重要 [3][5] Agent技术发展方向 - Agent可走向虚拟世界和物理世界 由此产生具身推理概念 [3][5] - 目前交互主要停留在电脑数字环境 未来进入真实物理世界指挥机器人进行现实交互与操作是关键发展方向 [3][5] - 进入物理世界是实现承担长周期、高价值任务的前提 [3][5] 市场机会判断 - 对于通用Agent而言 长尾应用是更值得关注的事情 也是AI更大的魅力所在 [3][5] - 与马太效应相反 头部应用反而相对容易解决 长尾领域可能蕴含更大机会 [3][5]
腾讯 AI Lab副主任俞栋离职,混元团队“新老交替”进行中|智能涌现独家
36氪· 2025-12-29 14:02
核心人事变动 - 原腾讯AI Lab副主任、杰出科学家俞栋因个人发展原因将从腾讯离职 俞栋是腾讯AI大模型最早期的人才储备 于2017年加入公司[1] - 俞栋是语音处理及深度学习领域的专家 曾任IEEE语音语言技术委员会主席 发表文章300多篇 获得专利100多项 他是首次将深度学习技术成功应用在语音识别领域的研究领头人之一[3] - 在腾讯期间 俞栋担任AI Lab副主任和腾讯优图实验室首席科学家 主要负责语音处理、自然语言处理和数字人相关技术的研发 并推动了这些技术在腾讯业务中的应用[1][3] 离职高管的历史贡献 - 俞栋在腾讯大模型“混元”的研发中负责多模态生成和理解以及部分文本研究工作[3] - 他带领研究团队在多个顶级学术会议及期刊发表数百篇论文[3] - 在加入腾讯前 俞栋在微软从事研发近20年[1] 公司战略与组织调整 - 行业共识认为基础模型是核心竞争力 基模能力决定了AI应用的体验上限[4] - 腾讯内部正在进行一系列调整以聚焦大模型研发 一方面引入新血加大人才投入 2025年下半年前OpenAI研究院姚顺雨加入腾讯 出任“CEO/总裁办公室”首席AI科学家 混元也快速吸引了字节、阿里、月之暗面等企业的数位核心员工[4] - 另一方面 腾讯对内部大模型研发资源进行了整合 此前模型研发团队和资源分散在各个不同的事业群 造成研发力量不聚焦和资源浪费 混元的研发横跨大语言模型部、AI Lab、机器学习平台等部门[5] - 为整合模型研发资源并明确分工 腾讯在技术工程事业群新成立了AI Infra部、AI Data部、数据计算平台部[5] - 公司管理层认为市场仍处于没有绝对领先者的激烈竞争阶段 调整后的模型答卷对公司至关重要[5]
A16z 4100万美元领投Mirelo,重磅押注欧洲音频大模型
深思SenseAI· 2025-12-27 09:11
公司概况与融资 - 欧洲音频AI公司Mirelo AI近期完成4100万美元种子轮融资,由Andreessen Horowitz (a16z) 和 Index Ventures共同领投 [1][2][3] - 公司团队规模精干,目前仅有约10人 [1][17] - 公司由拥有约10年AI研究经验且兼具深厚音乐背景的联合创始人创立,结合了AI技术与音乐专长 [3][10] 业务与产品 - 公司核心业务是为视频内容和游戏生成全套音频,包括音乐和音效,主打“视频到音频”的自动生成与同步 [1][3][6] - 已开发两个核心模型:音乐模型和“视频到音效”模型,其中“视频到音效”模型在评测中表现领先,为同类最强 [1][6][12] - 产品形态分为面向创作者的B2C产品Mirelo Studio和面向平台/企业的B2B API [2][6][14] - 当前主要用户是AI视频创作者,用于为AI生成的视频添加音效和配乐,长期目标是服务更广泛的视频内容创作者及专业人士 [6][14] 技术策略与优势 - 公司选择自主研发音频基础模型,而非依赖现成的多模态技术栈,因两年前该领域几乎空白,专注音频有机会建立真正的模型优势 [7] - 音频模型相比大语言模型更为轻量高效,其参数量通常在10亿到100亿之间,算力需求比典型大语言模型少50倍 [8][9] - 竞争逻辑不同于大语言模型,音频模型的性能并不随规模爆炸式增长,因此竞争核心是模型研发能力而非资本规模,这为创业公司提供了对抗大实验室的机会 [13] - 创始人的音乐背景在模型构建中至关重要,影响了音乐的表征方式和架构设计,这构成了训练模型时的核心知识产权之一 [10] 市场认知与商业化路径 - 公司认为音频至关重要,引用乔治·卢卡斯的观点,强调声音至少占电影体验的50%,决定视频的氛围和情绪 [15][16] - 商业化采取双路径:通过Mirelo Studio服务消费者和创作者,同时通过API将模型能力提供给AI视频生成等平台 [14][15] - 目前增长势能最大的点是音效生成,因为需求明确且差异化显著,但未来音乐和音效将同步发展 [17] - 公司面临的市场挑战是需要教育市场,改变音频被视为“事后补丁”的现状,让创作者和平台更早、更重视地集成高质量音频 [20][21] 发展计划与愿景 - 获得融资后,公司计划扩大团队,重点招聘研究科学家、产品人员以及市场与销售人员,以支持技术和业务扩张 [19] - 产品路线图包括增强编辑能力、提升音质,目标是覆盖从AI爱好者到专业工作室的更广泛人群 [15][18] - 未来18-24个月的成功标准是推动市场广泛认识到音频对视频成功的重要性,并理解其经济价值,从而创造对高质量音频服务的更大需求 [20][21] - 公司坚持将核心技术团队放在欧洲,认为欧洲拥有优秀的科学家且竞争环境更有利,资本是欧洲过去的主要短板,而此次融资解决了该问题 [11][23]