AI Coding
搜索文档
中金:予智谱 跑赢行业评级 目标价688港元
智通财经· 2026-02-16 11:58
核心评级与估值 - 中金首次覆盖智谱,给予“跑赢行业”评级,目标价688.00港元 [1] - 目标价基于远期P/S估值法,对应2028年40倍P/S,采用7%的折现率 [1] - 公司当前股价交易在2028年25倍P/S,较目标价有42%的上行空间 [1] 公司技术与模型能力 - 公司成立于2019年,专注GLM系列基座模型研发 [2] - 最新一代基座模型GLM-5在HLE、SWE等多个基准评分中达到SOTA(当前最优)水准 [2] - 模型核心能力包括Coding、推理、Agentic(智能体)等 [2] 商业模式与增长前景 - 公司通过MaaS(模型即服务)平台输出模型能力 [3] - 预计2023-2027年收入复合年增长率(CAGR)达130%以上 [3] - API收入是主要增长引擎,预计至2026年初API相关年度经常性收入(ARR)已接近6亿元,较去年同期有数十倍增长 [3] - 公司业务覆盖互联网、软件、芯片等众多行业,赋能客户提升生产力 [3] AI Coding市场机遇与公司优势 - AI Coding是AI落地最快场景,仍处于渗透早期,中金估算其总潜在市场规模(TAM)将达到万亿元规模 [4] - 公司在Coding场景具备低幻觉率、高稳定性、强大推理及工具使用能力等核心优势 [4] - 公司有望在Coding场景持续领跑,并向更多企业场景延伸,覆盖更多海内外客群 [4] 财务预测与催化剂 - 预计公司2025-2028年收入分别为7.2亿元、17.5亿元、36.7亿元、76.7亿元,期间CAGR为120% [4] - 潜在催化剂包括新一代模型发布,以及API和Coding相关ARR的高速增长 [5]
从 Clawdbot 到 26 年 AI Coding 主题大爆发|42章经
42章经· 2026-02-13 21:04
AI Coding与Agent能力跃迁 - AI Coding能力已跨越奇点,人类介入比例从过去的10%降至约0.1%,系统可自主运转[5][8] - 对AI Coding能力评分:25年初不及格,后提升至60分(小局部工作),再到80分(大模块架构与组织),目标90分(复杂项目设计与审查)[9][10][11] - 在10万行代码以内的项目中,AI的表现优于高级工程师团队,且速度更快[12] - 个人重度使用案例显示,每日消耗近十亿级别Token,产出数万行代码,相当于数十人月工作量[12] - 部分公司内部代码已100%由AI编写,未来软件开发可能呈现两极分化:100%人类手写或100%AI生成[13][14][16] 关键产品与技术演进 - **Claude Code**:定义了本轮Agent的形态基础,标志着大模型能够操控现实世界,从编程切入因其可控性,未来通用Agent形态很可能就是编程Agent[16] - **长上下文信息召回率**:关键指标从GPT-5.1的约30%提升至GPT-5.2的近90%,这对Agent在多轮复杂任务中的准确性至关重要[17] - **Agent的Context Engineering**:在System Prompt和Tool Use编排上的最佳实践由Claude Code引领并快速传播[17] - **Cowork**:本质是Claude Code的插件,封装了Computer Use能力,底层逻辑无重大突破[18][19][20] - **Skills**:优于MCP的封装方案,因其组合性更强(自然语言可叠加)、更易上手(可直接让Coding Agent现场编写)[25][26][27][29][30] - **Clawdbot**:运行在本地电脑的全能助手,能以自然语言交互,控制鼠标键盘完成几乎所有操作,底层是类似Claude Code的编程Agent[31][32][33][34] - Clawdbot被猜想为未来操作系统的雏形:内核是聪明的编程Agent,上层是Skills,最外层是交互界面[34] - Clawdbot设计包含记忆系统,可长期积累和成长,并能通过编程自我补强能力,实现一定程度的自我演化[41][42][46][47] - **moltbook**:一个AI社区,Clawdbot等AI可接入并互相交流技巧、改进工作流,展现了多智能体协作与能力涌现的潜力[47] 市场影响与未来趋势 - AI Coding能力的成熟使得直接套用AI Coding和Agent的壳成为新趋势,而非简单套用大模型[34] - 技术平权仍处早期,Clawdbot等高门槛产品的意义在于展现新的可能性,预计未来将有更多团队推出易用产品,让更多人体验[48] - 2026年AI应用层预计将迎来大爆发,AI Coding带来的体验升级将快速扩展到设计等其他领域[49][61] - 全球算力出现短缺,叙事重回堆算力,因AI Coding、多模态应用等对Token的消耗远高于早期Chatbot[59][60][62] - 未来创业方向可能集中于两个极端:追求极致“人味”(解决AI无法替代的人际连接与长尾需求)和追求极致效率(用AI将效率提升数个数量级)[52][53][54][55] - 介于“极致人味”与“极致AI”之间的业务将越来越难做[56] 组织形态与人才需求演变 - 未来组织可能由独立模块构成,每个模块由一位高级工程师负责,带领一群Agents工作,核心能力是判断与决策[67] - 模块与Agents之间协作需求降低,因单元效率极高,协作易引入问题,清晰的边界和共同目标变得更为重要[67][74][75] - 对工程师的建议是思考如何成为更有趣的人,因为编程将日益工具化,想法和创造力变得更为重要[64][65] - 编程可能分化为不同赛道:用AI满足刚需、满足竞技/艺术/审美需求、以及创造本身带来成就感的Builders[66][67] 基础设施与概念创新 - **Box概念**:作为Skills的延展或组合基础设施,将技能与完整的执行环境绑定,隔离副作用,使原子能力可被稳定、重复调用和组合[68][70][71][72] - Box的实践案例包括封装登录、下单等固定流程,为Agent提供稳定的执行空间[71] - AI当前的主要瓶颈从技术能力转向经济学问题,即算力成本与使用ROI的权衡[50][51] - AI已能覆盖所有在电脑上完成的任务,但物理世界任务(如取外卖)仍是局限[49]
小马模型揭秘,智谱开源GLM-5,市值飙上1700亿
搜狐财经· 2026-02-12 23:43
公司动态与产品发布 - 智谱公司于2月12日正式上线并开源其新一代大模型GLM-5 [2] - 此前在全球模型平台OpenRouter上线的匿名免费大模型“Pony Alpha”被证实即为GLM-5 [2] - GLM-5的参数规模从上一代的355B(激活32B)大幅扩展至744B(激活40B) [3] - 该模型在Artificial Analysis榜单中位列全球第四,并在开源模型中排名第一 [3] - GLM-5已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等国产算力平台的深度推理适配,通过优化实现了在国产芯片上的高性能稳定运行 [3] 产品性能与市场反响 - Pony Alpha(即GLM-5)主打编程、逻辑推理和智能体工作流优化,具有高工具调用准确率和200K的上下文窗口 [2] - 该模型在多项任务中展现出与顶级模型竞争的实力,例如为开发者构建了包含超过35个电台、超过500行代码的完整广播应用程序,以及制作了高还原度的3D游戏 [2] - 模型上线第一天请求量就高达20多万次,在开发者社区中迅速火爆 [2] - 模型采用完全免费的策略,支持网页对话与API调用 [2] 行业竞争格局 - 全球AI Coding(AI编程)赛道竞争加剧,Anthropic于2月5日发布编码技能大幅提升的Claude Opus 4.6,OpenAI几乎同步紧急发布了GPT-5.3-Codex [3] - Pony Alpha的上线被视为国产模型在AI Coding赛道上对海外市场的一次重要“突袭”和跟进 [3] - 国内大厂正同时进行AI入口之争 [3] 资本市场表现 - 智谱公司因Pony Alpha的发布迎来股价显著上涨,2月9日股价收涨达36.22% [4] - 2月12日GLM-5正式上线后,公司股价开盘再次大涨,午间休盘时涨幅已超24% [4] - 公司市值突破1700亿港元,是其上市首日市值的3倍多 [4]
“大模型第一股”加入“春节AI战”,交出最强旗舰模型GLM-5,从写代码转向写工程
36氪· 2026-02-12 09:46
行业趋势:AI Coding能力向系统级与长程Agent任务迁移 - AI Coding正发生深层次能力迁移,开发者角色从“写代码”转向“编排AI Agent”[1] - 顶尖闭源模型如Claude Opus 4.6与GPT-5.2的表现,推动市场对大模型的“系统级能力”重新定价[1] - 开源领域,月之暗面发布的Kimi K2.5是主打超长上下文与多智能体协作的原生多模态模型,能调度上百子智能体完成跨领域复杂任务[1] 公司技术演进路径 - 公司技术路线清晰:从GLM-4开启“All Tools”时代,到GLM-4.5确立ARC原生融合架构,再到GLM-4.7扩展编程与逻辑边界,最新GLM-5是向“长程长时执行者”的跨越[2] GLM-5模型核心规格与架构 - 模型参数量从GLM-4.7的355B扩展至744B,预训练数据从23T token增加至28.5T token[4] - 采用名为“Slime”的强化学习框架,支持异步智能体强化学习,旨在让模型从长程交互中持续学习,以在处理数十步工程任务时保持策略一致性[4] - 集成DeepSeek的稀疏注意力机制,通过只对高相关性token执行完整注意力计算,在保持长文本处理能力的同时降低计算成本[4] - 该机制带来两大收益:维持长文本处理效果无损,同时大幅降低部署成本并显著提升Token Efficiency[5] GLM-5模型性能表现 - 在编程能力上对齐Claude Opus 4.5,在SWE-bench-Verified和Terminal Bench 2.0中分别获得77.8和56.2的开源模型最高分数,超过Gemini 3 Pro[6] - 在公司内部Claude Code评估集合中,其在前端、后端、长程任务等编程开发任务上显著超越GLM-4.7,平均增幅超过20%[8] - 在Agent能力上实现开源SOTA,在BrowseComp、MCP-Atlas和τ²-Bench等多个评测基准中取得开源第一表现[11] - 在Vending Bench 2测试中,模型模拟经营自动售货机公司一年,最终账户余额达到4432美元,经营表现接近Claude Opus 4.5[13] 实际应用案例评估 - **Case 1: 一键克隆Web UI**:整体完成度较高,可达80分,修改后基本可用,但在UI布局、字体气质、行高节奏、留白比例等细节上与原版存在差距,未达到高度统一的一比一复刻[17][20] - **Case 2: 创建macOS Sonoma风格桌面模拟器**:整体完成度较高,达到可交互的高质量演示级Demo水平,视觉结构清晰,但在字体精细度、间距统一性、动画流畅度、Dock物理感等细节层面仍有提升空间[21][22] - **Case 3: 多智能体世界Pookie World**:基于GLM-5构建,通过生物-心理框架为智能体注入叙事动机,能自发产生社交、冲突与协作,形成“非玩家依赖”的社会涌现,并具备角色防崩坏机制以保持人格一致性[23] - **Case 4: 沉浸式论文探索工具**:基于GLM-5开发,能将论文转化为视觉化动态卡片,支持自动抓取Hugging Face每日TOP10热门论文,该App已提交App Store申请,模型参与了从理解论文到产品构建的全过程[24] - **Case 5: 简单常识题**:针对“离家50米洗车建议开车还是步行”问题,早期匿名测试版Pony Alpha答错,而正式版GLM-5能够答对,后者克服了模型过度关注表面数值逻辑而忽视物理常识的倾向[25][29] 模型定位与市场价值 - GLM-5定位为面向复杂系统工程与长程Agent任务的基座模型,旨在为懂行的顶尖程序员提供对标顶尖闭源模型的可靠生产力[1] - 实测表明,该模型能帮助专业开发人员提效,但在无使用情景指导的简单提示下,对非专业人员效果差强人意,更适合专业程序员基于真实场景实现复杂、长时、系统级任务[30] - 模型在专业与非专业人员间表现差异明显,标志着大模型正从“玩具”走向真正的生产力工具[30] - 尽管号称能达到Claude Opus 4.6的体感,但在部分案例测试中最终呈现效果仍有肉眼可见的差距[31] - 相比价格昂贵的Claude Opus 4.6,开源的GLM-5展现出显著的性价比优势,在行家手中能发掘出不错的效果[31] - 开放与性价比的结合,构成了其独特的市场竞争力[33]
当人读不懂 AI 代码,Traversal 如何做企业运维的 AI 医生?
海外独角兽· 2026-02-11 20:06
行业痛点与市场机遇 - AI Coding的普及加剧了软件运维的复杂性,Claude Code贡献的代码已占公开GitHub提交的4%,预计到2026年底其日提交量可能占比超过20% [2][14] - 传统可观测性工具(如Datadog)仅能展示指标波动,无法解释根本原因并指导修复,工程师仍需高成本人工排障 [2][4] - 全球广义运维市场的总潜在市场规模超过1100亿美元,其中可观测性市场预计在2026年达到620亿美元,DevSecOps赛道预计在2030年扩张至416.6亿美元 [7][8] - 仅考虑美国市场,通过自动化工具释放人力资源潜在价值的TAM约达965亿美元,该测算基于约290万相关职业人员、13.31万美元平均年薪及25%的效率缺口 [8][9] - 系统停机每年给企业造成约4000亿美元损失,重大事故期间每小时损失可达190万美元 [10][22] Traversal公司核心定位 - 公司定位为AI原生SRE Agent,旨在从“看到现象”直接跨越到“执行修复”,构建自主决策型智能运维大脑 [4][20] - 其设计初衷是以单一平台遍历PB级的MELT数据,串联跨团队、跨工具的信息,将过去需要50多人参与的应急响应缩减至10-15名工程师 [23] - 公司不寻求替换现有工具,而是作为架在Datadog、Splunk等现有平台之上的智能覆盖层,通过只读API连接数据孤岛 [24][70] - 其应用场景可扩展至基础设施成本优化、DevOps流水线预测及安全响应等高价值领域 [31][32] 技术架构与核心能力 - 技术护城河建立在因果推理与仿真模拟的深度结合上,核心结合了因果机器学习、推理模型和Agent并行三大技术 [32][33] - 通过构建基于因果图的底层架构和实时服务依赖图谱,能够精准追踪故障传播路径,而非仅做相关性猜测 [35] - 引入数字孪生技术,在采取实际行动前进行多路径的“主动试错”仿真模拟,以验证修复方案的有效性 [45][46] - 采用严格的影子测试或金丝雀发布等安全执行机制,以建立对AI自动执行高风险操作的信任 [47] - 在事故发生时,通过并行调度上千个专家型Agent筛查数据,结合RAG、向量搜索等技术,可在几分钟内完成根因分析并给出修复建议 [25][29][30] 商业验证与客户成效 - 在American Express、Digital Ocean等财富100强客户的数百起高危事故中,实现了超过90%的归因准确率 [4][50] - 已获得由红杉和凯鹏华盈领投的4800万美元融资 [5][24] - 客户案例显示,平均修复时间降低了90%,从3.75小时缩短至10-15分钟;SRE团队整体生产力提升了70%-75% [51] - 在Wayfair的实践中,成功预测并处理了黑色星期五期间的Redis过载问题,避免了无效修复风险 [46][53] - 采用混合式、以结果为核心的定价模式,基础费用覆盖系统规模,可变费用按成功修复的事故数量等可验证成果计费 [48] 市场竞争格局 - 主要面临两类竞争对手:传统可观测性巨头(如Datadog)和其他AI SRE工具(如Resolve、Flip) [63][76] - 相较于Datadog等传统巨头,公司的优势在于跨平台关联分析和深度根因定位,而非局限于单一平台的数据存储与可视化 [64][72] - 相较于最直接竞争对手Resolve,公司的优势在于自动化修复能力和数字孪生仿真验证,但面临更严格的数据安全合规挑战 [77] - 相较于Flip,公司在因果推断和技术壁垒上占优,但在自然语言交互和辅助人类决策的体验上存在短板 [79] - 相较于Deductive,公司强调因果逻辑与平台完整性,但在专项日志挖掘和海量日志异常检测方面存在不足 [80]
被马斯克点赞,陈炜鹏希望做「可以玩的抖音」
36氪· 2026-02-11 17:54
公司及产品概况 - 公司“涌跃智能”由前搜狗及百川智能技术负责人陈炜鹏于2025年6月创立,产品方向为AI内容社区 [4] - 旗下产品Loopit于2026年2月10日正式上线,是一款平台型AI社区应用,形态新颖,被形容为“内容‘活过来’的抖音” [3][5][8] - 产品上线前30天内,公司完成了两轮融资,最新估值较1个月前提升了6倍 [4] - 产品上线后,一名海外用户的使用视频得到埃隆·马斯克评论转发,引发关注 [5] 产品核心定位与特点 - 核心定位是“下一代内容”,强调“不是观看,而是参与”,旨在打造一个用户可以与内容互动的平台 [2][66][67] - 产品形态为单列Feed流,内容为全模态可交互H5,用户可通过点击、划动、自拍、语音、摇一摇等方式与内容互动 [3][10][68] - 创作门槛极低,用户用文字输入大致想法,AI会主动提供点子并生成包含图像、语音、视频、3D等元素的可交互内容 [10][11] - 产品设计刻意追求符合用户直觉的交互,以降低交互门槛,互动内容占据屏幕的80% [69][71] - 创始人认为互动内容提供的“爽感密度”未来一定会大于视频 [73] 核心技术路径与研发历程 - 核心技术路径是结合AI的Coding能力与多模态能力,构建“互动内容引擎” [16][17][50][53] - 多模态被视作最贴近C端应用的技术能力,能拓宽交互边界;Coding能力则更贴近底层架构,AI降低了普通人的Coding门槛 [16][54] - 该技术路径鲜有人尝试,团队用了整整7个月才做出能落地的架构,期间产品形态多次被推翻 [15][18][19][61] - 直到2025年12月(即产品上线前约2个月),团队才找到结合Coding和多模态能力的可行路径 [63] 创始人的创业理念与决策 - 创始人坚信AI时代应做“通用产品”,而非垂直领域产品,认为“通用才是AI时代最大的确定性” [27][28][29] - AI应用公司的核心是追求“组合能力”,即将AI背后的代码、模型、语言、视频、图像、推理等能力组合起来,带来用户体验的“涌现” [29] - 创业初期放弃了更确定、易变现的“工具型”产品路线,选择了更复杂但天花板更高的“社区平台”路线,旨在创造新的内容形态 [19][113][114] - 创始人的产品方法论深受在Soul任职经历影响,即不关注竞争对手,只关注如何为用户创造价值并开拓新体验 [15][25][97] 市场认知、竞争与商业模式 - 产品初期被部分人定义为“AI游戏”,但创始人希望用户自行探索边界,不给予狭窄定义 [13][77] - 创始人认为,多数AI应用是工具,不具备网络效应,而Loopit创造的是互联网时代全新的互动内容形态,能够产生网络效应 [90][91][92] - 对于未来竞争,创始人认为竞争是“伪命题”,关键在于能否持续创造价值、拓宽行业对AI应用的想象力 [15][96][97] - 商业模式方面,认为过早讨论社区产品的商业化“不专业”,需待用户规模扩大后再探索,并指出互动天然能获得更多注意力,互动广告与内容的边界更模糊 [99][100][101][102] 团队构建与融资情况 - 团队组建追求跨模态能力互补,创始人偏语言模型背景,联合创始人偏文生视频方向 [123][124] - 强调AI时代团队需具备“技术想象力”,需将技术与产品放在一起思考才能做出创新产品 [126] - 早期融资(产品0-1阶段)主要基于投资人对团队判断力和执行力的信任 [115][116] - 产品上线后,市场疑虑打消,公司在过去30天内快速完成了两轮融资 [4][122]
Anthropic最新2026趋势报告:人类最大一次编程革命势不可挡
36氪· 2026-02-10 20:58
核心观点 - Anthropic发布的《2026年智能体编码趋势报告》核心结论是:编程的游戏规则彻底改变,软件开发正在经历自图形界面发明以来最大的范式转移,其结果是“任何人都能成为开发者”,而不仅仅是程序员效率提升 [2][3][4][9] 软件开发生命周期剧变 - AI编码智能体在2025年已成为生产系统,2026年的变化远超工具升级范畴,涉及三个核心预测 [14][15] - 抽象层再次升级,最新抽象层是人与AI的自然语言对话,AI负责代码的“战术工作”,工程师聚焦于架构和战略决策 [15] - 工程师角色大转型,从写代码变为“编排智能体写代码”,负责评估输出、提供战略方向和确保解决正确问题 [16] - 新人入职周期大幅坍缩,从传统需要数周或数月缩短至几个小时,报告案例显示,一个原本估计需4到8个月的项目,使用Claude后仅用两周完成 [17] - 开发者在大约60%的工作中使用AI,但能“完全委托”给AI的任务比例仅为0-20%,这揭示了“协作悖论”:AI参与度高但完全自治度低,有效协作需要人类主动参与和监督 [18] 智能体能力进化:从单智能体到军团与长时运行 - 能力从单智能体工作流进化到多智能体协调团队,以处理单智能体无法应对的复杂任务 [19][21] - 多智能体架构由一个“编排者”协调多个拥有专属上下文的“专家智能体”并行工作,案例显示,Fountain平台使用Claude实现多智能体编排后,筛选速度快50%,入职速度快40%,候选人转化率翻倍,一家物流客户将全面招聘周期从一周以上压缩至72小时以内 [24][25] - 智能体运行时间实现突破,从早期的分钟级任务扩展到2026年能连续工作数天甚至数周,构建完整应用和系统 [26][28][29] - 案例显示,乐天工程师用Claude Code在拥有1250万行代码的vLLM开源库中实现特定方法,经过7小时自主工作,数值精度达到参考方法的99.9% [30] 人类角色与协作模式的演变 - 人类在开发流程中的角色并非被移除,而是注意力被重新分配,从“审查一切”转向“审查关键点” [31][32] - 未来软件工程师的角色是编排者、架构师和决策者,他们指挥AI军团,并保持人类独有的判断力和“品味” [7] - AI协作的有效性高度依赖人类经验,报告引用工程师观点称,经验越丰富,AI的加成作用越大 [32] 智能体编码应用范围扩展 - 智能体编码将突破专业程序员圈子,扩展到新领域和新用户群体 [33] - 语言壁垒消失,AI能处理COBOL、Fortran等遗留系统语言 [34] - 编码能力民主化超越工程师群体,网络安全、运维、设计、数据科学等领域的“非传统开发者”也能使用 [34] - 报告发现一致模式:人们用AI增强核心专长并拓展到相邻领域,安全团队用AI分析代码,研究团队用AI构建前端可视化,非技术员工用AI调试或分析数据,“会写代码”与“不会写代码”的壁垒正在模糊 [35] - 案例显示,Legora的CEO指出律师可在无工程背景情况下用Claude创建复杂的自动化流程 [36] 生产力与组织经济学影响 - 智能体能力、编排改进和更好利用人类经验三者复合叠加,带来阶梯式生产力跃升,而非线性增长 [40] - 项目时间线被大幅压缩,以前需数周的开发现在几天可完成,使许多曾被搁置的项目变得可行 [40] - 软件开发总体拥有成本下降,投资回报率因更快实现价值而改善 [40] - 生产力提升主要体现在“干了更多的活”,而非“同样的活干更快”,包括更多功能上线、更多Bug修复和更多实验执行 [40] - 约27%的AI辅助工作是“如果没有AI就根本不会去做”的任务,包括规模化项目、构建交互式仪表盘等探索性工作,工程师也修复了更多因AI而变得可行的“小纸割”类问题 [40] 非技术部门的应用扩展 - 2026年最重要的趋势之一是智能体编码在销售、市场、法务、运营等业务职能团队中的稳步增长 [41] - 非技术团队能自动化工作流、构建工具,几乎不需要工程支持,实现领域专家直接解决问题 [44] - 案例显示,Anthropic法务团队使用Claude驱动的工作流将营销审核周转时间从2-3天缩短至24小时,一位无编程经验的律师用Claude Code构建了自助服务工具来分类处理问题 [44][46] 对网络安全的影响 - 智能体编码同时改变安全防御和攻击两个方向 [47] - 安全知识被民主化,任何工程师都可借助AI进行安全审查、加固和监控,这以前需要专家级知识 [49] - 威胁行为者也能利用相同能力扩大攻击规模,因此从一开始就将安全嵌入开发流程变得比以往更重要 [49] - 优势将属于有准备的组织,即那些从一开始就用智能体工具将安全嵌入开发的团队 [49] 2026年组织优先事项 - 报告提出组织在2026年必须关注的四大优先领域:掌握多智能体协调、通过AI自动化审查系统扩展人类-智能体监督、将智能体编码扩展到工程之外赋能各部门专家、从最早期将安全架构嵌入智能体系统设计 [50] - 这些事项汇聚的中心主题是:软件开发正从“写代码”转向“编排写代码的智能体”,同时保持人类判断、监督和协作以确保质量 [50]
被马斯克点赞,陈炜鹏希望做“可以玩的抖音”
36氪· 2026-02-10 20:52
公司概况与产品定位 - 公司“涌跃智能”由前搜狗和百川智能技术负责人陈炜鹏于2025年6月创立,产品方向为AI内容社区 [1] - 旗下产品Loopit于2026年2月10日正式上线,是一款平台型AI社区应用,其形态被描述为“内容‘活过来’的抖音”,用户可通过点击、划动、自拍、语音、摇一摇等方式与Feed流中的内容进行互动 [1][3] - 产品上线初期被部分人定义为“AI游戏”,但创始人认为定义不应如此狭窄,希望用户自行探索产品边界 [7] 融资与市场反响 - 公司在过去30天内完成了两轮融资,最新估值较1个月前提升了6倍 [1] - 产品上线后,一名海外用户的使用视频得到埃隆·马斯克的评论转发,引发市场关注 [1][3] 产品核心技术与创新 - 产品核心创新在于将AI的Coding能力与多模态能力结合,打造“互动内容引擎” [10][42] - 技术路径是用Coding驱动多模态的可控生成,这是一条鲜有人尝试的路线,团队用了7个月才做出能落地的架构 [10][12] - 创作门槛被AI大幅降低,用户仅需文字输入想法,产品可主动提供点子并生成支持图像、语音、视频、3D等全模态的可交互H5内容 [5] - 多模态被视为最贴近C端应用的能力,能拓宽交互边界;而Coding能力则被视为底层架构,AI降低了普通人的Coding门槛 [10][39] 产品开发历程与战略选择 - 产品上线前经历了7个多月的漫长探索,团队几乎每隔一两周就要推翻产品demo [9] - 团队曾考虑做工具型产品,但最终选择做更复杂、更艰难的社交平台,因为判断AI工具缺乏想象力和网络效应 [12] - 产品形态经历了从互动PPT、视频剪辑工具到互动短剧,最终确定为“短交互的产品和社区”Loopit的演变过程 [43][44][45] 创始人与团队背景 - 创始人陈炜鹏是前搜狗搜索研发总经理(9年晋升超10级)、百川智能联创及大模型负责人,拥有深厚的NLP技术背景 [7] - 其曾在Soul担任技术VP,负责AIGC技术和内容社区业务,这段经历弥补了其产品管理经验,并深刻影响了其“以用户价值为中心”、“开拓想象力”的产品方法论 [9][15][16] - 团队组建追求跨模态能力互补,创始人偏语言模型,联合创始人施政偏文生视频方向 [99] 产品设计理念与市场洞察 - 产品设计采用单列Feed流,目的是内容优先,让用户第一时间感受到内容可以互动,目前互动内容占据屏幕的80% [52] - 洞察到内容形态的进化趋势是“人和内容的距离越来越近”,即从观看、交流到参与,因此致力于打造可与内容互动的平台 [50][51][52] - 认为互动内容提供的“爽感密度”未来一定会大于视频,产品通过设计符合直觉的交互来降低互动门槛 [55] - 早期用户画像定位为有想法、有创意的年轻人,但认为社区的未来边界应由用户探索决定 [56] 增长策略与生态构建 - 冷启动阶段在海外定向邀请了几百个专业创作者,以创作高质量互动内容来建立初始生态,类似于早期抖音的策略 [64] - 认为当优质内容不断涌现,用户每次刷新都有惊喜时,用户的交互动力问题就会自然解决 [59] 行业观点与竞争哲学 - 认为AI应用公司应追求“组合能力”,即组合AI背后的代码、模型、语言、视频、推理等多种能力,以创造全新的用户体验和惊喜感 [19] - 指出大多数AI应用是工具,不具备网络效应(如剪映难成抖音),而Loopit因其全新的互动内容形态,有望产生网络效应 [67][68][69] - 认为OpenAI o1的发布代表大模型范式变化,未来大模型公司与应用公司的界限会越来越模糊 [32][33] - 竞争哲学是不担心潜在竞争对手,核心在于能否持续创新、拓宽行业想象力并为用户创造价值 [9][73][74] 商业模式与未来展望 - 认为现阶段过早讨论社区产品的商业化“是不专业的”,应待用户规模较大后再围绕用户厘清商业模式 [76][77] - 展望未来,指出互动天然可获得更多注意力,互动广告与内容的边界更模糊,可能带来新的商业模式,但相信会有更好的模式出现 [78][79][80]
中国AI?美国AI?
36氪· 2026-02-08 15:56
中国AI视频模型竞争格局 - 字节跳动发布新一代视频生成模型Seedance 2.0,该模型完全改写了视频生成方法,更侧重于运镜、理解、模仿、转场等效果,极大利好短视频创作者生态[3] - 快手发布新一代视频生成模型Kling 3.0,该模型更偏向于影视化、真实化和工业化的能力,目标用户是专业导演和工作室[3] - 两个模型的综合能力均对标视频大模型的Sota(谷歌Veo模型),但技术路线存在差异[3] - 博主和用户对侧重短视频创作的Seedance 2.0更有感觉,但对Kling 3.0的上限期待很高,认为其在抹平真实与虚拟的界限[4] - 从长期看,技术路线差异是暂时的,最终目标都是解决“抽卡”问题,并全方位替代现有视频生产管线的一半以上[4] 全球AI视频模型发展趋势 - 2026年,视频模型成为AI竞争主战场,除字节和快手外,马斯克发布Grok专有视频模型Imagine 1.0,谷歌发布Genie 3[6] - 视频信息量远超文本和语言,此前视频模型因能力不足、训练难度高、生成质量不稳定而受限,但到2026年该瓶颈期即将被跨越[6] - 多模态AI(尤其是视频)是AI接近普通人的破圈手段,去年ChatGPT和Gemini的两次“翻倍级”增长均得益于多模态能力[4] 中美AI产业发展路径差异 - 美国AI巨头重点发力AI Coding,其终点是工具、软件甚至系统的零成本化,这导致美股SaaS(软件即服务)赛道突然崩盘[7] - SaaS是一个积累了近30年、规模达万亿级的市场,AI对其的替代想象空间巨大[7] - 中国AI公司在产业化方面面临挑战,原因在于难以替代一个不存在的市场、拿走不存在的产值[9] - 但在多模态尤其是视频模型领域,中国拥有全球领先的短视频、直播和创作者生态,存在巨大的市场、产值和故事可供AI承接,因此字节和快手在视频模型上的投入动力不虚美国大厂[9] 主要公司动态与战略 - 快手Kling模型有先发优势,ARR(年度经常性收入)增长很快,在海外处于第一梯队[10] - 字节跳动属于后来居上,其多模态能力对豆包App的留存率拉动明显,且GPU储备量是国内大厂中的顶级水平[10] - 字节跳动内部期待AI业务能跑出“下一个抖音”,并已启动赛马机制,至少有三股势力在竞争[13] - **即梦**:负责人张楠(抖音创始人)被安放在从0到1的最前线,代表字节最强的创业战斗力[13] - **豆包**:所属Flow团队负责人朱骏是Musical.ly创始人,已成功两次,属于最正统的继承位[13] - **抖音部门**:希望由自己孵化“下一个抖音”,例如抖音搜索团队已开发名为“AI抖音”的App[13] - 字节跳动公司活力高、欲望强,在大厂中很少见,看不到老化痕迹[13] 行业影响与未来展望 - 视频模型的成熟将全方位替代现有视频生产管线的一半以上[4] - 中国AI公司在本月还有重量级发布,行业将进入“神仙打架”的阶段[14]
Agent叙事强化,算力与SaaS分化加剧
华泰证券· 2026-02-08 12:20
行业投资评级 - 科技行业评级:增持(维持)[6] - 计算机行业评级:增持(维持)[6] 报告核心观点 - 2026年AI Agent的渗透是下一个Token加速点,行业正从“能力验证”走向“规模化应用”的关键拐点年[2][49] - 海外云厂商资本开支持续上修,AI需求表述乐观,算力侧Agent主线强化[2][50] - AI应用层面,云厂商业绩加速兑现,但SaaS市场预期偏悲观,部分公司有望通过产品价值下沉实现重估[3][57] - AI for Science在生物制药商业化最快,材料领域有望突破,预计2026年将成为重点应用与投资方向[4][89] - Agentic Coding加速迭代,将重构软件行业,软件开发成本面临“杰文斯悖论”[5][91] 根据目录总结 AI模型:Agent能力持续演进 - **DeepSeek-OCR 2提升视觉理解能力**:2026年1月底推出,参数规模约3B,在OmniDocBench v1.5上评分为91.09,较前代提高3.73个百分点,压缩效率方面仅用1120个视觉token实现较低编辑距离误差(0.100 vs Gemini-3 Pro的0.115)[10][18][22] - **Kimi K2.5引入并行Agent架构**:总参数量约1万亿,采用MoE架构,引入“Agent Swarm”并行Agent架构,可将多步任务总耗时减少4.5倍,端到端运行时间降低约80%[24][30] - **腾讯CL-bench揭示模型临时学习短板**:基准测试显示,主流模型在CL-bench上整体成功率偏低,GPT-5.1(High)平均成功率仅为23.7%[32] AI算力:Agent主线强化,CSP Capex持续上修 - **Agent渗透驱动算力消耗指数级增长**:Agent推理范式复杂,算力消耗大,以Claude Code为例,完成一个小项目可能消耗百万级别token,相比Chatbot单次交互消耗提升3个数量级[47] - **海外云厂商资本开支快速增长**:2025年第四季度,海外四大CSP资本开支合计1270亿美元,同比增长63%,环比增长13%,其中Microsoft/Google/Meta/Amazon的资本开支同比分别增长66%/95%/49%/52%[50] - **下一代光互连方案CPO/NPO进入产业化元年**:英伟达Rubin Ultra机架将采用NPO方案,预计2026年上半年开始部署,CPO技术进入规模化商用阶段[52][56] AI应用:云厂商业绩加速兑现,静待SaaS预期修正 - **云厂商业绩持续加速**:2025年第四季度,Microsoft、Google、Amazon云业务收入同比增速分别为39%、48%、24%,下游需求持续高增[59] - **传统SaaS加速产品价值下沉**:例如ServiceNow的AI Control Tower订单量环比增长近3倍,SAP的Business Data Cloud累计合同金额约20亿欧元[63] - **Palantir提供业绩范式参考**:2025年第四季度总营收14.07亿美元,同比增长70%,其中美国商业收入同比增长137%,积压订单(RPO)达42.10亿美元,同比增长43%[66][68] AI4S:生物制药商业化最快,材料领域有望突破 - **AI制药合作深化与爆发**:2026年1月,赛诺菲与Earendil Labs的合作总价值从18.45亿美元提升至25.6亿美元,标志着AI驱动抗体药物研发投入加大[79][80] - **AI新材料研发范式变革**:微软的MatterGen能够根据性能需求从头生成新材料,相比传统筛选方法,在同等计算成本下发现的新材料数量远超数个量级[82][85] - **产业合作进入验证阶段**:2026年1月,晶泰控股与晶科能源子公司合作,共建全球首个“AI决策-机器人执行-数据反馈”全闭环叠层电池智造线[87] 月专题:Agentic Coding加速迭代 - **AI Coding成为企业AI支出热点**:占企业部门级AI支出的55%,正从代码补全向自主执行任务的Agentic Coding范式跃迁[92] - **AI Coding能力快速演进**:预计目前已能构建5000-20,000行代码的中型系统,未来两年可能实现中型系统完全自主生成[92][93] - **中美厂商加速布局**:海外以Claude Code、Cursor、GitHub Copilot等为代表,国内阿里巴巴、字节跳动、百度、腾讯、DeepSeek等厂商均有产品布局[101][102][103] - **对软件行业价值锚点产生冲击**:软件价值将从交互外壳向逻辑内核、从记录系统向执行系统、从封闭系统向开放接口转移,软件开发成本面临“杰文斯悖论”[104]