AGI
搜索文档
马斯克急了,直播回应一切!xAI全新阵容首曝光,华人联创仅剩一人
搜狐财经· 2026-02-12 20:50
公司组织架构重组 - 公司近期完成与SpaceX合并后的内部重组,12位联合创始人中有近一半离职[6] - 重组后公司内部划分为四大核心业务板块:Grok主模型及语音模型、编码、Imagine图像与视频生成、以及Macrohard[11] - 每个产品线团队规模极其精简,平均仅有2-3人[20] 核心团队与业务方向 - **Grok通用与语音模型团队**:由Aman带领,成员包括Tyler和Jake H,目标是将Grok打造为处理法律咨询、制作演示文稿等任务的“万能App”[12] - **编码团队**:由Makro带领,张国栋(Guodong Zhang)参与研发,专注于利用AI进行递归自我改进,并探索AI直接生成二进制文件的可能性[14] - **Imagine图像与视频生成团队**:由张国栋带领,成员包括Haotian和Chaitu,目前每天生成视频数量接近5000万个,支持最长10秒单次生成,目标是在年底前实现单次生成10-20分钟的长视频[17] - **Macrohard团队**:由Toby带领,John M.参与,旨在打造一个能完成复杂工程设计、医疗分析等任务的“数字人类模拟器”[18][19] 技术进展与市场表现 - 公司成立两年半,声称其发展速度已反超拥有10至20年积淀的竞争对手[8] - 在多模态技术上,其语音、图像、视频生成技术已稳居行业顶尖水平[9] - 在规模效益上,公司生成的图像和视频数量已超过所有竞争对手的总和[9] - 在智能核心上,Grok 4.2在预测能力上成功击败了所有AI,横扫各大榜单[9] - Grok主模型已接入超过200万辆特斯拉汽车,并拥有强大的语音API[12] - 在编程领域,公司认为已能感受到AGI,并预计Grok Code可能在2-3个月内达到顶尖水平,到2026年底编程可能会消失[29][30][32] 算力基础设施 - 公司拥有约100万块H100 GPU的超算规模[8] - 公司正在部署全球最大的超算集群之一,第一阶段包括33万块Grace Blackwell芯片[25] - 后续将增加另外22万块GB300芯片,所有这些算力都将用于训练Grok[28] - 公司声称在AI算力上线速度方面无人能及,此观点得到了英伟达CEO黄仁勋的背书[23][24] 生态系统与平台战略 - 公司正在构建一个垂直整合的智能堆栈,涵盖算力、分发、支付、数据、物理层[35] - 分发平台X覆盖超过10亿用户,2026年1月是有史以来互动量最高的月份,2月预计将超越这一纪录[37] - X平台首次下载量环比增长50%,新用户每日应用内使用时间多出55%[37] - 平台文章发布量增长10倍,阅读量增长17倍[37] - 订阅业务年经常性收入已达10亿美元[37] - 公司计划开源X平台代码及Grok Chat,并承诺不在Grok中加入广告[40] - 支付平台X Money已进入内部封闭测试,预计一两个月内将进行外部有限测试,目标是成为所有货币交易的中央枢纽[40] 长期愿景与太空探索 - 公司与SpaceX合并的根本原因是加速人类未来、理解宇宙、将意识扩展到群星之间[40][44] - 长期愿景包括在地球轨道上以每年100至200吉瓦的规模部署数据中心,长远目标是从地球每年发射高达1太瓦规模的算力[48] - 终极计划是在月球上建立AI工厂,利用质量投射器批量建造并发射AI卫星,将算力规模提升至每年1000吉瓦甚至更高[48][49] - 该愿景的最终目标是利用太阳能量的百万分之一甚至更高比例,并探索太阳系及其他恒星系统[46][54]
联想集团杨元庆谈“AI泡沫”:某些领域有投资过重情况,不要都去做AI的基础模型训练
新浪财经· 2026-02-12 17:22
公司业绩与沟通会 - 联想集团于2月12日发布了FY2025/26第三财季的业绩,并举行了媒体沟通会 [1][1] 对AI行业现状的评估 - 公司董事长兼CEO杨元庆认为,当前AI可能在某些领域存在投资过重过多的情况 [1][1] - 他建议行业参与者不要都去进行AI基础模型训练 [1][1] - 对于通过当前路径能否实现通用人工智能(AGI),公司持怀疑态度 [1][1] 对AI本质与发展方向的看法 - 公司认为AI本质上是基于人类历史上积累的所有数据而产生的智能技术 [1][1] - 未来AI普及应用的关键在于充分利用企业或个人的私有数据,以产生个人智能和企业智能 [1][1] - 公司判断,充分利用私有数据以推动智能发展是一个不会逆转的大方向 [1][1] AI发展带来的市场机遇 - 公司预见,AI的普及与普惠将驱动市场对更多智能终端和AI基础设施的使用需求 [1][1]
Anthropic正取代OpenAI,成为中国AI界的白月光
创业邦· 2026-02-12 08:28
文章核心观点 - 在AGI领域,Anthropic正取代OpenAI成为新的行业标杆和叙事中心,其专注于企业级API和生产力工具的战略取得了显著成功,并深刻影响了中国AGI公司的技术理念与商业审美 [7][8][41][70][71] Anthropic的市场表现与地位 - 在编码市场中,Anthropic在2025年中旬的占有率高达42%,是OpenAI(21%)的两倍 [19] - 在企业级LLM API市场,Anthropic的份额从2023年的12%增长至2025年底的40%,增长了28个百分点;同期OpenAI的份额从50%下滑至27% [21][23] - Anthropic在企业级LLM API和编码市场均占据统治性地位 [18] Anthropic的战略与商业模式 - 业务布局极其专注,主要押注API叙事,不追求“超级入口”,专注于生产力生态及其衍生品 [31][33] - 将免费用户视为“债务”而非“资产”,对免费用户最为苛刻,且是头部基模公司中唯一不做多模态生成的公司 [31][32] - 长期通过购买AWS等云厂商算力来支持训练和推理,以减缓现金流失,近期才开始筹划自建大型算力中心 [32] - 构建了高安全叙事的Constitutional AI、深耕长下文与逻辑推理能力,并推出MCP协议探索Computer Use场景,为Agent时代打下基础 [34] Anthropic成功的原因与行业影响 - 成功源于独特的“品味”和体系构建,其模型能力与收入正相关,证明了在B端市场模型能力上限的重要性 [29][30][54] - 深度嵌入工作流的API场景具备高护城河,模型与工作流耦合后的稳定性及企业更换服务商的惰性,使其客户基础稳固 [35][36] - 被华尔街分析师称为“SaaSpocalypse”,其Claude Cowork和超长上下文能力加剧了AI颠覆SaaS市场的恐慌,导致SaaS股票被抛售 [37] - 本质是不断创造为AI和Agent服务的工具,旨在建造一个以Agent为主体的新世界,这与OpenAI服务普通人的互联网生态思维形成差异 [41] 中国AGI行业对Anthropic的追随 - 在中国AGI-NEXT前沿峰会的圆桌论坛上,Anthropic和Claude被提及至少27次,超过OpenAI和GPT的20次,其中前OpenAI研究员姚顺雨一人就提及16次 [10][11] - Kimi创始人杨植麟将Anthropic作为直接对标对象,提出通过“预训练效率革命”和打造独特“Taste”来超越Anthropic [55][57][58][59] - 智谱公司被指走了“Anthropic这条路线”,将精力重点押注在编码和探索Agent生态上 [60] - 阶跃、MiniMax等公司也在试水Agent产品或共享与Anthropic类似的技术理念与审美 [61] - 中国AGI从业者认为,Anthropic的叙事代表了AI下半场更看重真实场景能力、实实在在的价值以及为生产效率付费的趋势 [64][65] 行业叙事变迁 - OpenAI的叙事正在“老去”,其在中国市场的叙事也因字节、阿里、DeepSeek等公司的格局而“远去”,对许多创业公司而言甚至从“资产”变成了“负债” [63][66][67][69] - Anthropic的崛起为行业提供了面对“中国OpenAI”竞争难题的示范和解药,其主导的生产力叙事成为新的估值与产业兴奋剂 [70][71]
智谱GLM-5发布:技术全面升级 Agent能力达开源SOTA
智通财经· 2026-02-12 08:26
公司发布新一代旗舰大模型 - 智谱公司正式发布新一代旗舰大模型GLM-5 [1] - 该模型旨在完成复杂系统工程与长程Agent任务,在日常工作场景中展现出开源SOTA级Agentic Engineering能力 [1] - 实际使用体验对标Claude Opus4.5 [1] 行业技术范式转变 - 当前AGI行业正从“Vibe Coding”向“Agentic Engineering”范式转变 [1] - 模型能力从简单对话、快速原型,升级为自主解决现实世界长程系统工程 [1] - GLM-5正是面向这一趋势打造的新一代基座模型 [1] 模型技术参数与架构突破 - GLM-5参数规模扩展至7440亿 [1] - 预训练数据增至28.5万亿tokens [1] - 构建了全新的异步强化学习基础设施“Slime”框架,以充分激发模型潜力 [1] - 首次集成稀疏注意力机制,在保证长文本效果的同时大幅降低部署成本 [1] 模型基准测试表现 - 在编程能力上对齐Claude Opus4.5 [1] - 在SWE-bench-Verified和Terminal Bench2.0中分别获得77.8分和56.2分,为开源模型最高分数 [1] - 性能表现超过Gemini3Pro [1] 模型Agent能力表现 - 具备开源SOTA的Agent能力 [2] - 在BrowseComp(联网检索与信息理解)中取得开源第一表现 [2] - 在MCP-Atlas(工具调用和多步骤任务执行)中取得开源第一表现 [2] - 在τ-Bench(复杂多工具场景下的规划和执行)中取得开源第一表现 [2]
智谱(02513)GLM-5发布:技术全面升级 Agent能力达开源SOTA
智通财经网· 2026-02-12 08:26
公司产品发布 - 智谱公司正式发布新一代旗舰大模型GLM-5 [1] - GLM-5模型能够完成复杂系统工程与长程Agent任务,在实际使用体验上对标Claude Opus 4.5 [1] - GLM-5在编程能力基准测试中与Claude Opus 4.5对齐,在SWE-bench-Verified和Terminal Bench 2.0中分别获得77.8和56.2的开源模型最高分数,性能表现超过Gemini 3 Pro [1] 行业技术趋势 - 当前AGI行业正从“Vibe Coding”向“Agentic Engineering”范式转变,模型能力从简单对话、快速原型升级为自主解决现实世界长程系统工程 [1] - GLM-5是面向“Agentic Engineering”趋势打造的新一代基座模型 [1] 模型技术规格 - GLM-5参数规模扩展至744B,预训练数据增至28.5T [1] - 模型构建了全新的异步强化学习基础设施“Slime”框架 [1] - 模型首次集成稀疏注意力机制,在保证长文本效果的同时大幅降低部署成本 [1] 模型能力表现 - GLM-5具备开源SOTA的Agent能力 [2] - 在BrowseComp(联网检索与信息理解)、MCP-Atlas(工具调用和多步骤任务执行)和τ²-Bench(复杂多工具场景下的规划和执行)基准测试中均取得开源第一表现 [2]
AI游戏独角兽的焦虑:AI迭代太快,冲击传统VC决策
36氪· 2026-02-11 21:33
AI行业发展节奏与从业者认知 - AI发展速度已明显超出行业从业者的认知边界[1] - 从2026年开始 AI更新节奏从“几个月一个爆款”变为几乎每周都有能重构生产流程的能力跃迁[2][3] - 从业者需要以极高强度(如每天仅睡四小时)跟进 但仍感勉强跟上甚至开始掉队[3] AI对创业公司组织与战略的影响 - AI极大提升了生产效率 例如原本需四五人协作的模块现一人即可快速交付[4] - 但AI更新过快 每次模型能力跃迁都直接影响产品设计、系统架构、玩法及商业假设[6] - 导致公司管理层焦虑加剧 并开始考虑配置专门岗位(如招聘只负责跟进AI前沿研究的人员)以确保认知不落后[6] - “认知更新能力”本身正变成一种稀缺资源[7] 中国AI行业格局与公司竞争力 - 判断中国AI企业中最有可能率先进入第一梯队并形成引领效应的将出现在字节体系[8] - 该判断基于现实和组织层面:团队执行效率与工程能力极强[10] 决策层对新技术投入意愿和进取心强[11] 掌握的数据规模和数据多样性是关键优势[12] - 字节系核心产品路线更面向大众使用场景 强调普及率和真实使用频次 而非单纯追求能力榜单领先[13] - 其AI产品(豆包)在国内市场的用户渗透率很可能已绝对领先 活跃用户规模个人判断可能已超过ChatGPT[13] AI的商业本质与受益者 - AI至今未创造出超越互联网范式的新商业模式 更多是对原有业务体系的彻底重构[13] - 在互联网行业中 AI成为解决流程复杂、系统割裂、组织冗余问题的直接且具规模效应的降本增效手段[13] - 真正能最大化享受AI红利的并非从零开始的新公司 而是本身已拥有成熟商业模型、稳定用户入口和完整生态体系的科技巨头[13] - 例如阿里将通义千问深度接入自身业务 谷歌将Gemini融入全家桶生态 AI对其而言更像是“超级效率引擎”而非模式革命[14][15] AI对创业生态与投融资的冲击 - AI极大降低了创新门槛 过去需百人团队完成的事情现在十人或一人即可完成 试错成本下降 产品迭代速度呈指数级提升[17] - 这导致高质量项目数量爆炸 每天可能出现几十、上百甚至上千个完成度极高的产品原型 使传统资源、技术和组织能力构成的筛选器快速失效[17] - 传统VC依赖人工判断、长期尽调、深度陪跑的决策模式将难以维持原有的效率与回报结构[18] - 未来AI产品可能演化为高度短周期、高并发的创业形态 产品可能在几周内完成整个生命周期所需的收入积累[19] - 在此背景下 融资与退出可能成为最大摩擦成本 部分AI项目的投融资过程可能会更多通过Crypto体系来完成 因其接近极致资本流动效率[19] 大模型向AGI发展的关键方向 - 当前主流模型在“聪明程度”上已非常接近对通用智能的直觉预期[19] - 下一次质变可能来自两个方向:一是权限与长期记忆 即AI拥有高系统权限并能持续学习个人偏好 从而转化为真正的个人智能中枢[20][21] 二是高质量、实时且高度专业的数据源接入[22] - 专业数据接入的案例:在查询《阿凡达》最新票房数据时 仅豆包给出了准确及时的数据 其他模型基于通用搜索 信息滞后[23] - 未来大模型公司与专业数据公司的深度合作可能形成关键护城河 使用户在专业问题上获得准确实时反馈 体感智能水平出现显著跃迁[23] - 从用户体验看 这种跃迁比单纯的推理能力提升更加直观[24] 时代变革与个人定位 - 未来五到十年可能成为人类历史上变革幅度最大的时期 涉及社会运行方式、生产结构与个人能力结构的系统性重构[26][27] - 身处剧烈变化时代是难得机会 真正危险的是对稳定的错觉[28][29] - 认为自己的职业路径、能力结构和行业位置已稳固的人 未来大概率会付出代价[29] - 更应将自己定位为“投机分子” 即投机方向 能在趋势变化时迅速调整认知 在底层逻辑迁移时愿意推翻已有路径重新构建自己 以保证始终站在变化之中[29]
AI游戏独角兽的焦虑:AI迭代太快,冲击传统VC决策
阿尔法工场研究院· 2026-02-11 18:13
AI发展速度与认知挑战 - AI发展速度已明显超出从业者的认知边界 从2026年开始 几乎每周都会出现足以改变产品形态 工作方式和认知框架的更新 从业者需要以极高强度跟进才能勉强跟上[3][5] - AI的快速更新节奏对现实业务产生强烈冲击 每一次模型能力跃迁都会直接影响产品设计 系统架构 玩法设计乃至商业假设本身[8] - 在AI高速演化阶段 “认知更新能力”本身正在变成一种稀缺资源 有公司开始考虑专门招聘人员负责跟进AI前沿研究 以确保公司在认知层面不被时代甩下[9][10] 中国AI行业格局与字节优势 - 在中国的AI企业中 最有可能率先进入第一梯队甚至在某些方向形成引领效应的 很大概率会出现在字节体系[11] - 判断依据包括团队整体执行效率与工程能力极强 决策层对新技术的投入意愿和进取心非常强 以及所掌握的数据规模和数据多样性[13][14][15] - 字节系核心产品选择了一条更加面向大众使用场景 更加强调普及率和真实使用频次的路线 在国内市场 豆包面向普通用户的AI产品渗透率很可能已处在绝对领先位置 在活跃用户规模上可能已超过ChatGPT[16] AI对商业模式与产业结构的影响 - AI到目前为止并未创造出超越互联网范式的新商业结构 更多带来的是对原有业务体系的彻底重构 尤其是在互联网行业中 AI提供了一种极为直接且具有规模效应的降本增效手段[18] - 真正能够最大化享受AI红利的 是本身已经拥有成熟商业模型 稳定用户入口和完整生态体系的科技巨头 例如阿里将通义千问深度接入自身业务体系 谷歌将Gemini融入其全家桶生态[18] - 对这些公司而言 AI更像是一种“超级效率引擎” 而不是一场模式革命[19] AI对创业生态与投融资的冲击 - 对创业者而言 AI是一场前所未有的机会 生产力结构发生根本改变 过去需要一百人规模团队才能完成的事情 现在十个人就可以完成 创新的门槛被大幅拉低 试错成本急剧下降 产品迭代速度呈指数级提升[21][22] - 在AI加持下 高质量项目的数量会发生爆炸 每天可能会出现几十个 上百个甚至上千个完成度极高的产品原型 这对传统VC依赖人工判断 长期尽调 深度陪跑的决策模式形成极大冲击[23][24] - 在高度短周期 高并发的创业形态下 融资与退出可能成为最大摩擦成本 未来部分AI项目的投融资过程 很可能会更多通过Crypto体系来完成 因其可能是目前最接近极致资本流动效率的基础设施[24][25] 大模型未来发展方向与AGI路径 - 从“聪明程度”来看 当前主流模型已非常接近对通用智能的直觉预期[26] - 真正可能引发下一次质变的 更可能来自两个方向 一是权限与长期记忆 当AI拥有极高系统权限并能持续学习个人偏好时 会转化为真正意义上的个人智能中枢 二是高质量 实时且高度专业的数据源接入[27][28][29][30] - 大模型公司与专业数据公司之间的深度合作 可能形成一条关键护城河 当用户在高度专业问题上持续获得准确 实时且可信的数据反馈时 体感上的智能水平会出现显著跃迁[31][32] 时代变革与个人应对 - 未来五到十年 很可能会成为人类历史上变革幅度最大的一段时期 涉及社会运行方式 生产结构与个人能力结构的系统性重构[33][34] - 所有相信自己的职业路径 能力结构和行业位置已经稳固的人 未来大概率都会为这种判断付出代价 真正危险的是对稳定的错觉[37][38] - 在这个时代 需要成为一个“投机分子” 不是投机资产 而是投机方向 当趋势变化时能迅速调整认知结构 当底层逻辑迁移时愿意推翻已有路径重新构建自己[39][40][41]
硬刚OpenAI,中国团队杀入Agentic AI全球前二,一战封神
36氪· 2026-02-11 16:04
文章核心观点 - 全球大模型竞赛已从实验室的“参数博弈”转向真实商业世界的“实战进化”,能否在真实环境中“破局”成为唯一度量衡[4] - 中国AI初创公司Feeling AI凭借其自研的CodeBrain-1,在权威基准Terminal-Bench 2.0中取得全球第二的成绩,标志着中国AI在智能体(Agentic AI)复杂任务规划与自主编码领域的工程化能力已达到世界顶尖水平[1][6] - 行业竞争底层逻辑已改写,模型与Agent框架的良好组合可能成为未来大模型商业落地的标准形态,而中国团队正以“框架定义者”的角色参与定义未来大模型的工程标准[9][10][27] 行业竞争格局与趋势 - 全球大模型巨头OpenAI与Anthropic在Terminal-Bench 2.0上展开正面交锋,OpenAI的GPT-5.3-Codex+ Simple Codex组合以77.3%(75.1%)的胜率宣称登顶,Anthropic的Claude Opus 4.6在Agentic Terminal Coding Task上胜率为65.4%[4] - 行业评测标准转向硬核实战,Terminal-Bench 2.0被公认为AI智能体在真实命令行环境下端到端执行能力的“金标准”,其升级版大幅拉高门槛,全球顶尖模型解决率普遍难以突破65%[21][24] - 模型正从单一工具进化为“全能代理”,OpenAI宣称其Codex已能横跨全生命周期执行专业人士的所有计算机操作,模型与框架正进化为深度绑定的“智能全家桶”[26] Feeling AI的技术突破与表现 - 公司自研的CodeBrain-1在Terminal-Bench 2.0榜单中,以72.9%(70.3%)的综合得分位列全球第二,仅次于OpenAI的Simple Codex(GPT-5.3-Codex),是前十强中唯一的中国团队[6][11] - 在更聚焦的47条Python任务子集中,CodeBrain-1表现稳定,Py Tasks胜率为72.3%,Coding Tasks胜率为70.2%[14][15] - 在成本效率方面,当基模均使用Claude Opus 4.6时,CodeBrain-1在两者均成功的Py Tasks子任务上消耗的总Token数比Claude Code大幅缩减超15%[16] - 此前,公司发布的MemBrain1.0在多项主流记忆基准评测中拿下全新SOTA,在KnowMeBench Level III最高难度评测中比现有结果大幅提升超300%[8] CodeBrain-1的技术架构与核心能力 - CodeBrain-1是公司原创“跨模态分层架构”中InteractBrain核心层的一部分,专注于复杂动态交互场景下的深度理解与长程规划[9] - 其核心能力是作为“会动态调整计划与策略的大脑”,通过优化任务执行逻辑和错误反馈机制,提升在真实终端环境下的操作成功率[16] - 技术实现上专注两个关键环节:1) Useful Context Searching:利用LSP提高关联信息检索效率,减少噪音;2) Validation Feedback:从LSP Diagnostics中高效定位错误,缩减生成与验证的循环过程[14] - 与顶尖模型常因“过度思考”导致执行链路冗长不同,CodeBrain-1扮演“调度中枢”与“效率校准器”角色,引导模型在常规操作中保持极速响应,仅在关键报错时激活深层思考[25] 应用场景与商业化潜力 - CodeBrain-1具备动态生成可执行程序并根据反馈调整的能力,可应用于个体角色行为调整或群体组织策略演化[16] - 在游戏场景中展示了作为行为与策略生成引擎的潜力,例如驱动游戏Bot完成从理解自然语言需求到规划并执行完整行动脚本的任务,以及实现由群体记忆驱动的战术演化[17][18] - 强大的Agent框架是“模型落地的必经之路”,关乎任务分解精度及在闭环环境中纠错与生存的韧性[26] - 垂直行业的深水区为优秀的工程框架留下巨大商业红利,无论是系统级Agent框架还是精悍的开发者效能工具,这些“离用户更近”的触点都潜藏爆发式增长可能[26] 中国AI团队的行业地位与意义 - Feeling AI的成功表明中国AI团队已在AI时代的“战术调度中心”占据高点,能够深度驱动全球顶尖模型,并参与定义未来大模型的工程标准[10][26] - 公司在OpenAI尖端模型发布后瞬间完成深度整合并跑出领先战绩,证明了中国团队在全球工程化协同中占据制高点,并率先跨越了Agent从“对话玩具”到“生产力工具”的鸿沟[26][27] - 在由OpenAI与Anthropic构建的巨头生态中,中国团队选择以“框架定义者”的角色切入,展现了中国AI创新路径的独特性与韧性[27]
被马斯克点赞,陈炜鹏希望做“可以玩的抖音”
36氪· 2026-02-10 20:52
公司概况与产品定位 - 公司“涌跃智能”由前搜狗和百川智能技术负责人陈炜鹏于2025年6月创立,产品方向为AI内容社区 [1] - 旗下产品Loopit于2026年2月10日正式上线,是一款平台型AI社区应用,其形态被描述为“内容‘活过来’的抖音”,用户可通过点击、划动、自拍、语音、摇一摇等方式与Feed流中的内容进行互动 [1][3] - 产品上线初期被部分人定义为“AI游戏”,但创始人认为定义不应如此狭窄,希望用户自行探索产品边界 [7] 融资与市场反响 - 公司在过去30天内完成了两轮融资,最新估值较1个月前提升了6倍 [1] - 产品上线后,一名海外用户的使用视频得到埃隆·马斯克的评论转发,引发市场关注 [1][3] 产品核心技术与创新 - 产品核心创新在于将AI的Coding能力与多模态能力结合,打造“互动内容引擎” [10][42] - 技术路径是用Coding驱动多模态的可控生成,这是一条鲜有人尝试的路线,团队用了7个月才做出能落地的架构 [10][12] - 创作门槛被AI大幅降低,用户仅需文字输入想法,产品可主动提供点子并生成支持图像、语音、视频、3D等全模态的可交互H5内容 [5] - 多模态被视为最贴近C端应用的能力,能拓宽交互边界;而Coding能力则被视为底层架构,AI降低了普通人的Coding门槛 [10][39] 产品开发历程与战略选择 - 产品上线前经历了7个多月的漫长探索,团队几乎每隔一两周就要推翻产品demo [9] - 团队曾考虑做工具型产品,但最终选择做更复杂、更艰难的社交平台,因为判断AI工具缺乏想象力和网络效应 [12] - 产品形态经历了从互动PPT、视频剪辑工具到互动短剧,最终确定为“短交互的产品和社区”Loopit的演变过程 [43][44][45] 创始人与团队背景 - 创始人陈炜鹏是前搜狗搜索研发总经理(9年晋升超10级)、百川智能联创及大模型负责人,拥有深厚的NLP技术背景 [7] - 其曾在Soul担任技术VP,负责AIGC技术和内容社区业务,这段经历弥补了其产品管理经验,并深刻影响了其“以用户价值为中心”、“开拓想象力”的产品方法论 [9][15][16] - 团队组建追求跨模态能力互补,创始人偏语言模型,联合创始人施政偏文生视频方向 [99] 产品设计理念与市场洞察 - 产品设计采用单列Feed流,目的是内容优先,让用户第一时间感受到内容可以互动,目前互动内容占据屏幕的80% [52] - 洞察到内容形态的进化趋势是“人和内容的距离越来越近”,即从观看、交流到参与,因此致力于打造可与内容互动的平台 [50][51][52] - 认为互动内容提供的“爽感密度”未来一定会大于视频,产品通过设计符合直觉的交互来降低互动门槛 [55] - 早期用户画像定位为有想法、有创意的年轻人,但认为社区的未来边界应由用户探索决定 [56] 增长策略与生态构建 - 冷启动阶段在海外定向邀请了几百个专业创作者,以创作高质量互动内容来建立初始生态,类似于早期抖音的策略 [64] - 认为当优质内容不断涌现,用户每次刷新都有惊喜时,用户的交互动力问题就会自然解决 [59] 行业观点与竞争哲学 - 认为AI应用公司应追求“组合能力”,即组合AI背后的代码、模型、语言、视频、推理等多种能力,以创造全新的用户体验和惊喜感 [19] - 指出大多数AI应用是工具,不具备网络效应(如剪映难成抖音),而Loopit因其全新的互动内容形态,有望产生网络效应 [67][68][69] - 认为OpenAI o1的发布代表大模型范式变化,未来大模型公司与应用公司的界限会越来越模糊 [32][33] - 竞争哲学是不担心潜在竞争对手,核心在于能否持续创新、拓宽行业想象力并为用户创造价值 [9][73][74] 商业模式与未来展望 - 认为现阶段过早讨论社区产品的商业化“是不专业的”,应待用户规模较大后再围绕用户厘清商业模式 [76][77] - 展望未来,指出互动天然可获得更多注意力,互动广告与内容的边界更模糊,可能带来新的商业模式,但相信会有更好的模式出现 [78][79][80]
Seedance 2.0火出圈,意味着AGI又近了一步
虎嗅APP· 2026-02-10 17:28
Seedance 2.0的技术突破与产品特性 - 模型支持文本、图片(最多9张)、视频(最多3段,总长≤15秒)、音频(最多3段,总长≤15秒)同时输入,混合上限12个文件,远超Sora 2的Cameo(单张照片)及Veo 3、Kling 2.6(主要依赖文本加单图)[10][13] - 引入“@提及系统”实现多模态资源的精确控制,改变了以往“碰运气”的创作模式,并采用“Seedance V2运动合成”技术,在重力、动量、碰撞、流体等物理现象的模拟上明显改进,减少了“漂浮感”和物体穿模[14][15] - 具备精准首尾帧与分镜驱动生成能力,可智能推演中间动态过程并维持跨镜头角色、光影、风格的一致性,同时支持对已有视频进行角色更替、删减、增加等编辑,大幅提升了成片率[16][17] - 可从单一提示词生成包含多个镜头切换的完整片段,自动规划分镜、运镜及剪辑效果,并支持8种以上语言的音素级口型同步,实现音频与视觉事件的实时对应[18][19] - 通过火山引擎RayFlow优化,生成速度比1.0版本提升约30%,10秒1080p带音频视频约需2-5分钟,Pro版本支持原生2K分辨率,视频可延长至2分钟,相比Sora 2的15秒和Kling 2.6的10秒有明显优势[19] Seedance 2.0的市场反响与行业影响 - 自灰度测试起不到48小时,便在X、抖音等社交平台引发现象级传播,内容涵盖《火影忍者》、《咒术回战》、《奥特曼》等热门IP,海外用户评价其为“2026年最好的视频模型,超越Sora 2”[5][6][7] - 其出色的物理模拟能力,特别是在格斗与动作场景中表现出的高精度(如拳击重心转移、形变反馈、动作链条流畅度),被行业领袖(如《黑神话·悟空》制作人冯骥)评价为“当前地表最强的视频生成模型”[4][23][26] - 模型爆火直接带动A股市场相关板块上涨,2月9日传媒、短剧、AI应用板块集体大涨,上海电影、完美世界等公司单日涨幅达10%,分析师预期该模型将大幅降低制作成本、加速内容生产周期[7] Seedance 2.0在AGI(通用人工智能)路径上的意义 - 物理世界的准确建模被视为实现通用AGI的关键能力之一,Seedance 2.0在物理模拟上的提升(理解力的作用、物体关系、因果链条)意味着其世界模型能力增强,开始从“模式识别”向“概念推理”跨越[28][29][30] - 其视听联合生成架构模拟了人类多模态融合的认知机制,当模型能建立“重物落地应发低沉声”等跨模态因果关联时,预示着其正朝着AGI靠拢[32][33] - 模型对物理规律(重力、动量、碰撞、流体力学)的理解能力与具身智能高度重合,视频生成可视为具身智能的“沙盒”,其在虚拟世界学习的物理规律未来可迁移至机器人控制等真实世界应用[34][35] - 与主要基于文本理解世界的GPT、Claude等大语言模型相比,Seedance 2.0通过视频生成任务被迫学习物理世界的直接表征,在通往AGI的路径上可能走得更远[35][36] 与竞争对手Sora 2的对比及潜在挑战 - Sora 2在快速动作场景存在短板(如篮球弹跳、水流形态有“梦幻感”),角色快速位移时易产生运动模糊或肢体变形,且难以保证多动作片段衔接的速度一致性,而Seedance 2.0在这些方面表现更优[37][38] - Sora 2定位为“AI版抖音”独立App,但其下载量在60天内出现断崖式下滑(12月环比降32%,1月环比大幅降45%至约120万次),目前已跌出美国App Store免费应用总榜前100名,战略失误在于试图复制缺乏真实人际关系的社区文化[41][42][43] - Seedance 2.0目前选择嵌入剪映、即梦等成熟创作工具,定位为“功能模块”和“创作者工具箱的一部分”,此务实路线可能有助于延长产品生命周期[43] - 版权风险是共同挑战,Sora 2曾因生成知名IP角色内容引发版权方反对并修改规则,Seedance 2.0同样因生成奥特曼、七龙珠等IP内容及真人肖像生成能力(已紧急下线)面临类似风险,公司需在技术能力与合规风险间找到平衡[44][46] - 核心挑战在于当视频生成成本趋近于零时,内容本身失去稀缺性,用户需要的是“更有意义的表达”而非“更多视频”,若无法回答“为用户创造的核心价值是什么”,技术最终可能沦为玩具[47][48] 字节跳动的生态优势与未来展望 - 公司在短视频领域的数据积累(抖音每日处理数十亿条视频)可能是Seedance 2.0理解运动节奏与吸引力的优势来源[39] - 公司拥有抖音、剪映、即梦的完整创作生态,若Seedance 2.0能与这些产品深度打通,形成从灵感到发布的闭环,将建立起难以复制的生态壁垒[48] - 公司未来的关键在于能否在爆火窗口期内,将流量转化为用户习惯,将技术优势转化为生态壁垒,这将决定其成为“下一个抖音”还是“下一个Sora 2”[48][49]