晚点LatePost
搜索文档
现场直击硅谷世纪庭审:马斯克 vs 奥尔特曼——谁是 “最讨厌的人”
晚点LatePost· 2026-05-07 13:10
⼀场关于背叛、贪婪与理想的审判。 特约作者 ⼁ 周恒星 举世瞩⽬的庭审进⼊第⼆周。 原告是世界⾸富埃隆·⻢斯克,被告是他曾经的盟友、正在筹备上市的 OpenAI,及其 CEO ⼭姆·奥尔特曼(Sam Altman)和总裁格雷 格·布罗克曼(Greg Brockman)。⻢斯克说,他们偷⾛了⼀家慈善机构。 开庭前⼏天,⻢斯克发信息给布罗克曼,问他要不要和解。布罗克曼回复说,双⽅可以都撤销对彼此的法律诉讼。⻢斯克随即回道:"到本 周末,你和⼭姆将成为全美最令⼈讨厌的⼈。" ⾄少在庭审的发⽣地奥克兰,⻢斯克更可能先成为这座城市⾥最不受欢迎的⼈。 庭审现场附近的街头,愤怒被粗⿊的喷漆留在墙上——"STRIKE""TRUMP & MUSK OUT"。 这并不奇怪。湾区是美国左翼⼤本营:伯克利、旧⾦⼭、奥克兰连成⼀⽚,构成最深的那抹蓝。这⾥的⼈们恨的不只是⼀个亿万富翁,⽽是 ⼀个曾经的 "⾃⼰⼈",站到了对⽴⾯。 ⾛进法庭:现场记录 太平洋时间 5 ⽉ 4 ⽇,星期⼀,早晨七点,我来到奥克兰联邦法院⻔⼝排队,前⾯已有⼗⼏⼈。⼏名摄影师守在⼊⼝,镜头对准⼤⻔。法 院⼤⻔外墙上有⼀⽚触⽬惊⼼的红漆——是什么时候喷上去的,没有 ...
一家视觉模型公司决定不再 “低调”丨100 个 AI 创业者
晚点LatePost· 2026-05-06 16:36
行业背景与公司定位 - 多模态模型赛道技术突破与商业加速:Seedance 2.0实现导演级视频效果,GPT-Image 2几乎抹除真实与虚构边界[4] - 行业融资与商业化进展:快手可灵AI的ARR超过3亿美元,全球用户超6000万;MiniMax港股上市市值最高近4000亿港元;爱诗科技与生数科技完成20多亿融资,2025年ARR分别达4000万和2000万美元[4] - 公司相对“隐形”:智象未来刚完成5亿人民币B轮融资,以To B业务为主,2025年全年收入1亿元,2026年收入增速更快,To C产品用户突破3000万[4][5] 技术架构与成本优势 - 采用“双模”架构:图片生成与视频生成为两个独立模型,将图像作为视频生成的空间基底和关键入口[11][13] - 技术架构领先且注重创新:公司曾登顶图片生成榜单,但更注重模型架构创新而非纯资源投入,避免陷入与大厂比拼数据与算力的陷阱[8][9] - 显著的成本优势:通过先训练图片模型再迁移至视频,训练成本仅为行业的大约五分之一到十分之一[13] 商业化路径与战略选择 - 坚定选择To B路线:认为AI to C产品非高频刚需,难以持续商业闭环,且面临大厂压倒性竞争,Sora的战略性关停被视为佐证[14][15] - 商业化框架“1+1+3”:1个模型 + 1个MaaS平台 + 3个垂直场景(短视频营销、AI短剧、为OPC专业用户提供社媒创作智能体)[15][16] - 收入结构:2026年Q1,MaaS平台收入占比约小一半,其余三个业务线较为均衡[17] 三大垂直场景发展 - **短视频营销**:增长最快的是RaaS(按效果付费)服务,创新结合低成本硬件(3D全息风扇屏)与软件,已进入超过一万家商家[17] - **AI短剧**:通过平台“帧赞”为专业内容团队提供工具,其制作的短剧曾登顶腾讯视频竖屏热播榜,公司定位为提供工具的“卖铲子”角色[21][22] - **To OPC业务**:针对专业个人用户的社媒创作,2026年Q1新增1000万用户,策略是通过产品创新迭代和开发多款C端产品刺激需求[17][23] 市场规模与目标 - 短视频营销市场潜力:目标服务全球100万商家,若按一条短视频一美元计算,预估为百亿美元级别的生意[20] - 对AI影视技术成熟度的分层判断:金字塔最上层的影视级作品AI尚不能取代,但下层的漫剧、绘本、短视频广告已比较成熟,可为具身智能生成训练视频但多人复杂动作一致性仍需提升[22] 公司治理与创业认知 - 团队基因与节奏:团队具备企业服务基因,创始人强调AI时代创业需“唯快不破”,将产品与战略规划周期从按年缩短至按季度甚至按月[24][25] - 认知转变:创始人最大的挑战是从“技术好就有人来”转变为重视资本力量与公司知名度,并加快融资、产品及认知的迭代节奏[24][25]
晚点独家丨月之暗面将完成 20 亿美元新融资,估值破 200 亿美元
晚点LatePost· 2026-05-06 16:36
融资与估值动态 - Kimi(月之暗面)即将完成新一轮20亿美元融资,投后估值突破200亿美元,本轮由美团龙珠领投(出资超2亿美元),中国移动、CPE等参投 [4] - 2025年1月和2月,公司密集完成3轮融资,分别融得5亿美元、7亿美元和7亿美元 [4] - 算上最新一轮,公司在不到半年内融资总额超过39亿美元,最新估值相比2024年11月的约43亿美元翻了4倍有余 [4] - 公司累计融资额已超过376亿人民币,成为中国大模型创业公司中累计融资最多的公司 [5] 财务与业务表现 - Kimi K2.5模型更新后,公司ARR(年度经常性收入)在2026年3月初突破1亿美元,4月继续增长至超过2亿美元,付费订阅和API调用均在加速 [7] - 根据全球支付平台Stripe数据,自2026年1月底以来,公司近20天收入已超越2025年全年总和 [14] - 公司个人订阅用户1月支付订单数环比增长超过8000%,2月环比再涨超过120% [14] - 根据Similarweb数据,公司海外API开放平台在K2.5发布后,日均访问量暴涨10-20倍 [14] 技术与产品进展 - 公司于2026年4月20日晚发布并开源最新模型K2.6,该模型强化了编程能力和Agent集群能力,可支持最多300个子Agent协作,并开始同步测试Claw群组新功能 [7] - 2025年7月开源的K2模型和后续的K2.5、K2.6持续强化编程和Agent能力,K2模型采用MoE与MLA架构,总参数扩展到1T(万亿参数) [9] - K2.5模型首次引入视觉能力,并开始支持智能体群模式 [9] - 公司在2026年3月提出Attention Residuals(注意力残差)技术,旨在解决传统残差连接的信息稀释等问题,该成果获得了马斯克的公开称赞 [14][15] - 在具体技术成果上,公司在16B的Moonlight模型上验证了Muon优化器,后在1T规模的K2上提出改进版MuonClip,该技术被广泛采用 [13] 战略与方向调整 - 2025年春节后,公司战略更加聚焦,明确“生产力场景优先”,选定编程和Agent作为核心方向 [8][9] - 公司将“持续拿到SOTA(模型最佳表现)”设为最高优先级目标,并大幅减少C端投放,同时从闭源走向开源 [10] - 公司于2025年2月15日推出了云端龙虾Kimi Claw,支持低门槛的一键部署 [12] 行业竞争与格局 - 在Artificial Analysis的综合智能指数中,Kimi K2.6低于OpenAI、Anthropic和Google DeepMind的新模型,但高于Meta的Muse和xAI的Grok [11] - 截至2026年5月6日午间休市,同行业公司MiniMax市值约2100亿人民币,智谱约3470亿人民币 [5] - 目前MiniMax和智谱的市值在2000-4000亿人民币之间波动,相比之下估值约1400亿人民币的Kimi成为一个热门投资标的 [16] - 中国大模型创业公司普遍通过两种方式赚取收入:一是通过API按token用量收费;二是基于自有模型做应用,获取订阅付费用户 [17] 人才与激励 - 2026年初,公司创始人杨植麟在全员信中宣布,2026年公司平均激励将是2025年的200%,并计划大幅上调期权回购额度 [16] - 2026年4月初,公司推出了给实习生发期权的“穿越计划”,由于估值在数月内翻了4倍多且未上市,其期权吸引力增强 [17] - 公司在编程、Agent等领域的优异表现引发了白热化竞争,其相关人员已成为竞争对手的重点挖角对象,面临不小的人才压力 [17]
详解 DeepSeek V4:Infra 巨鲸 “四连击”,百万上下文走进现实
晚点LatePost· 2026-05-02 19:46
文章核心观点 - 文章通过访谈两位AI从业者,深入解读了DeepSeek-V4的技术报告,认为其核心成就在于**系统级的耦合工程优化**,而非单一的技术范式突破[9][14] - 中国开源大模型团队(如 DeepSeek、Kimi、智谱等)在激烈的竞争和人才密度下,已成为全球开源生态中最活跃的投入者,其发展路径更侧重于**极致的工程优化和性价比**[4][11][57] - 行业正从追求“范式变化”转向在现有Transformer范式下进行**深度的、系统性的工程优化**,以解决计算瓶颈和成本问题,这将成为未来一两年的竞争主旋律[14][58] 模型架构与技术创新 - **注意力机制革新**:DeepSeek-V4放弃了此前被视为先进架构的MLA(多头潜在注意力),回归MQA(多查询注意力),并创新性地组合使用CSA(压缩稀疏注意力)和HCA(重度压缩注意力)两种token-wise压缩技术,实现4:1和128:1的大尺度压缩,以降低长上下文处理的计算和显存开销[5][6][7][26] - **残差连接改进**:引入了mHC(流行约束超连接),在字节Seed提出的HC基础上加入Sinkhorn算法进行约束,改善了训练稳定性,与Kimi的Attention Residuals异曲同工,旨在增强层间的信息流动[35][36] - **优化器升级**:在1.6T参数规模的MoE模型上成功应用了Muon优化器,这是一种矩阵级别的优化器,相比元素级的AdamW能更好地利用参数间的联系,其大规模稳定训练是工程能力的体现[9][28][29][32] - **训练精度突破**:将训练精度从V3的FP8推进至FP4,通过量化感知训练等技术,在节省显存和带宽的同时保持了训练稳定性,使FP4成为工业级应用的标准[9][42][44][46] 工程实现与系统优化 - **系统级耦合挑战**:V4一次性引入了混合注意力、mHC、Muon优化器和FP4训练等多个相互耦合的新技术,其组合复杂度呈爆炸式增长,系统级的耦合优化比单点创新更为困难,体现了团队极强的工程深度[9][12] - **极致的稀疏化与效率提升**:通过HashTop-K MoE路由、提高稀疏比等技术,将激活参数比例降至业界最低水平。V4-Pro在1.6T总参数下,激活参数为49B,激活比仅为3.06%,低于Kimi K2.6的3.20%和V3的5.5%[21][23][24]。在百万级上下文中,其单token推理FLOPs降至V3.2的27%,KV缓存占用降至10%[19] - **底层设施与工具链**:深度使用并推动了北大开源的TileLang等底层语言的发展,用于高效开发新算法对应的计算内核(kernel),降低了为新算法定制优化算子的边际成本[4][40][41] - **全平台与国产芯片适配**:完成了对英伟达、AMD、NPU等全平台的推理适配,并在技术报告中验证了在华为昇腾芯片上的细粒度并行EP方案,为国产芯片生态做出贡献[8][12][13] 性能表现与行业定位 - **性能对标**:在内部在线评测中,V4的性能大约在Claude Opus 4.5的水平,与Opus 4.6、GPT-5.5仍有差距。有9%的DeepSeek工程师表示不会将V4-Pro作为首选模型[16] - **评测排名**:访谈时(4月28日),V4-Pro在Chatbot Arena上排名第23位,低于GLM-5.1和K2.6;在Artificial Analysis的Intelligence Index得分为52,也低于Kimi等模型。但至5月1日,其排名已超越K2.6,仍低于GLM-5.1[17] - **能力侧重点**:明显加强了与智能体(Agent)相关能力的评测,如工具使用和多步规划,反映了行业从“答得对”向“能完成任务”的转向[16] - **成本叙事转变**:V4技术报告未公布训练成本,这被视为一个信号,表明公司不再依靠“成本叙事”定义自己,而是转向以模型能力为核心[13][14] 行业发展与中美对比 - **版本号哲学差异**:DeepSeek、Kimi的版本号更像“研究语言”,代表模型结构的重大改变;而OpenAI、Anthropic的版本号更像“产品语言”,代表功能和能力的迭代,这由组织结构和商业模式决定[11] - **发展路径差异**:中国开源模型更追求**工程优化、性价比和极致成本控制**,例如在稀疏化、低激活比上做到极限。美国闭源模型更侧重于**提出和开辟新的能力方向**(如多模态、Agent),并在算力相对充裕的情况下优先冲击性能[11][57][58] - **竞争格局**:开源模型架构和方法论在趋同(如基座转向MLA,优化器转向Muon),能力上都重视Agent方向。中国主要玩家如DeepSeek、Kimi在工程和创新上较为极限;GLM、Qwen、MiniMax在RL训练和长上下文落地扎实;小米MiMo-V2.5-Pro在部分评测中分数很高[53][54][55] - **行业阶段判断**:AI行业“范式变化”(如Transformer、Scaling Law)是十年一遇的,当前阶段更关键的是在现有范式下探索优化空间上限,以及**发现和提出新的模型能力领域**(如长文本、Agent、幻觉控制)[14][15][51]
中国车企涌入南美,欧美同行的旧工厂是加速器
晚点LatePost· 2026-05-01 10:28
中国汽车出口格局与南美市场机遇 - 中国已连续三年成为全球第一大汽车出口国,2025年汽车出口709.8万辆,同比增长21.1%,其中新能源汽车出口262万辆,同比翻倍[5] - 国内价格竞争持续稀释利润,车企对海外增量需求迫切,多家车企在北京车展期间公布新的出海计划[5] - 欧洲市场进入难度加大,美国市场短期内难以打开,南美市场因此被推到更靠前的位置,成为中国车企新的出口目的地[5] 巴西市场的战略重要性 - 巴西是全球第六大汽车市场,是南美最难也最重要的市场,其新能源车渗透率约10%,低于全球平均水平,政府目标是在2030年提升至30%[5] - 作为南方共同市场国家,巴西与成员国之间有关税优惠,但对区域外进口设置共同对外关税,汽车是其中保护程度较高的行业[5] - 巴西政府自2024年起为符合条件的车企提供税收支持,但已开始阶梯式上调新能源车整车进口关税,计划在当年7月将税率恢复至35%的标准水平[6] - 去年,巴西是中国第五大汽车出口国,比亚迪海豚、海鸥、宋PLUS,长城哈弗H6,奇瑞瑞虎7等车型在当地较畅销[7] 中国车企在巴西的进入策略与布局 - 至少有七家中国车企选择进入或加码巴西市场,包括比亚迪、奇瑞、长城、吉利、长安、广汽、零跑[7] - 初期多以整车贸易、SKD(半散件)/CKD(全散件)等相对轻快的方式落地,部分车企提供零首付购车以降低购车门槛[7] - 若在巴西完成足够本地化生产率并满足区域原产地规则,未来有机会以优惠税率将车卖到阿根廷、乌拉圭、巴拉圭等周边市场[7] - 一家头部中国车企计划在2025年年中开启大规模本地化制造,涵盖研发、供应链、生产等环节,其长驻巴西外派员工已超百人[7] - 多家车企通过接手或合作利用欧美车企遗留的基础设施加速产能输出:比亚迪接手福特旧工厂,长城收购梅赛德斯-奔驰废弃工厂,吉利与雷诺合作,零跑依靠股东斯特兰蒂斯的体系[8] - 比亚迪改造工厂耗时16个月首车下线,长城巴西工厂于2025年8月开始限量生产[8] - 吉利在巴西规划与雷诺合作的全工艺工厂预计2026年投产,设计年产能10万辆[8] 本土化挑战与运营难题 - 本土化没有捷径,一个相似零部件在南美本地制造的价格可以是中国两倍以上,而车企通常只能接受三到四成的价差[9] - 多数车企采取折中策略:一部分零部件从中国进口,一部分当地采购,在南美进行总装[9] - 近期飙升的油价和航运价格影响了中国供应链极限效率的发挥[9] - 为了让供应商跟随出海,一家头部车企在部分海外项目上将付款周期缩短至45天,并提前支付研发费和模具费,但供应商倾向于落地在交通便利、工业配套成熟的地方[9] - 组织方式带来新成本,文化、法规、劳工和产业配套差异在美洲市场挑战进一步放大[9] - 外派中方员工普遍持商务签证,一次最多停留三个月,导致团队频繁更换,且经验丰富员工难以长期外派[9] - 为保证效率,研发和核心决策仍集中在国内总部,海外更多承担执行与协调职能,这可能导致决策延迟和团队负荷不均[11] 市场竞争与未来展望 - 巴西汽车市场目前由菲亚特、大众和雪佛兰主导,三者合计占据近一半市场份额[12] - 2024年巴西汽车销量约250万辆,仍未恢复到2012年380万辆的峰值[12] - 在油价波动和能源多样化背景下,包括巴西在内的拉美国家整体处于多能源路线并存阶段[12] - 尽管七家中国车企同时涌入,每家都能分到一定份额,但市场总量未必因此增长,未来几年每家车企的销量可能都不会特别大[12] - 对供应商而言,客户数量和工作量增加,但总销售额不一定同步增加[12]