Workflow
36氪
icon
搜索文档
不要被 AI 控制了,人类……
36氪· 2026-02-13 16:01
核心观点 - 创业者应警惕AI焦虑 避免丧失业务重心和哲学重心 应将AI视为工具和媒介 而非改变自身使命和主营业务的原因 [1][2][3] 业务重心与AI定位 - AI仅是一种工具 无论多强大 都应是实现自身使命、愿景和目标的工具 而非为AI改变原有使命、愿景、价值观和主营业务 [2] - 面对AI 行业不需要思考为AI做什么 而应思考AI能为现有工作带来什么 前者会导致无限恐慌 [2] - AI是空气、媒介、思考一切的框架和思考伙伴 [3] 学习与应用策略 - 文科生学习AI的最佳策略是付费 付费能解决99%的问题 [4][5] - 应向已有方法论的专业场景专家付费 或向AI代运营服务交学费 而非亲自下场使用Clawbot、seedance或操作飞书表格 [5] - AI是帮助拿结果的工具 不应让人的思维去服务AI 避免被AI控制 [5] 春节期间的行动建议 - 创业者春节期间可抢钱抢流量 但不要被AI浪潮席卷导致焦虑爆炸 [1][3] - 做IP者可在春节强人设曝光 例如通过分享日常创作和恋爱进程等内容吸引粉丝 [6] - 公司CEO可在春节阅读并思考在AI浪潮和华人全球化出海背景下的方向 保持内容生产不打烊 [6] - 应思考年内计划 并生产对粉丝和用户有意义的内容 而非基于AI焦虑行事 [6] 对AI浪潮的总体看法 - AI是生产力的土壤和基础的媒介工具 [2] - AI这个东西大部分人都会错过 因此不必过度焦虑 [7]
300亿美金为AI新王加冕,Anthropic估值狂飙至3800亿,马斯克急了
36氪· 2026-02-13 15:58
融资与估值 - Anthropic完成G轮融资300亿美元,估值飙升至3,800亿美元,成为科技史上规模最大的私人融资之一 [1] - 尽管市场对AI泡沫存在热议,但投资者仍在向AI竞赛注入数百亿资金 [3] 投资方阵容 - 本轮融资由GIC与Coatue领投,D. E. Shaw Ventures、Dragoneer、Founders Fund、ICONIQ和MGX共同领投 [5] - 参与方还包括Accel、Addition、Alpha Wave Global、Altimeter、AMP PBC、Appaloosa LP、Baillie Gifford、贝赛默、BlackRock关联基金、黑石、D1 Capital、富达、General Catalyst、Greenoaks、高盛成长基金、Insight Partners、Jane Street、摩根大通、Lightspeed、Menlo、摩根士丹利、NX1 Capital、卡塔尔投资局(QIA)、Sands Capital、红杉资本、淡马锡、TowerBrook、TPG、Whale Rock、XN,以及早前已宣布参投的微软和英伟达 [5] 财务表现与增长 - Anthropic首次披露年化营收达140亿美元,从零到该营收规模用时不到三年 [1][6] - 过去三年年增长超过10倍 [12] - 年消费超10万美元的客户数在过去一年增长了7倍 [12] - 《财富》十大公司中,有8家正在使用Claude [12] 企业级战略与市场定位 - 公司的爆发得益于其“专注企业用户”的战略布局,企业客户付费能力强、留存率高、更愿意深度集成AI工具 [9][10] - “企业优先”路线正成为AI赛道赢家与落后者的分水岭,华尔街投资风向明显偏好具备企业落地能力的AI公司 [11] - 公司并未从其他AI玩家“抢用户”,而是在构建自己的用户基础 [12] - 使用Ramp的企业中,有20%现在也付费使用Anthropic,去年这一比例仅为4% [13] - 在所有OpenAI付费用户中,有79%也在为Claude买单 [13] 核心产品与增长引擎 - 编码智能体Claude Code年化营收突破25亿美元,自年初以来已翻倍,周活跃用户也翻了一番 [12][17] - Claude Code是全球4%的GitHub公开提交代码的来源,较上月再翻一倍 [17] - 2026年初以来,Claude Code的企业订阅量激增4倍,目前企业客户贡献的营收占比已超过一半 [17] - 自今年1月以来,Claude Code的周活跃用户(WAU)实现翻倍增长 [17] 产品多元化与创新 - Claude正在向金融分析、数据建模、销售、网络安全、科研发现等关键领域拓展 [18] - 仅2026年1月,公司就发布了30多个新产品与功能,其中最受关注的是“Cowork” [18] - Cowork自带11个开源插件,支持将Claude定制为销售、法务、财务等专属角色助手 [18] - Claude for Enterprise已扩展到医疗和生命科学领域,支持在符合HIPAA合规要求的组织中部署 [18] - 最新推出的Opus 4.6模型能实现高质量文档、表格和演示的自动生成,是全球GDPval-AA基准测试上的最强模型 [20] 基础设施与合作伙伴 - Claude是唯一可同时在亚马逊AWS(Bedrock)、谷歌云(Vertex AI)和微软Azure(Foundry)三大云平台上部署的前沿AI模型 [23] - 其底层训练和运行支持AWS Trainium、Google TPU和NVIDIA GPU等多种硬件架构 [23] - 本轮融资将用于扩展Claude的全球基础设施部署 [23] 行业评价与竞争 - Coatue创始人Philippe Laffont认为,公司在AI智能体和企业级系统的专注使其正迅速走向大规模落地,产品迭代和市场扩张速度巩固了其领先地位 [18] - GIC私募股权首席投资官Choo Yong Cheen盛赞Anthropic是当之无愧的企业AI领导者,在安全性、性能与可扩展性方面不断刷新标准 [23] - 马斯克对公司的AI价值观提出批评 [24][26]
岚图上市进入倒计时:2025年营收349亿,盈利10亿,武汉将收获重要IPO
36氪· 2026-02-13 15:58
IPO进程与市场地位 - 岚图汽车已完成港股上市的全部前置监管审批流程,预计于2026年3月19日在香港联交所主板正式挂牌,将成为港股“央国企高端新能源第一股” [1] - 公司从2025年8月启动上市,至2026年2月11日获联交所原则性同意,历时仅四个月,快速完成了多部门审批 [1] - 上市后,公司将成为继蔚小理、零跑、奇瑞之后,港股市场又一新能源造车新势力,也是华中地区首家在港股上市的新能源汽车公司 [4] 财务表现与运营数据 - 2025年公司营收为349亿元(人民币,下同),较上年同期增长80% [3][5] - 2025年公司毛利率达到20.9%,净利润超过10亿元 [3][12] - 2023年至2025年,公司营收分别为127.49亿元、193.6亿元、348.65亿元;毛利分别为18.13亿元、40.65亿元、73亿元 [12] - 2025年公司实现年内利润10.17亿元,经调整后净利润为11.11亿元,成功实现扭亏为盈 [13][14] - 截至2025年12月31日,公司持有的现金及现金等价物为79.72亿元 [15] 销量与生产里程碑 - 2025年公司总销量为150,169辆,较2024年的80,116辆大幅增长 [10] - 分车型看,2025年岚图梦想家系列销量为76,045辆,岚图FREE系列为44,249辆,岚图知音系列为20,382辆,岚图泰山系列为4,676辆,岚图追光系列为4,817辆 [10] - 公司于2021年8月开始交付首款车型,2025年11月实现累计生产第30万辆车下线,成为首个达成此里程碑的央国企高端新能源汽车品牌 [9] 业务定位与产品线 - 岚图汽车是东风汽车旗下的高端智慧新能源品牌,成立于2021年,产品主要覆盖20万元至50万元价格带,目标人群为新时代中坚力量 [7] - 公司产品线覆盖SUV、MPV、轿车,已推出岚图FREE(中大型SUV)、岚图梦想家(豪华MPV)、岚图追光(旗舰轿车)、岚图知音(中型SUV)及岚图泰山(全尺寸旗舰大六座SUV)系列 [9] - 2026年公司计划推出四款全新车型,代号分别为“三王一炸”,均将搭载L3级智能辅助驾驶硬件 [18] 技术研发与合作伙伴 - 公司打造了平台架构、岚海动力、逍遥智能座舱、鲲鹏智驾和岚图技术生态五大技术底座 [12] - 2025年4月,公司发布L3级智能架构“天元智架”,整合了青云智能安全行驶平台与鲲鹏智能安全驾驶系统 [17] - 公司与华为在组合辅助驾驶、智能座舱领域深度合作,2025年推出多款搭载华为乾崑智驾ADS 4与鸿蒙座舱HarmonySpace 5的新车 [17] - 公司与宁德时代签署十年期深化合作协议,将在新技术合作、产品供应、全球市场协同等领域展开全方位协同 [17] - 公司L3级有条件自动驾驶已进入实车测试阶段,累计完成11万公里实际道路测试及90万公里仿真测试 [18] 市场与收入构成 - 2025年公司收入中,89.2%(291.58亿元)来自中国内地,10.8%(35.28亿元)来自海外 [12] - 岚图梦想家系列凭借宽敞空间和稳固底盘,在企业高端客户接送市场备受欢迎 [12] 公司治理与股权结构 - 2025年12月,卢放由首席执行官改任董事长,蒋焘接任首席执行官兼首席运营官职务 [21][23][24] - 上市前,东风集团股份及东风资管分别直接持有公司已发行股本约79.67%及3.30% [26] - 紧随上市及私有化完成后,东风公司及其控制实体预计将合计持有公司约69.47%的投票权,构成控股股东集团 [26][28] - 其他重要股东包括国有企业混合所有制改革基金(持股2.85%)、中银金融资产投资(持股2.56%)等多家国有背景投资机构 [29]
视听分离SOTA提速6倍,清华发布首个6M高性能模型
36氪· 2026-02-13 15:58
模型核心突破 - 清华大学团队推出Dolphin模型,突破了视听语音分离领域“高性能必高能耗”的瓶颈,为在智能助手、手机等端侧设备部署高清语音分离开辟了新路径 [1] - 该模型通过引入离散化视觉语义表征和基于物理先验的全局-局部注意力机制,在大幅降低计算复杂度的同时,刷新了多项基准数据集的性能记录 [2] - Dolphin是首个将参数量压缩至6M级别(计入视觉编码器)的兼顾高质量与高性能的视听语音分离模型,并在GPU推理速度上实现了相对于现有SOTA模型6倍以上的提升 [2] 技术挑战与解决方案 - 现有主流方法面临三大挑战:视觉编码器路径依赖导致计算量大、迭代推理导致高延迟、特征建模难以兼顾全局与局部细节 [4][5] - 针对视觉编码,团队设计了基于矢量量化的双路径离散视觉编码器DP-LipCoder,以极低计算成本提取高判别力视觉特征,解决轻量化与语义丰富度的冲突 [4][7] - 针对推理效率,模型摒弃多轮迭代,采用单轮编码器-解码器架构,并设计全局-局部注意力模块,确保单次前向传播即可完成高质量分离 [8] - 针对特征建模,全局注意力在低分辨率下捕捉长时序全局语境,局部注意力创新性引入基于热扩散方程的“热扩散注意力”,能去噪并保留语音瞬态细节 [8] - 模型采用直接回归目标语音深层表征的策略,相比传统掩码方法,在SI-SNRi指标上带来了约0.5dB的额外提升 [10] 性能表现与数据 - 在LRS2、LRS3和VoxCeleb2三个权威基准数据集上,Dolphin的分离质量全面领先 [11] - 在LRS2数据集上,Dolphin的尺度不变信噪比达到16.8 dB,优于当前SOTA模型IIANet的16.0 dB和AV-Mossformer2的15.1 dB [12][14] - 在计入视觉编码器参数的情况下,Dolphin总参数量仅为6.22M,相比IIANet的15.01M,参数量减少了50%以上 [12][14] - 在GPU推理延迟测试中,Dolphin处理1秒音频仅需33.24毫秒,比IIANet快4倍以上,比轻量化模型RTFS-Net也快了近50% [12][14] - 模型的计算量仅为10.89 G,相比IIANet、RTFS-Net等模型降低了50%以上 [12][14] - 在主观听感测试中,Dolphin获得了3.86的高分,远超对比模型的2.24分,证明其分离出的语音更加清晰、自然 [14] 行业影响与前景 - Dolphin的提出打破了视听语音分离领域长期存在的“参数量换性能”的固有思维,证明了轻量化模型完全有能力在性能上超越大模型 [13] - 这项工作为未来在智能眼镜、手机端侧大模型以及实时会议系统等资源受限场景中部署高精度语音分离技术,提供了全新的技术路径和理论支撑 [13]
Teamily AI 推出”北美元宝派”加强版,支持多人与多个AI Agents实时社交丨涌现新项目
36氪· 2026-02-13 15:53
公司概况与定位 - Teamily AI 是一个 AI-native 即时消息应用,其核心是构建一个“代理社交网络”,让多个人类与多个 AI 代理实时共存与协作 [1] - 公司旨在探索 AI 与人类的协作,以更有效地连接和沟通,而非在现有产品上做延长线 [3] - 公司将自己定位为社交 AI 平台,人类与 AI 代理在此共同存在、协作并进化 [5] 融资与用户情况 - 公司已累计完成 2000 万美元融资,并计划于今年3月开启新一轮融资 [2] - 上一个版本拥有 300 万注册用户,新版本正通过邀请码机制积累种子用户 [7] 产品功能与特点 - 产品功能融合了“元宝派+飞书+领英”的特点,但核心是 AI 与人类的协作 [3] - 平台能够理解跨越所有群组与频道的多模态对话(文本、图像、音乐、视频等),并输出基于语境的洞察、推荐与行动方案 [5] - 核心功能包括:跨群组记忆共享,以打破团队信息孤岛;全局记忆系统,对所有对话进行搜索、总结与回溯 [5] - 用户可构建属于自己的、类似 OpenClaw 的代理,让多个 AI 代理与人类共存于共享的代理社交网络中 [5] - 基于集体智能能力,在多人多代理的群聊中,用户与代理互动越多,代理会变得越智能 [6] 应用场景与定价 - 应用场景覆盖朋友、家庭、同事及社区,例如:为多人生成满意的晚餐方案、为家庭续写睡前故事、为同事团队并行处理市场研究等多项工作 [6] - 目前主要服务于北美市场,提供三档收费标准:免费、19.9美元和199.9美元 [6] - 免费模式提供有限对话次数,未来可能探索“看广告获取新次数”的模式 [6] 技术架构与核心壁垒 - 公司采用三层技术架构:1) 全局记忆与上下文管理;2) 社交大脑模型(专有 LLM-based 规划与预测引擎);3) 代理社交网络 [10] - 核心优势在于无需平台切换、支持上下文继承、代理可执行行动(如发邮件、预订),并强调安全易用 [11] - 核心壁垒在于对“全局记忆”的重视及在跨群技术上的激进迭代,以及对即时通讯的颠覆性设计 [12] - 在多任务并行技术方面有深厚积累,例如在一个群聊中协调6个不同工种的 Manus 类型代理同时工作,并与社交消息卡片联动 [12] - 相比大厂,创业公司优势在于能以更激进自由的态度尝试“多模型协调”,而大厂产品通常仅支持自家模型 [11] 团队背景 - 创始人何朝阳拥有南加州大学计算机科学博士学位,在机器学习、云计算、移动计算领域有研究经验,并在顶级会议发表论文,曾任职于腾讯、Google、Facebook 和百度 [13] - 另一位创始人 Salman Avestimehr 是机器学习、信息论等领域的专家,拥有超过20年研发领导经验,曾任南加州大学院长教授,并获得美国总统奖,为 IEEE 院士 [14] - 团队成员毕业于南加州大学、斯坦福、伯克利、麻省理工、清华等院校,并曾在苹果、亚马逊、谷歌、腾讯、字节等公司负责大模型或 To C 产品相关工作 [14] 创始人理念与行业观点 - 产品核心目标回归满足用户需求,最终决定用 AI 到 AI 的网络实现人到人的沟通,创造一个以人类为主的社交网络,让人与代理共生 [15] - 纯粹的 AI 到 AI 服务部分保留,例如利用全局记忆为用户创建数字分身,以寻找灵魂伴侣、工作伙伴或兴趣搭子 [15] - 认为群体智能是下一个前沿领域,由 AI 驱动的集体思考能力将释放巨大的人类生产力,带来前所未有的人类生产力跃迁 [17] - 认为未来每个人都应该拥有一支根据个人独特需求定制的 AI 代理团队,而非单一聊天机器人 [18] - 认为即时通讯工具是人类与 AI 代理天然应该共存的地方,代理应参与实时聊天,而非存在于独立工具中 [19] - 在 To C 场景中,好用的产品需要“为用户需求做设计”,这使公司不易因大模型单次升级而被覆盖 [20] - 现有社交巨头(如腾讯)选择开发新产品(如元宝派)而非在原有产品中直接集成 AI,这给了创业公司与大厂站在同一起跑线的机会 [20] - 公司目前主攻北美市场,该市场没有像微信一样的“all in one”社交应用,且预计 Meta 等巨头也会推出新的 AI 社交应用,因此不担心与社交大厂的直接竞争 [21]
姚顺宇谷歌首秀,Gemini新模型刷爆SOTA:人类仅剩7人捍卫碳基编程
36氪· 2026-02-13 15:32
谷歌Gemini 3 Deep Think模型性能突破 - 在Codeforces竞技编程平台上取得3455 Elo分数,相当于全球排名第8位,全球仅有7人的编程水平排在其前[1][2] - 在公认测试AI推理能力的前沿基准ARC-AGI-2上取得史无前例的84.6%得分,该成绩已经ARC Prize基金会验证[3][4][15] - 在Humanity's Last Exam基准测试中刷新SOTA,取得48.4%的成绩[3][4] - 在2025年国际数学奥林匹克竞赛中达到金牌水平,取得81.5%的成绩[4][15][26] - 在2025年国际物理奥林匹克竞赛笔试部分取得87.7%的成绩,在2025年国际化学奥林匹克竞赛笔试部分取得82.8%的成绩,均达到金牌级别[4][24][26] - 在MMMU-Pro多模态理解与推理基准测试中取得81.5%的成绩[4][26] - 在凝聚态理论基准CMT-Benchmark中取得50.5%的成绩[4][24][26] - 相比去年12月发布的初代Deep Think在ARC-AGI-2上45.1%的得分,新版模型在不到三个月内性能大幅提升至84.6%[19] - 在ARC-AGI-1基准上取得了96%的成绩[19] - 模型推理成本大幅降低,从初代Deep Think每项任务77.16美元的成本降低了82%,降至每项任务仅需13.62美元[21] 行业竞争格局与基准测试进展 - 在关键基准测试中,Gemini 3 Deep Think性能显著超越主要竞争对手:在ARC-AGI-2上优于Claude Opus 4.6的68.8%和GPT-5.2的52.9%[3][4] - 在Humanity's Last Exam基准上,Gemini 3 Deep Think的48.4%成绩优于Claude Opus 4.6的40.0%和GPT-5.2的34.5%[4][26] - 在Codeforces Elo评分上,Gemini 3 Deep Think的3455分显著高于Gemini 3 Pro Preview的2512分和Claude Opus 4.6的2352分[4][26] - 由于模型在ARC-AGI-1和ARC-AGI-2上表现卓越,ARC Prize基金会已在构建更难的ARC-AGI-3基准[24] 模型在科研与工程领域的实际应用 - 模型能够分析草图,对复杂形状进行建模,并直接生成用于3D打印的实体文件,例如成功打印了一个笔记本电脑支架[7] - 罗格斯大学的数学家利用该模型审阅高度专业的数学论文,成功识别出一个此前人工同行评审均未发现的细微逻辑缺陷[9] - 杜克大学的王安实验室利用该技术优化了复杂晶体生长的制备方法,成功设计出一种能够生长厚度大于100微米薄膜的工艺,达到了以往方法难以企及的精确目标[10] - 模型擅长处理科学领域中的长尾任务,例如根据输入的复杂分子结构图片准确计算出分子式[11] - 官方表示,新版Deep Think是专门开发的推理模式,旨在推动智能前沿发展,并解决科学、研究和工程领域的现代挑战[4] 核心研发团队与人才背景 - 核心研发团队中有不少华人科学家,包括95后华人科学家Yi Tay,他在团队中从事强化学习和推理方向的研究工作[27] - Yi Tay曾在Google Brain共同领导早期大语言模型项目,包括PaLM-2、UL2和Flan-2,后作为联合创始人创办AI独角兽初创公司Reka,并于一年半后重返谷歌DeepMind担任高级资深研究科学家[28] - 另一位关键参与者是清华物理系传奇特奖得主姚顺宇,他于去年9月加入谷歌DeepMind,参与了Deep Think新模型的开发[5][28] - 姚顺宇本科期间已在《Physical Review Letters》发表高水平论文,首次在国际上给出了关于非厄米系统的拓扑能带理论,博士毕业于斯坦福大学,师从知名学者,在加入谷歌前曾于Anthropic参与Claude系列模型的研发[29][30]
真机RL杀疯了,机器人自学20分钟100分,数字孪生封神
36氪· 2026-02-13 15:32
文章核心观点 - 由至简动力、北京大学、清华大学、香港科技大学联合提出的TwinRL框架,通过构建数字孪生环境来扩展机器人视觉-语言-动作模型的探索空间,解决了其在真实世界中因依赖有限演示数据而泛化能力不足的关键瓶颈 [13][15] - TwinRL框架使机器人能够在数字孪生中并行、安全地进行强化学习探索,再将学习成果迁移至真实机器人,从而在多项任务中仅需约20分钟即可达到接近100%的成功率,相比现有方法训练加速至少30%,并大幅减少人类干预需求 [22][36][39] - 至简动力通过LaST₀基座模型、ManualVLA推理执行框架和TwinRL在线进化技术,构建了“推理—执行—进化”的完整技术闭环,推动一体化VLA范式从学术研究走向真实场景落地 [49][54][55] 行业背景与问题 - 当前,视觉-语言-动作模型在机器人领域展现出良好泛化潜力,但其在真实世界部署中高度依赖昂贵、覆盖有限的人类示范数据,且难以支持长期自主学习 [4][5][27] - 一个核心问题是,即使采用在线强化学习,机器人的有效探索空间也被监督微调阶段所使用的演示数据分布牢牢限制,导致其难以在未见过的新区域进行有效探索和学习 [9][11][28] - 在真实机器人上直接进行在线强化学习存在效率低、风险高、难以并行等问题,一个探索失误可能导致硬件损坏 [17][27] TwinRL技术框架与原理 - 核心洞察在于,问题的关键不在于算法本身,而在于探索空间受限,因此提出将探索过程提前至一个可控、可扩展的数字孪生世界中 [15] - 框架第一步是探索空间扩展:使用手机采集场景并通过3D Gaussian Splatting高效重建高保真数字孪生,在此基础上生成远超人类示范覆盖范围的合成轨迹数据,在监督微调阶段就显式拓宽数据分布 [23][25][32] - 框架第二步是数字孪生中的并行在线强化学习:在部署前于数字孪生环境中执行高效并行的在线强化学习,生成多样化轨迹并迁移至真实回放缓冲区,以缓解从离线训练到在线学习的性能退化与不稳定问题 [20][21][33] - 框架第三步是Sim-to-Real引导的人类在回路探索:利用数字孪生识别失败高发但信息密集的关键状态配置,精准引导人类只在最有价值的位置进行干预,从而大幅减少无效示范和重复操作 [22][25][35] 实验性能与结果 - 在4项真实世界机器人操作任务中,TwinRL平均仅需约20分钟即可完成在线强化学习收敛,并在分布内和分布外区域均实现接近100%的成功率覆盖 [22][36][38] - 相比现有真实机器人强化学习方法,TwinRL实现了至少30%的训练加速,同时显著降低了人类干预需求 [22][39] - 消融实验表明,在监督微调阶段加入数字孪生生成的合成轨迹能显著提升成功率,例如在平衡设置下平均成功率从27%提升至57% [43] - 在面临背景杂物、光照变化等环境扰动时,经过TwinRL引导在线强化学习微调的策略表现出更强的鲁棒性,性能仅轻微下降,而仅经过监督微调的模型则出现明显性能退化 [46] 公司技术与战略布局 - 至简动力构建了具身智能“三部曲”技术闭环:LaST₀基座模型融合物理世界理解与预测,解决“边想边快速动”的难题;ManualVLA贯通推理与执行,在复杂任务上平均成功率比此前最优方法高出32%;TwinRL则实现高效在线进化 [49][50][52][53] - 这三项核心技术——LaST₀、ManualVLA、TwinRL——有机串联,构成了公司“推理—执行—进化”的VLA技术三角,旨在推动一体化VLA基础模型范式从论文走向真实产线和场景 [54][55] - 行业知情人士透露,至简动力成立半年即获得密集的顶级资本加持,目前估值已逼近独角兽阵营,这在具身智能赛道中极为罕见 [14]
元气森林唐彬森九周年内部信:2025 虽有进步,市场依旧严峻|独家
36氪· 2026-02-13 12:59
公司2025年经营成果复盘 - 2025年公司盈利能力持续提升,增长质量与效率较往年明显改善 [1] - 2024年初步验证盈利可能性,2025年在高质量增长上实现关键突破 [1][3] - 核心战略是“控费用、控价盘、控SKU”,通过主动优化资源配置、集中发力主航道,提升经营质量与抗风险能力 [1][3] 核心能力系统性提升 - 渠道深耕成效显著,形成“春耕、夏战、秋收、冬跃”的稳定业务节奏,终端执行力持续增强 [1][5] - 供应链效率不断优化,单箱成本处于行业较好水平,天津工厂二期投产、河南新厂规划进一步夯实供应底盘 [1][6] - 核心品类表现强劲:气泡水稳固基本盘;外星人电解质水、冰茶、好自在等产品增长势头良好 [1][6] - 海外市场取得稳步进展,正一步一个脚印地深入主流市场 [1][6] - 管理体系持续完善,预算、考核与流程不断优化,为高效决策与稳健运营提供支撑 [1][6] 公司经营哲学与原则 - 坚守回归商业本质,坚持“少即是多,慢就是快” [2][8] - 注重活力与纪律、速度与质量、创新与运营的平衡 [1][2][8] - 坚守产品为本、用户至上的核心价值,通过“好产品原则”为用户创造真实价值 [2][9] - 构建高效组织,强调信任与责任并重,开放创新与“说到做到、结果导向”的执行力文化融合 [8] - 将早期创新产品力与近年精细化运营能力深度结合,建立严谨的规划、执行和闭环机制 [9] 公司发展阶段与2026年方向 - 历经九年发展,公司已进入目标清晰、步伐笃定的“四十不惑”阶段 [2][11] - 2026年总体思路是不折腾、不盲目扩张,继续聚焦主航道 [2][12] - 2026年核心是深化“三控”举措,持续打磨渠道、供应链、产品与组织能力,以苦练内功、务求实效 [2][12] - 目标是全力朝着优秀饮料企业的目标稳步迈进 [1][12]
清华传奇姚顺宇立功,全新Gemini一夜血洗编程,全球仅7人能赢它
36氪· 2026-02-13 12:29
谷歌Gemini 3 Deep Think模型发布 - 谷歌DeepMind发布Gemini 3 Deep Think模型,在多个领域刷新了SOTA(State-of-the-Art)记录,标志着AI推理能力进入全新维度 [1] - 该模型在短短三个月内实现全方位性能突破 [1] 核心性能与基准测试结果 - **编程与算法**:在Codeforces竞赛中获得**3455 Elo**评分,达到世界冠军级水准,在全球人类排名中位列第7,击败了绝大多数人类选手 [7][8][10] - **抽象推理**:在ARC-AGI-2基准测试中获得**84.6%**的准确率,刷新SOTA,并获得ARC奖项基金会验证 [11][12][17] - **综合学术推理**:在“人类最后考试”(Humanity‘s Last Exam)基准测试中,在不使用工具的情况下获得**48.4%**的准确率 [10][21] - **多模态理解**:在MMMU-Pro基准测试中获得**81.5%**的准确率 [21][34] - **数学**:在2025年国际数学奥林匹克(IMO)基准测试中获得**81.5%**的准确率,达到金牌水平 [21][33][34] - **物理**:在2025年国际物理奥林匹克(理论)基准测试中获得**87.7%**的准确率 [21][34] - **化学**:在2025年国际化学奥林匹克(理论)基准测试中获得**82.8%**的准确率 [21][34] - **凝聚态物理理论**:在CMT-Benchmark测试中获得**50.5%**的准确率 [21][34] 与竞争对手的对比 - 在ARC-AGI-2基准测试中,Gemini 3 Deep Think(**84.6%**)的表现远超Gemini 3 Pro Preview(**31.1%**)、Claude Opus 4.6 Thinking Max(**68.8%**)和GPT-5.2 Thinking xhigh(**52.9%**) [17][21] - 在Codeforces Elo评分上,Gemini 3 Deep Think(**3455**)显著高于Gemini 3 Pro Preview(**2512**)和Claude Opus 4.6 Thinking Max(**2352**) [21][34] - 在高级数学证明(Advanced ProofBench)基准测试中,基于Deep Think的“AI数学家”Aletheia获得**91.9%**的准确率,远超GPT-5.2 Thinking high(**35.7%**)和Gemini 3 Pro(**30.0%**) [30] 科研与工程应用能力 - **科研辅助**:能够审查高深学术论文,并发现人类同行评审遗漏的细微逻辑漏洞 [23] - **工业设计**:可以根据草图渲染高保真、实用的3D模型(如笔记本电脑支架),并直接生成可3D打印的文件,将物理零部件建模速度提升十倍 [3][39] - **实验优化**:在杜克大学Wang Lab的测试中,成功设计出生长大于**100 μm**薄膜的配方,用于潜在的半导体材料发现 [39] - **物理模拟**:展现出强大的物理模拟能力,可以模拟光线追踪,并在单个HTML文件中构建完整的Three.js场景 [40][41][42] - **创意生成**:能够生成复杂且细节丰富的SVG矢量图像(如具有特定品种特征的鹈鹕骑自行车) [44][45][48] 技术进展与突破 - 基于初代Deep Think的“AI数学家”Aletheia已能独立撰写论文,证明了“Erdős猜想”中的多个难题,并一举攻克18大研究瓶颈 [29] - 模型在ARC-AGI-1基准测试上已达到接近饱和的**96.0%**准确率 [12][35] - 模型能够根据论文描述,为复杂的“时空循环视频Transformer”架构创建可视化方案 [36] 发布与可用性 - 目前,Google AI Ultra订阅用户可在Gemini中体验新版Deep Think [25] - 谷歌首次通过API向部分研究人员、工程师和企业开放该模型 [25] - 核心研发团队包括从Anthropic离职加入谷歌的华人学者姚顺宇 [3]
突围与重塑:2025直播电商大事记盘点
36氪· 2026-02-13 12:21
文章核心观点 2025年直播电商行业在流量红利见顶后,经历了深刻的转型与变革,合规化、专业化、多元化成为发展主线,行业从依赖个人英雄主义向比拼供应链、组织力和合规体系转变,同时技术创新、平台战略调整、新流量主体崛起以及线上线下融合探索为行业注入了新的活力[1] 平台战略与投入 - **淘宝直播加码“品质直播”**:2025年3月31日,淘宝直播宣布投入110亿元,目标实现年度成交增速超50%,未来两年成交与用户量翻倍,扶持重点聚焦用户增长、货盘优化及主播孵化三大层面[5] - **淘宝直播具体扶持措施**:在主播孵化层面,加大对优质直播间的流量、货盘及营销支持;用户增长层面,平台与机构共同投入30亿元红包助力新客增长;货盘优化层面,投入20亿元专项补贴建立爆款直播池,并引入数百万中小商家特色供给[7] - **小红书加速电商进程**:2025年,小红书通过推出“评论区蓝链”功能、将底部导航栏“热门”改为“市集”一级入口、整合组建“大商业板块”以及推出“百万免佣计划”(前100万元交易额免佣金)等一系列动作,显著加速其电商化布局[47][48][51] - **抖音千川发布智能营销产品**:2025年12月,抖音电商千川发布AI营销产品“千川・乘方”,通过策略托管、动态智能服务、精准推荐三大模块构建一站式智能营销体系,并推出技术服务费减免至0.6%及百亿优惠券补贴等惠商政策[52][53] 行业规则与治理 - **“仅退款”规则调整**:2025年4月22日,淘宝、拼多多、京东、抖音、快手五大电商平台齐发公告,调整“仅退款”规则,消费者在已收货后发起的仅退款申请将首先交由商家自主处理,平台角色从“强制裁判”转变为“后台监督者”[8] - **盲盒直播迎来严厉治理**:2025年,抖音电商对盲盒直播违规行为进行系统治理,累计断播违规直播间4000余场,清退达人账号1000余个,处置措施包括警告、商品下架、冻结佣金乃至永久清退,标志着该细分市场“野蛮生长”时代终结[27] 主播与达人生态演变 - **危机公关典范带来流量增长**:2025年1月,抖音博主@体德学院校长李维刚 在带货牛肉卷被质疑售假后,一周内完成送检、道歉并执行“假一赔十”赔付,其勇于担当的做法使其账号在半个月内粉丝增量超过400万[1][3] - **超头主播开拓银发经济新赛道**:2025年5月5日,李佳琦开设聚焦中老年人群的矩阵账号“所有爸妈的幸福家”,首场直播观看量突破174万,账号两天内粉丝量超19万,这是国内超头主播首次专门为银发人群开设专属直播间[9][11] - **家族化带货模式与矩阵孵化成效显著**:抖音达人@董艳颖 通过系统培养家族成员,采用“老号带新号”的裂变方式构建主播矩阵,其家族成员@李宝宝 在2025年618期间单日带货超1.5亿元登顶榜首[16][18] - **顶流主播独立与权力交接**:2025年8月,快手头部主播辛巴宣布“永久退网”并移交近亿粉丝账号,其家族核心主播@蛋蛋 也在之后独立,注册新公司并与辛选无股权关联,标志着行业从依赖个人向比拼组织体系转型[28][29][33] - **明星与达人跨界直播取得亮眼成绩**:2025年,艺人黄子韬跨界创立的卫生巾品牌“朵薇”直播首秀销售额达4000万元,截至近期累计销售额达1.5亿元[4];明星吴千语在小红书直播带货首秀GMV达7000万元,超过该平台此前纪录[37][39] - **数字人直播技术实现商业验证**:2025年6月15日,罗永浩的数字人在百度优选直播间进行带货直播,整场直播持续7小时,观看人次超130万,GMV突破5500万元,数字人生成了9.7万字剧本并完成8300个动作设计,证明了其销售转化能力[12][15] - **垂直内容账号成功孵化**:2025年7月,董宇辉在抖音开设垂直文化账号@兰知春序,首场直播销售额约500万元,该账号全年进行140场直播,累计观看人次达5.99亿,并曾单场GMV超越其主号@与辉同行[19][22] - **乡村赛道与新晋顶流崛起**:2025年11月8日,抖音乡村达人@李福贵 直播带货首秀总观看人次达2620.6万,预估销售额为2500万至5000万元,其中一款黄小米10分钟售出3.4万件[40][41] - **短剧演员商业价值爆发**:2025年,以柯淳、何健麒为代表的短剧顶流成为品牌合作热点,如何健麒在Babycare品牌直播间创造单场GMV超百万、观看人次超28万的业绩,其高性价比和强粉丝信任度受到品牌青睐[34][36] 公司转型与自救尝试 - **传统品牌创始人IP化自救**:2025年8月,美特斯邦威60岁创始人周成建在抖音直播间跳团舞举办新品发布会,直播最高在线人数突破20万,为其账号带来超5.2万粉丝增量,相关消息推动公司股价次日涨停[24][26] - **三只羊的多渠道探索与出海**:2025年,面临困境的三只羊尝试了视频号直播、TikTok出海(旗下达人在越南区跻身顶流)、推出自营APP“小杨臻选”以及主播在淘宝复播等多种方式,但复播后单场销售额仅近25万元,公司最终通过旗下合资公司以9.75亿美元估值被收购,获得核心达人全球独家运营权,转向深度开拓国际市场[42][44][45][46] 线上线下融合趋势 - **直播电商公司加码线下门店**:2025年12月,东方甄选确定在北京海淀区开设首家约400平米的线下旗舰店,计划展示全品类自营及第三方产品,俞敏洪表示这是未来全国百家门店的第一步试点[54];同时,交个朋友旗下品牌“重新加载”计划2026年门店突破500家,美腕旗下“奈娃家族”咖啡门店也已增至3家,行业积极探索“线上直播+线下体验”的闭环模式[55]