36氪
搜索文档
一年狂卖78亿,下沉市场又爆“金矿”,净利涨超80%
36氪· 2026-02-08 09:21
2025年度业绩概览 - 预计实现收入77.5亿元至78.5亿元,同比增长19.8%至21.3% [1] - 预计净利润4.43亿元至4.63亿元,同比增长83.7%至92.0%,利润增速显著高于营收增速 [1] - 业绩表现超出市场预期,被视作在市场红利消退后,依靠渠道纵深和效率革命驱动的阶段性胜利 [1] 增长驱动因素:渠道下沉与网络扩张 - 全国门店总数达11566家,年内净增超过1400家,扩张战略明确指向下沉市场 [3] - 打造“新型乡镇店”,面积更大,以大包装商品为主,同时面向家庭消费者(C端)和小餐馆、农家乐等经营者(B端)批发食材,形成新增长极 [3] - 万店网络产生的规模效应在采购议价、物流配送等环节释放,推动利润率攀升 [6] 增长驱动因素:产品与场景拓展 - 产品组合从火锅烧烤食材扩展至八大类别:火锅、烧烤、饮品、一人食、即烹餐包、生鲜、西餐及零食,定位为“国民社区央厨” [5] - 产品线拓展围绕“新场景”和“健康化”两个关键词,向早餐、午餐、一人食、户外露营等场景延伸,并推动数百个产品进行清洁标签升级 [5] - 通过场景延伸、产品创新与会员运营,强化用户消费频次与品牌忠诚度,构建以“在家吃饭”为核心的高频消费生态 [6] 增长驱动因素:运营效率与供应链优化 - 净利润飙升本质是商业模式内生效率的进化,体现在“降本”和“增效”两个维度 [5] - 在“降本”方面,对核心供应链推进垂直整合,采用“单品单厂”策略,自建或控股牛肉、丸滑等关键品类工厂以掌控上游成本 [5] - 在“增效”方面,自研数字化中台用于需求预测指导生产,并运营超6000万会员,通过精准营销提高用户黏性,降低获客成本 [6] - 乡镇店、无人店等新店型的复制,有助于在规模扩张中摊薄管理和运营费用 [6] 商业模式与竞争格局 - 公司售卖的是“在家吃饭的解决方案”,介于买菜做饭和餐厅堂食之间,瞄准了一个规模庞大但分散的市场 [14] - 在直接竞争对手(如其他食材超市品牌)大量出清或收缩后,公司成为细分赛道的寡头玩家 [14] - 面临来自生鲜电商(如盒马)、线下商超(如沃尔玛)等间接竞争者的分流,这些竞争者凭借齐全品类和一站式体验争夺宅家火锅需求 [14] - 线下餐厅通过“以价换量”策略降低客单价(如海底捞2024年客单价降至97.5元),一定程度上削弱了“在家吃饭”的性价比优势 [14] 风险与挑战:加盟模式管控 - 公司门店高度依赖加盟模式,据2023年招股书,加盟比例达99.9% [8] - 采用“总部配送+门店自采”的混合商品结构,豆腐、菌菇等部分生鲜品类允许加盟商自行采购 [7][10] - 庞大的加盟体系使得食品安全管控成为挑战,近期发生“买到过期豆腐”事件,公司回应称自采商品责任由加盟门店自行承担 [7] - 随着门店网络持续扩大,管理难度高速增长,可能出现因选址过密导致的客流稀释及标准化服务走样等问题 [10] 公司发展历程与未来展望 - 公司起源于2015年,创始人杨明超基于对火锅上游产业的洞察创立,2017年开设首家门店,主打“在家吃火锅”需求 [11] - 2019年开放加盟,乘“宅家经济”东风在疫情期间爆发式增长,于2023年登陆港交所 [12] - 疫情后宅家需求红利退潮,公司业绩与股价一度承压,2025年业绩回暖被视为从“风口幸运儿”向“有核心肌肉选手”的进化 [12] - 连锁零售品牌发展被分为三阶段:店铺数量增长、品类扩张提升同店销售、深耕供应链转化为工厂型供应链,公司在三个维度均已取得进展 [14] - 未来增长依赖于巩固优势、平衡扩张规模与单店质量的关系,并开发新的业态增长曲线 [15]
王慧文“点将”Clawdbot,我们和一位「中国Clawdbot」创业者聊了聊
36氪· 2026-02-08 08:34
Clawdbot/OpenClaw的爆火与行业动态 - 2026年2月,美团联合创始人王慧文发布英雄帖,瞄准并倾注热情于Clawdbot(现改名为OpenClaw)赛道 [1] - Clawdbot是2026开年最受关注的AI应用,它是一个由奥地利开发者开源的、能直接在本地设备运行的Agent框架 [2] - 其不设限的操作模式能基于用户指令和本地数据自主完成复杂任务,如运营企业、打理电商、炒股等,但也存在失控风险,例如有用户被删除所有邮件、亏光账户资金 [3] - 泼天流量下,行业迅速跟进:AI Coding平台Trickle创始人快速研发“开箱即用版”Clawdbot“HappyCapy”,官宣上线3天在X上获得**90多万**的互动量 [3] - 阿里、百度、昆仑天工等大厂纷纷发布自家“类Clawdbot”产品,不少Agent Infra创业公司也借此概念开启新一轮融资 [3] - 实在智能创始人孙林君在体验Clawdbot后,连夜研发并上线了面向办公场景的国产Clawdbot“实在Agent·无界版” [4] Agent的技术演进与核心趋势 - Agent发展经历几个阶段:从仅用大模型部分能力做角色扮演的GPTs,到在云端运行、掌握知识但无法操作本地软件的Manus,再到具备本地操作能力的Clawdbot [8] - Clawdbot爆火的核心原因是解决了Manus的局限性,赋予大模型更高的自由度,使其能在用户本地随心所欲调用各种接口和底层能力,实现真正的智能体形态 [9][10] - 关键演进趋势是“思考在云端,执行在本地” [6][14] - 执行侧(即大模型的“手脚”)必须在本地操作,才能完成如打开特定网站采集数据、通过本地通讯软件发送报告等任务,而Manus仅能调用搜索接口,报告内容质量有限 [12][13] - Agent的边界被显著扩展:从Manus的思考与执行均局限于云端,到Clawdbot可同时使用云端和本地环境的所有工具,甚至自行安装软件,覆盖场景更广,自由度更大 [28][29] Clawdbot的机遇、挑战与局限性 - **机遇**:证明了AI已可执行许多任务,让行业意识到仅调用接口或释放部分大模型能力不能算真正的智能体 [22][40] - **挑战一:高配置门槛与失控风险**:高自由度带来高风险,在企业端可控性低,直接交付复杂工作流风险过高 [6][17] - **挑战二:技术完成度与稳定性**:框架本身技术壁垒不高,但在底层能力未搞定前仅是“样子货” [6][18] - **挑战三:任务完成度与成本**:用户关注解决特定问题的性价比和ROI,而非单纯的技术前景 [19] - **局限性一:数据抓取与过程稳定性**:抓取数据可能存在缺失,过程稳定性未必能达到人类理想情况 [31][32] - **局限性二:软件接口适配**:并非所有软件都具备被大模型丝滑调用的完备接口,影响任务完成度,且像Claude的MCP框架适配工作量巨大,大厂核心业务不太可能开放供外界调用 [33][34] 本地化部署Agent的商业化与竞争格局 - **本地化部署的重要性**:许多客户软件安装在本地,且文档资料不能上传云端,因此本地化操作至关重要 [23] - **商业化模式探索**:企业先进程度的指标正从“机器人密度”转向“智能体密度”,未来可能按结果收费 [46][47][48] - **大厂未全面下场的原因**:一是想象力问题,需要极客突破;二是涉及商业边界问题,例如在阿里平台调用智能体操作京东平台较为敏感,这反而给非主流平台厂商(中立方)带来机会 [36][37] - **ToC与ToB场景差异**:ToC场景可探索,用户追求惊喜和情绪价值;ToB场景必须强调控制、精确与稳定,数据安全是首要顾虑 [38] - **未来核心竞争力**:一是产品化能力(整合基础大模型、工程化、底层能力与用户体验);二是差异化与速度,当前是“快鱼吃慢鱼”的时代,灵活的小厂凭借快速布局和贴身服务能获取良好客户资源 [49][50] - **未来形态与扩展**:Clawdbot代表的本地化Agent未来会扩展到其他硬件设备,实现云端一体、软硬一体,打破物理边界 [35][44] - **接入端侧设备的难点**:在于Agent没有“见过”足够多的设备,缺乏操作各类设备的数据 [45]
瞄准电车「加油站」,宁德时代再建万亿公共换电生态
36氪· 2026-02-07 18:25
宁德时代换电业务战略与进展 - 公司通过子公司时代电服,以“巧克力换电”模式切入电动汽车补能市场,旨在构建一个开放的补能生态,而非单打独斗 [1][3] - 公司董事长曾毓群认为,未来电车补能市场将由家充、快充和换电三分天下,公司基于电池技术优势拓展换电服务是战略延伸 [6][8] - 公司目标是在全国范围内建成30000座换电站,作为参照,全国现有加油站超过10万座 [3] 换电业务发展现状与规划 - 截至2025年底,时代电服已在45个城市建成巧克力换电站超1000个 [3] - 2026年计划新建2000个换电站,累计超过3000座,建设节奏远快于行业先行者(如蔚来汽车近10年建成3700座) [3] - 公司换电业务发展路径清晰:前期(前1000站)自主建设,中期与合作伙伴共建站点1万个,最终通过全社会共建达到3万个 [4] 商业模式与合作生态 - 公司积极引入生态合作伙伴,包括中国石化、绿能慧充、滴滴充电、广汽、蔚来等,共同建设补能生态 [1][29] - 商业模式从B端运营车市场向C端个人用车市场拓展,定位为“国民换电”,推动换电服务普及 [11][19] - 2026年将有10余款巧克力换电合作车型推出,其中一半面向个人用车市场 [5][18] - 公司与广汽、京东合作的埃安UT Supper是进军个人市场的开山之作,起售价4.99万元,搭配399元/月电池租金方案 [18] 运营效率与经营模型验证 - 2025年时代电服在重庆建成70余站,开业52站,服务近5500辆车,用户好评率超过99.8% [16] - 重庆地区单站日均换电量达到5500度电的盈亏平衡点,该城市在运营9个月后实现单城毛利转正,2025年12月全城日均换电量接近30万度 [17][18] - 公司已建立高效的工程能力,工程建设周期从24天迭代缩短至16天,拥有一支月建设能力超过300站的工程团队 [28] 标准化与产品技术优势 - 公司通过标准化电池包(20和25覆盖95%纯电车型,35覆盖轻卡)寻求行业最大公约数,实现广泛车型兼容 [10] - 换电站一次换电成功率已达到99.96%,电池包满足新国标要求,不起火、不爆炸,并经过等效120万公里振动测试 [25] - 公司利用云平台对电池进行24小时监控,可在60秒内将预警电池隔离,确保安全 [24] - 换电站选址严格,要求建在消防队十分钟到达范围内,并规避低洼易积水区域 [26] 市场机遇与战略意义 - 新能源汽车市场快速增长,2025年新能源车渗透率达52%,新能源乘用车销量1532万辆,预计2030年保有量达1.36亿辆,催生庞大的补能需求 [7] - 在纯电动汽车市场,20万元以下车型是销售主力,2025年1-11月该价位段销量超过450万辆,占纯电总销量690.6万台的大部分,公司推动“国民换电”紧密契合市场需求 [20][21] - 换电模式可填补快充(对电网负荷挑战大)和家充(覆盖率不足)的短板,截至2025年11月底家充桩1469.7万个,而同年6月新能源汽车保有量3689万辆,覆盖率不足一半 [8] - 换电生态有助于完成电池全生命周期资产管理闭环,并促进绿电消纳,据估算3万座换电站日均可消纳1.2亿度电 [6][8] 公司整体战略延伸 - 公司正从产品技术向能源服务拓展,致力于在缔造万亿级电池生意后,抓住下一个万亿级的能源服务市场 [3][28] - 公司战略聚焦于提供标准化的公共服务能力,不专属于单一车企,旨在成为全行业的补能设施 [10][28]
一张图生成游戏?谷歌Genie体验:万物皆可玩,但离“杀死游戏公司”还远
36氪· 2026-02-07 18:08
谷歌Project Genie发布及其核心能力 - 谷歌宣布向部分用户开放体验Project Genie原型版本 该AI工具能根据用户提供的照片、草图或文字描述生成可交互的虚拟世界 实现“生成即交互” [1][8] - 用户可指定游戏内角色的操作方式 如走路、骑行、飞行或开车 Project Genie会尝试理解物理规律并生成一个可供操控的世界 [11][13] - 生成的世界并非一次性产品 用户可在已有世界基础上通过修改提示词进行编辑 例如更换角色或物体 并能将生成内容导出为视频进行分享 [14][16] 市场对Project Genie的初步反应 - 消息公布后 相关游戏公司股价出现显著下跌 其中《GTA》开发商R星的母公司Take-Two Interactive股价下跌10% 在线游戏平台Roblox下跌超过12% 游戏引擎制造商Unity下跌21% [4] - 相比之下 国内厂商如网易和腾讯的股价基本未受影响 [4] Project Genie的技术原理与当前局限性 - Project Genie的核心模型Genie 3是一个采用自回归生成机制的帧生成模型 它通过分析前几帧画面来预测并生成下一帧 而非播放预渲染内容 [24] - 该模型通过学习了超过20万小时的游戏视频数据来建立操作与画面变化的关联 [26] - 当前体验存在明显缺陷 包括缺乏一致性 例如角色面部特征在短时间内发生不可控的剧烈变化 以及缺乏可靠逻辑 导致角色穿墙、陷入地板或场景出现无逻辑形变等 [27][29][31] - 谷歌为防止AI算力过载或逻辑崩坏 将玩家可生成的片段长度限制在一分钟 但即便在此限制下 记忆丢失和逻辑错误问题依然突出 [27][31] Project Genie的行业定位与潜在影响 - 该技术目前的主要价值在于为游戏设计师提供快速验证灵感的工具 对普通玩家而言 更多是一个可短暂娱乐的新鲜玩具 距离真正的沉浸式可玩性游戏尚有距离 [32] - 其意义超越了游戏创作本身 代表了人工智能从“理解静态世界”向“模拟真实世界”迈出的关键一步 是实现从被动展示到主动交互、从静态叙事到动态推演的重要进展 [33][35] - 世界模型被视为通往通用人工智能(AGI)的必经之路 其成熟形态可用于在虚拟世界中训练AI机器人完成各类任务 再将算法迁移至实体机器人 从而降低现实训练成本 [35] 行业竞争格局 - 多家科技巨头正在布局世界模型赛道 OpenAI明确其视频生成模型Sora本质上是世界模型 英伟达新推出的Cosmos模型则专注于让AI理解物理定律 [35] - 相比之下 国内游戏大厂如网易和腾讯的AI应用方向被描述为“用AI赋能游戏” 例如开发AI NPC或游戏AI对手 被认为尚未触及颠覆游戏创作流程的层面 [23]
姚顺雨的最新成果,才是腾讯发完 10 亿红包后决战 AI 的关键
36氪· 2026-02-07 16:46
腾讯混元AI团队的研究成果 - 腾讯混元团队联合复旦大学发布研究,聚焦大模型的上下文学习能力,揭示了当前AI在处理全新、非公开情境时的核心弱点[2] - 研究构建了名为CL-bench的评测基准,包含近2000个由专家精心构造、从未在互联网上公开过的“全新情境”,用于测试模型的情境学习能力[6] 大模型运作机制与上下文的重要性 - 大模型运作分为两个基本阶段:预训练阶段,模型通过阅读海量数据记住知识和模式;情境学习阶段,模型需根据用户提供的全新上下文进行实时推理和判断[3] - 上下文学习能力至关重要,因为预训练数据是静态的,而真实世界是动态的,互联网上并非应有尽有,模型必须能根据即时提供的新信息来回答问题[3] - 上下文被视为AI的灵魂,若模型记不住或理解错上下文,就会产生“幻觉”,依据其预训练记忆中的通用规则进行错误回答[6] 主流大模型在上下文学习上的表现 - 根据CL-bench排行榜,目前最先进的模型在要求其仅依据新上下文作答时,整体正确率极低[8] - GPT-5.1 (High)模型的整体正确率仅为23.7%[8][9] - Claude Opus 4.5 Thinking模型的整体正确率约为21.1%[8][9] - 其他主流模型,如GPT-5.2 (High)、o3 (High)、Kimi K2 Thinking等,整体正确率大多在10%至18%之间徘徊[8][9] 模型在情境学习中失败的原因 - 失败的主要原因之一是预训练中学到的模式“根深蒂固”,导致模型在接收新上下文时,无法有效抑制预训练数据中的固有模式[10] - 复杂逻辑的推演能力是当前技术的瓶颈,当上下文非常长、逻辑非常复杂时,模型的表现会直线下降,其解决率会暴跌[11] 腾讯发力上下文学习的战略考量 - 此次研究是前OpenAI研究员、清华姚班天才少年姚顺雨入主腾讯AI后首次署名的研究成果,体现了公司在该领域的长远布局[2][12] - 腾讯的业务根基深植于“社交”与“内容”,如微信、QQ等场景产生连绵不断、高度碎片化的对话流,这对AI的上下文理解能力提出了极高要求[14] - 在游戏与企业服务领域,腾讯同样需要AI能根据即时操作、游戏内实时局势或特定的会议纪要、私有文档进行精准分析与反应,而非机械背诵[16] - 对于拥有海量应用场景的腾讯而言,一个能在复杂上下文中保持清醒、逻辑严密的模型,比一个博学但只会死记硬背的模型具有更大的商业价值和落地潜力[16]
投中摩尔、沐曦和蓝箭,郑州赢麻了
36氪· 2026-02-07 16:34
文章核心观点 - 河南省及郑州市正通过政府引导基金等资本手段,积极布局硬科技产业,复制“合肥模式”以引入链主企业、打造产业集群,并已取得显著成效 [1][11][14] - 中原前海基金作为郑州国资参与的重要硬科技投资平台,已成功投资多个明星项目并进入收获期,其投资策略与时机把握体现了地方发展硬科技的决心与能力 [2][7][14] - 郑州通过成功案例(如上海合晶、超聚变)证明了其“投资带动产业”模式的有效性,正在全国硬科技版图中占据一席之地,并基于自身工业基础探索独特发展路径 [12][13][14] 河南省及郑州市的产业定位与战略 - 河南省不仅是农业和人口大省,更是制造业重镇,拥有41个工业大类的现代工业体系,郑州是主要承载者 [1] - 郑州在创投领域打法类似“合肥模式”,即通过引入链主项目吸引上下游配套,带动整个产业发展 [11][12] - 郑州航空港区在“十五五”规划中强调强化富士康、比亚迪、超聚变等龙头企业的创新主导作用,以提升产业核心竞争力 [12] - 郑州的硬科技布局立足自身工业底蕴、国资实力与区位优势,并非全盘照抄,正持续扩张版图 [14] 中原前海基金概况与投资表现 - 中原前海基金是郑州国资出资、前海方舟主管的硬科技基金,采用母基金与直投双重模式 [2] - 基金一期成立于2018年,注册资本56.4亿人民币,二期于2023年成立,规模超40亿人民币,两期总规模近百亿 [2][5] - 基金LP包括国企、险资及河南本地国资,如河南农业投资集团、郑州国创产业投资等,产业资方占少部分份额 [3][4] - 基金主要投向半导体、人工智能、商业航天、新能源等硬科技领域,截至2024年共出手130次,2021年为投资高峰期 [4] - 基金已进入收获期,2025年通过IPO退出项目最多,摩尔线程、沐曦股份在列 [4] - 基金回报率最高的项目是博盈特焊,2019年投资7500万元,四年后上市为基金创造超7倍回报 [4] - 基金二期完全由河南资本参与,包括郑州、南阳、鹤壁、濮阳等地共10家机构,主要投资新兴产业及成长型科技企业 [5][6] 对明星项目的投资案例与回报 - **投资时机**:2021年是半导体投资黄金年,全年融资686起(同比增约45%),融资金额达2020年的2.4倍,占当年中国硬科技总投资1/3以上 [7] - **投资沐曦股份**:2021年6月参与其近10亿元A轮融资,是众多入局机构之一 [7] - **投资摩尔线程**:2021年11月参与其当时规模20亿元的A轮融资 [7] - **持股与回报**:在上述两个GPU项目中持股占比约0.2%,但带来了超200%的回报率 [7] - **投资蓝箭航天**:2024年4月通过购买老股和增资扩股方式投资,IPO前持有其0.32%股份,投资后约两年即迎IPO [9][10] - **产业链布局**:在商业航天领域,基金早在2022-2023年已投资卫星公司微联星智、零部件商清航空天及魔方卫星,入股蓝箭航天补全了整箭厂商,完成初步全产业链布局 [10] 郑州“以投带引”的成功产业案例 - **上海合晶项目**:2016年,郑州航空港区通过兴港融创基金向上海合晶投资7亿元,成为其第二大股东(持股29.86%),资金用于建设郑州合晶8英寸硅片生产基地 [12] - **项目成效**:郑州合晶已成为国内重要硅片生产基地,填补了河南高端半导体硅材料空白 [12][13] - **资本回报**:上海合晶2024年2月科创板上市,截至2025年1月27日市值近170亿元,为兴港融创基金带来账面浮盈超40亿元 [12] - **产业生态**:项目推动了“硅材料—芯片制造—智能终端”完整生态链形成,促进了电子信息产业链集聚 [13] - **超聚变项目**:2021年11月,郑州引入从华为拆分出的超聚变,其控股股东为河南本地企业(持股31.38%) [13] - **落地速度**:项目落地后仅55天,郑州产线首台服务器下线并形成规模量产 [13] - **集群效应**:超聚变落地吸引了其上下游合作伙伴,共计引入11家产业链企业至河南,形成“投资一个、引来一串、落地一片”的滚雪球效应 [13] - **产业增长**:2025年上半年,以超聚变为代表的先进计算产业链增加值同比增长58.6%,增速在河南28条重点产业链中居首 [14] - **资本化进展**:2026年初,超聚变正式启动A股上市辅导,向IPO发起冲击 [14]
深扒Rentahuman,AI 雇佣人类是假,币圈“割韭菜”才是真?
36氪· 2026-02-07 16:16
行业背景与概念兴起 - AI Agent经济生态在OpenClaw爆火后快速发展,相关项目如雨后春笋般涌现[2] - Moltbook项目证明了AI Agent可以形成数字社会与社交结构[2][5] - RentAHuman平台的出现,标志着AI Agent的能力从数字社交延伸至物理世界雇佣人类[5] RentAHuman平台运营数据与模式 - 平台注册用户数从周一的130人飙升至两天后的7万人,网站访问量突破140万次[2] - 截至发稿,平台上有70到80个Agent,注册的“可租赁人类”已超过8万人[6] - 平台模式类似外卖平台,Agent根据技能、位置等信息下单,让人类替其完成现实世界工作[4] - 支付通过加密货币钱包进行,主要使用稳定币或以太坊[9] 平台需求与任务真实性分析 - 平台绝大多数任务并非来自真实市场需求,而是来自与创始人有关联的圈内人士的营销噱头[7] - 平台Agent背后多为科技从业者、加密货币爱好者等个人用户,有实际需求的企业用户几乎不存在[6] - 平台可见档案只有83个,实际连接加密钱包的人数远低于8万注册数,表明大部分注册者为围观者[9] - 平台任务执行和验证机制存在严重问题,有悬赏40美元的任务收到3份申请但两天后仍未完成[7] 平台任务案例与性质 - 一个名为Addi的Agent发布向Anthropic总部递送鲜花的任务,预算110美元[6] - 存在测试网站并关注X账号的任务,报酬1到2美元,本质是利用AI外壳进行廉价营销[6] - 存在“竞赛”式任务,多人竞争但仅一人获酬,其他人的劳动完全无偿[10] - 存在明显为制造话题的任务,如举牌拍照报酬100美元[11] 平台开发背景与潜在动机 - 网站开发者Alexander Liteplo是Risk Labs(UMA Protocol和Across Protocol开发团队)的软件工程师[14] - 平台展示的“真实公司使用案例”是Risk Labs,存在自我引用[21] - 平台可能本质是UMA生态系统的一个营销工具,旨在为UMA Protocol制造话题和关注度[21][22][24] - 其出现时机巧妙,借助了OpenClaw和Moltbook带来的“Agent经济”风口[24][25] 平台商业模式与核心挑战 - 平台供需严重失衡,大量注册人类工作者(超8万)面对极少数实验性Agent(70-80个),绝大多数注册者无法接到任务[27] - 平台缺乏信任机制,如评分系统、身份验证、保险和争议解决流程,所有风险由人类工作者承担[10][27][28] - 支付采用不可逆的加密货币,工作者在发生纠纷时几乎没有追索权[9][28] - 平台未考虑工作者安全问题及任务合法性审核,法律与伦理风险巨大[28][30] 概念验证与行业影响 - 平台技术架构粗糙,商业模式模糊,但已成功完成“概念验证”,展示了Agent与物理世界交互的可行性并引发极高社会关注[30] - 平台通过制造“AI雇佣人类”的叙事,成功将UMA Protocol及相关方置于行业讨论中心[24][26] - 该案例反映了“叙事驱动”在加密货币领域的影响力,即吸引眼球的概念能推高相关代币关注度,与实际落地关联不大[23][24] - 平台如同一面镜子,映照出市场对AI未来(如Agent拥有法律人格、驱动零工经济)的焦虑与想象[31][32]
全球AI开发者新宠:阶跃星辰Step 3.5 Flash,两天登顶OpenRouter趋势榜
36氪· 2026-02-07 13:05
模型市场表现与用户认可 - 阶跃星辰开源模型Step 3.5 Flash发布后市场反响热烈,在OpenRouter平台首日即登上“Fastest Models”全球最快模型之列,并在两天内登顶“Trending”全球趋势榜第一[1] - OpenRouter的Trending全球趋势榜不关注参数或跑分,只反映开发者和用户调用模型的实际情况,Step 3.5 Flash登顶此榜单证明了其在实际应用中的“有用”和“好用”[3] - 在OpenRouter的LLM Leaderboard上,Step 3.5 Flash(免费)以12.5B tokens的调用量位列第一,远超榜单上其他模型,显示了开发者和用户用实际API调用进行的“投票”[2] - 一线开发者和用户对模型的关注点从跑分转向实际应用表现,在Agent、深度研究、自动化工作流等场景中集体选择Step 3.5 Flash,表明模型在复杂任务中的实际可用性受到认可[21][28] 模型核心技术与架构创新 - Step 3.5 Flash采用稀疏混合专家(MoE)架构,总参数量为1960亿,但在处理每个Token时仅激活110亿参数,实现了以较小计算成本获得前沿模型智能水平的效果[4] - 模型通过3:1滑动窗口与全局注意力混合架构(SWA+Full Attention)实现了256K长上下文的高效处理,能极大节省显存,解决了Agent时代成本与效果的倒挂难题[7] - 模型引入了MTP-3(三路多Token预测)技术,允许在生成当前内容时同时预测后续多个Token,这不仅提升了生成速度,更增强了模型在多轮推理中的连贯性,减少了“卡顿”和“失忆”[9] - 测试显示Step 3.5 Flash支持100–300 TPS的生成吞吐量,部分场景下最高可达350 TPS,远超去年50-100 TPS的主流水平,在OpenRouter的速度榜单上位列第九,速度为167 tok/s[7][8] 模型性能与实测效果 - 根据基准测试,Step 3.5 Flash在数学推理(AIME 2025评分97.3)和代码修复(SWE-bench Verified达到74.4%)上表现优异,其PaCoRe强化版甚至将AIME 2025成绩提高到几近满分的99.9[4] - 在实际应用测试中,Step 3.5 Flash能够准确还原不同设计风格的差异并进行持续迭代优化,甚至能生成功能完备的浏览器操作系统(WebOS),并在测试中是唯一能正常运行经典游戏“Memory Game”的模型[10] - 模型在本地部署(如在128GB内存的Mac M3 Max上)实际效果远超预期,性能可达硬件理论效率的70%,并且具有很低的幻觉率和多语言混用场景下的低错误率[14] - 在Agent场景测试中,模型展现出纠错与自我改进能力,例如在生成游戏时,能通过提示词反馈在初始版本基础上进行迭代优化,使开发质量爆发式提高[22] 公司战略与行业趋势 - 阶跃星辰团队意识到不同智能阶段需要不同的基础模型结构,L1 Chatbot时代的设计不适用于L2 Reasoner,而L3 Agent时代需要新的基模结构,因此Step 3.5 Flash的训练目标直接锚定了强逻辑、高效长上下文处理和快速推理能力[22] - 模型的结构设计(如MoE、MTP-3、工程化的长上下文方案)并非为了追逐跑分,而是为了让模型在复杂的多轮任务中持续工作,做到不掉速、不失忆、不乱编,以满足Agent时代的需求[26] - 行业重心正在从对话向工作流迁移,自2025年开始,模型开始大规模引入工作流,开发者更看重Token,用户则希望AI能直接处理改代码、跨平台流程等复杂任务[27] - Step 3.5 Flash的成功表明,AI的成功取决于其帮助人类提高效率的程度,大模型需要褪去“炫技”外壳,转变为真正好用的生产力工具[29]
健身练得越杂,越健康
36氪· 2026-02-07 12:11
行业趋势:健身理念从“专业化”向“杂食化”演变 - 健身行业正经历从追求单一运动模式的专业化,向追求多种身体能力综合发展的“杂食”健身转变[2][3] - “杂食”健身鼓励训练者广泛摄取力量、耐力、柔韧、协调、心肺及心性练习等多种“营养”,以构建更综合的身体能力[3] - 健身的核心目标从专注于改造身体局部的“技术活”,演变为探索身心整体可能性的“开放式实验”[5] 用户行为:资深健身者成为“杂食”主力,需求向功能性与社交性迁移 - 资深健身者是“杂食”健身的主要实践者,其每周训练计划常混合力量、HYROX、动物流、棒铃、八段锦等多种模式[6] - 用户健身需求发生深层转变,从追求“更好看”转向追求“更好用”,即身体的功能性表现[9] - 现代健身者追求可量化的综合表现与强社群归属感,HYROX、斯巴达DEKA、CrossFit等赛事和训练模式因此流行[9] - 健身成果的定义从健身房内的体型或数据,越来越多地转向由“生活表现”来检验,如搬运重物、陪孩子玩耍、长途徒步等[19] 训练逻辑:“杂食”健身的生理与心理科学基础 - “杂食”健身的核心逻辑是“兼容而非覆盖”,旨在通过不同运动模式的刺激构建无短板、抗脆弱的身体功能网络[6] - 从生理层面看,长期单一训练会导致身体产生高度特异性适应,但可能伴随其他能力的丧失或慢性损伤,并迅速遭遇“适应性瓶颈”[14] - 一项针对超过10万名参与者长达30年的研究发现,运动种类最多的人相比运动种类最少的人,过早死亡的风险降低了19%[17] - 从心理层面看,“杂食”健身通过持续的新鲜感与阶梯式技能学习提供心理奖赏,是预防训练倦怠的最佳方式[18] 商业模式与产品机会:综合体能与混合赛事兴起 - HYROX作为一项结合1公里跑步与1个功能项目(如推雪橇)的混氧赛事,对参赛者的肌肉耐力和心肺耐力提出综合要求,其爆火反映了市场对混合体能挑战的需求[9] - 斯巴达DEKA的十项体能挑战、CrossFit的每日训练计划(WOD)提供了清晰的衡量标尺和不断变化的新鲜挑战,满足了用户对可量化表现和社群体验的需求[9] - 杂食健身所培养的混合体能(力量、耐力、敏捷、平衡与恢复能力组合)成为高阶生活功能性的基石,相关赛事模拟了拖拽、搬运等真实世界任务[21] 用户实践与价值体现:跨项目能力迁移与身心平衡 - 健身者通过“杂食”训练实现能力迁移,例如攀岩者进行力量训练提高指力,巴西柔术习者通过瑜伽提升关节活动度,力量训练者使用棒铃发展动态不稳定负载下的力量[12] - 身心类练习(如八段锦、瑜伽、冥想)成为“杂食”训练的重要收束,不仅作为物理恢复手段,更提供了神经恢复,帮助训练者在努力与放松间找到平衡[13] - “杂食”健身让训练者获得更多选择和尝试新运动项目的机会,享受“我可以”的掌控感,资深从业者认为这对于没有竞技目标的大部分群体而言是更聪明和高效的方法[10][21]
索尼手机已经断气了,只有索尼自己不知道
36氪· 2026-02-07 12:00
索尼移动业务战略转型 - 索尼移动业务正在从大众消费品市场撤退 其全球多个地区的官方社交媒体账号在2025年陆续被注销或停更 这被视为品牌撤离市场的前奏[2][4] - 公司正在进行销售策略重构 计划放弃需要大规模营销和售后支撑的区域 从一家“手机制造商”退化为“小众工具供应商”[8] - 索尼手机在全球主要市场包括其日本本土的市占率均已落入“Others”类别 无法与苹果、三星及中国厂商竞争[8] Xperia产品市场表现与定位 - 整合了手机、影像和电视三大部门技术的Xperia 1系列自诞生以来 销量表现不佳[6] - 新款Xperia 1 VIII预计将于2025年5月发布 但已无缘主流市场[12] - Xperia产品坚持一些非大众消费导向的设计 如19.5:9窄比例屏幕、最高2TB的SD卡拓展能力及专业“大师功能” 这些特点主要面向专业或极客用户[14] 索尼坚持手机业务的深层逻辑 - 索尼集团CFO在2025财年第一财季电话会议上重申 Xperia智能手机业务对公司非常重要 计划继续发展[11] - 索尼仍是高通旗舰芯片的首批客户 其名字出现在骁龙8 Elite Gen 5的客户列表中[10][12] - Xperia业务存在的核心逻辑不在于消费市场销量 而在于作为技术“标杆”或“展台” 其本质是为索尼自家移动端CMOS传感器产品制作的一个“精美橱窗” 主要面向其他手机厂商[12] - 索尼通过新品堆砌尖端技术 旨在向采购零部件的厂商展示其硬件能力 同时卖给少数死忠粉丝[16]