Workflow
Agent
icon
搜索文档
为什么 ClawdBot 能带火 Mac mini?叶天奇聊 Agent 电脑丨100 个 AI 创业者
晚点LatePost· 2026-02-05 22:35
文章核心观点 - 文章介绍了一家名为Pamir AI的初创公司,其核心产品是一款售价250美元、计算器大小的专用硬件设备,旨在为AI Agent提供独立的物理计算终端,以解决与云端或共享电脑运行Agent相关的成本、隐私和功能限制问题,并最终可能定义下一代计算设备形态 [5][7][10][13] 公司概况与创始人背景 - 公司名称Pamir AI,创始人叶天奇,1997年出生,毕业于美国普渡大学机械工程与控制理论专业,曾任职于高通,具备从机械到神经网络的全栈能力 [6] - 公司核心团队仅4人(包括创始人),目前估值2500万美元,累计获得260万美元投资 [7][15] - 创始人经历多种AI项目尝试后,回归自身硬件禀赋,认为“创业者与点子匹配度”至关重要 [6] 产品定位与核心功能 - 产品是一款微型硬件盒子,本质是一台微型Linux电脑,95%的任务可在本地设备执行,能7x24小时持续在线 [7][10] - 核心定位是为AI Agent提供独立的“电脑”,实现物理隔离、隐私保护(通过硬件加密和版本回滚)并提供硬件接口 [10][14] - 与云端方案(如Manus)相比,本地运行无需持续费用,类似“买房”与“租房”的区别;与运行在Mac mini等通用电脑的方案相比,具备直接连接并控制外部物理设备的能力 [11] 技术路径与战略选择 - 公司战略放弃竞争激烈的“Agent层”软件(如ClawdBot),认为这是躺在大厂的“火车轨道”上,属于短期的技术投机,长期会被大厂超越 [5][17][18] - 选择为Agent提供“Runtime”和物理设备,专注于打造“Agent电脑”这一硬件基础设施,认为其Agent层应是可“热拔插”的,以适配未来百花齐放的Agent生态 [5][17] - 在记忆处理等具体技术上,摒弃了ClawdBot高度工程化、高token消耗的方案,追求更接近人类记笔记方式的零散化、碎片化记忆模式 [19] 市场验证与用户场景 - 产品目前处于手工制作阶段,月销量约200台,通过黑客松口碑和Instagram广告获客,转化率高,“打广告15分钟就开始有人下单” [15] - 当前用户主要包括三类:开发者(用于后台自动化写代码)、电子发烧友与创作者(用于为硬件编写程序)、知识工作者(作为本地“智能硬盘”处理文件) [12] - 产品通过物理接口(如USB)连接并“Hack”外部硬件的能力是早期吸引投资人的亮点,例如重写打印机驱动使其打印复杂图形,或控制LED灯带 [11] 商业模式与发展规划 - 商业模式以硬件销售为主,未来通过深圳供应链量产,目标达到50%的毛利率 [15] - 计划于2026年6月量产下一代产品,并计划对产品功能进行收敛,砍掉部分为“Hack”服务的接口,更聚焦于“电脑”的核心属性 [13][15] - 公司认为Agent生态是高速增长领域,即使自身短期无进展,公司价值也会随生态成长而增长,这是其追求的“复利价值” [20][21] 行业洞察与未来愿景 - 行业现象:ClawdBot等Agent软件的流行,带动了用户将其运行在旧电脑或Mac mini上的需求,验证了Agent需要独立计算设备的市场 [10] - 公司终极愿景是定义下一代计算设备形态,成为一个“无情的工作机器”,取代现有笔记本电脑,与手机、iPad或AR眼镜等前端显示设备配合,后台专注执行任务 [13][23] - 投资人(五源资本孟醒)认为,“Agent电脑”是一个合理且高频的赛道,而硬件Hack是更长尾的场景,最终产品需要覆盖全场景,从极客市场走向大众市场 [13][15]
深度讨论 OpenClaw:高价值 Agent 解锁 10x Token 消耗,Anthropic 超越微软之路开启
海外独角兽· 2026-02-05 20:18
文章核心观点 高价值AI Agent在2026年初已展现出远超预期的效果,开始直接接管复杂任务并嵌入核心工作流,对现有SaaS形态与人机分工方式构成实质性冲击[3][4] 文章从底层视角探讨了Agent的价值边界、基础设施机会、Token消耗爆炸性增长及商业模式变化等重要问题[4] 一、高价值Agent的产品形态与市场影响 - **OpenClaw的核心巧思在于预装Claude Skills生态**,这类似于早期智能手机预装应用超市来降低用户门槛[4][10] 其设计实现了**个人化基础上的长程任务执行**,可7x24小时持续运行,并从工具变为主动Agent[8] 通过**IM Gateway嵌入用户日常沟通流**,实现了“移动指挥,本地执行”的混合场景[8][10] - **OpenClaw与Manus代表了两种发展路径**:OpenClaw是去中心化、高度可配置的路线,能利用分散硬件资源(如个人闲置的Mac Mini)[11] Manus是中心化、“交钥匙”体验的路线,已积累大量高价值用户场景数据,构成认知壁垒[11][12] 两者可能不是取代关系,而是动态演化[11] - **Anthropic的产品策略瞄准高价值场景**,其Claude Code Cowork和Claude in Excel可能打开“10倍微软”的市场[4][14] Claude Code的核心理念是“Code is everything,Bash is all you need”,直接利用命令行执行任务[15] Cowork是其自然延伸,依赖于Opus 4.5能力的飞跃[15] - **Excel是生产力的放大和延伸**,覆盖人群比Coding更广[16] Claude in Excel的核心逻辑是利用Agent通过代码直接操作数据,绕过传统软件复杂的UI交互[16][17] 这种模式可能对试图切分Excel数据分析功能的SaaS公司(如Airtable)构成比微软更大的冲击[20] 但标准传输格式(如.xls)和Human-in-the-loop的校验机制依然重要,这意味着Agent会以插件形式嵌入成熟生态[18] 二、商业模式与定价逻辑的转变 - **高价值Agent的定价逻辑脱离传统SaaS**,开始向“数字员工”价值靠拢[21] 市场已出现定价在**1000至2000美元/月**的高价值Agent服务,有团队人均Token消费已达到**500美元/月**[21] - **Agent的收入来源发生根本性转移**,从切分企业营销或IT预算,转向切分企业庞大的**工资(劳动力)预算**[22] - **高价值Agent必须由真正的行业专家主导**,因为他们具备极深的行业Know-how,能做好Context Engineering并评估AI产出质量[22] 三、Token消耗的爆炸性增长与行业影响 - **2026年Token消耗量预计将有10倍甚至更多的增长**[23] Long-horizon task、Proactive Agents以及多模态是主要驱动力[23] - **开源模型“下限达标”是Token消耗暴涨的重要动力**[24] 智谱GLM-4.7的发布标志着开源模型首次真正触达了在Coding和Agentic场景中的“可用下限”[25] 这将使厂商有机会通过开源模型建立独立的盈利闭环,并倒逼闭源厂商加速冲击能力上限[27] - **Token消耗量是衡量AI-native程度的核心指标**,使用Token的比例越大说明越AI Native[28][29] 传统Chat模式与Agentic模式消耗的Token量级差异巨大,后者是前者的**百倍甚至千倍**[31] 已有单用户Token日均消耗达到**十亿(billion)级别**的案例,未来单人控制的Agent消耗**100亿(10B)甚至更高量级Token**将不再是难事[31] - **Token价值开始出现分化**:模型“压缩”使得小参数模型的Token价值快速逼近大模型;专用推理芯片(如Cerebras)下的Token概念也与英伟达GPU场景不同[33] - **硬件供应可能成为制约瓶颈**,在Agent爆发的驱动下,预计未来一年内GPU将再次进入“买不到”的紧缺状态[37] 四、Agent基础设施的缺失与机会 - **现有互联网基础设施对Agent处于“敌对”状态**,因为数字世界原是为人类设计[38] Agent面临跨平台任务执行困难、网络安全产品未适配、执行长程任务脆弱等问题[38] - **Infra的缺失催生巨大确定性新机会**,包括“构建Agent的Infra”和“给Agent用的Infra”[40] 例如专门为Agent优化的浏览器环境(如BrowserUse)、专用网络和支付系统[40] - **高阶Infra需求是“主动对齐”**,即Agent能主动构建用户数字分身,理解其思维习惯和隐性知识[42] - **Agent沙盒(Sandbox)的演进推高了CPU使用量**,但因其进入门槛低、CPU供应充足且定价无溢价,并未构成高壁垒的独立机会[42][43] 五、隐私与安全范式的转移 - **用户正进入“隐私换效率”的时代**,为了让Agent更好地理解上下文并自动执行任务,愿意让渡极高权限[44] 例如让AI直接操作股票账户,或赋予Agent读取本地所有文件的权限[44] - **当前Agent生态处于类似互联网早期的“田园时代”**,用户为便利而“裸奔”,安全威胁(如恶意软件、钓鱼攻击)预计会大幅增加[47] 行业可能需要经历严重的安全事故才能真正重视安全[47] 六、软件行业的未来:被吞噬还是退化为工具? - **激进派观点认为“软件将被吞噬”**:当Agent能直接操作数据和API时,为人类设计的复杂UI及中间业务逻辑封装将变得毫无意义[48] 传统软件开发中的精细化分工(前端、后端、测试、UI)将失去存在基础[48] 像腾讯TAPD这类项目管理工具或许将不再被需要[49] - **保守派观点认为“软件将退化为工具和数据库”**:软件具备100%准确性、绝对稳定性和流程固化能力,这是概率性Agent无法替代的[52] 在企业里,软件会更多地由Agent通过代码来驱动和操作[52] - **软件的未来壁垒在于“本体论”**:对于To B业务,需要定义清楚企业内部的组织逻辑、隐私边界和业务上下文;在To C领域,则是如何理解个人隐私[52] 七、实现Agent泛化的三种推演路径 - **思路1:人群分层渗透**,针对不同人群出现三种平行产品形态[54]:面向硬核技术人员的Claude Code[54];面向知识工作者的Manus[54];以及最具爆发潜力、以OpenClaw为代表的IM Bot,试图利用社交网络效应实现大众化破圈[55] - **思路2:关于普及形态的争论**:“电脑派”认为Agent普及是从精英向大众缓慢渗透的过程,用户需要学习[56];“手机派”认为Agent必须像智能手机一样做到“零门槛”,可能需要等待科技巨头打造OS级别的深度封装Agent[57][58] - **思路3:屏幕只是过渡,实体机器人才是未来** 目前的屏幕内Agent是为不完美的数字基建“填坑”的临时方案[58] Agent的终极形态必须是进入物理世界,解决实际的交互与体力劳动问题[59]
印奇挂帅阶跃星辰一周抛“端侧王牌”:Step 3.5 Flash演示“网购比价”
每日经济新闻· 2026-02-05 20:01
公司动态:阶跃星辰发布Step3.5Flash模型 - 阶跃星辰正式发布开源Agent基座模型Step3.5Flash,该模型具备350TPS推理速度、1960亿参数稀疏MoE架构及256K上下文处理能力 [1] - 模型在单请求代码类任务中推理速度最高可达350TPS,在Agent场景和数学任务上表现可媲美主流闭源大模型 [1] - 模型在数学与推理能力、编码能力、智能Agent能力上的基准测试成绩均排在前列 [1] - Step3.5Flash能够高效处理256K上下文,胜任复杂、长逻辑链条任务 [1] 技术特点与性能 - Step3.5Flash模型采用MoE架构,能以更低功耗提供更深的思考,其350TPS的生成速度解决了终端侧的“打字机效应” [2] - 作为对比,主流大中型模型的文字回复速度平均为每秒20~80个token,轻量级模型平均为每秒80~150个token [2] - 350TPS的高速度意味着首字延迟更短,语音交互能实现瞬时响应,跨多个Agent间的“内部对话”速度极快 [2] - 在车载语音交互或手机实时翻译场景下,低于100ms的首字延迟才能提供丝滑的人机对话体验 [2] 应用场景与演示 - Step3.5Flash可以快速计算复杂数学题并输出正确答案,并能基于文字提示词进行智能体编程并输出可视化平台结果 [2] - 在演示中,模型作为“云端大脑”将“对比Mac Mini M4在各大电商平台价格”的复杂需求拆解成针对淘宝、京东和拼多多的子任务,汇总后识别出拼多多为最低价平台并提供购买指南 [3] - 这种云端规划降低了本地StepGUI的执行难度,使其在从各应用抓取实时数据时获得更高成功率 [3] - 模型展示的网购比价本质是对复杂长链条任务的拆解能力,其Agent智能能够理解“比价”背后的逻辑(搜价格、算优惠、比库存) [3] 战略定位与行业背景 - Step3.5Flash的发布标志着国产模型从“参数崇拜”转向“智能密度”竞争,即从“更大”转变为“更聪明” [2] - 阶跃星辰的新模型彰显其以部署成本效率解决Agent落地痛点的尝试,通过稀疏MoE与MTP-3等技术在降低激活参数的同时实现高速推理,并坚持全面开源 [6] - 公司押注终端场景,已与OPPO、吉利等合作探索手机、汽车等终端侧Agent应用 [6] - 随着50亿元融资落地和产业资本进入,阶跃星辰的重心正快速向手机、PC及智能座舱倾斜 [7] - 新模型发布是阶跃星辰不再单纯“卷”万亿参数闭源大模型的明确信号,转而追求“能跑在端侧的顶级智力” [7] 行业竞争格局 - 智能体能力已成为头部公司竞相角逐的核心,行业处于围绕Agent的“卡位战” [4] - 阿里巴巴发布旗舰推理模型Qwen3-Max-Thinking,宣称其在Agent能力基准测试中刷新SOTA纪录 [5] - 月之暗面开源万亿参数的多模态模型Kimi K2.5,同样宣布在开源Agent场景中取得SOTA表现 [5] - 阿里巴巴强调“模型+生态”闭环,其千问App全面接入淘宝、支付宝、高德等业务,整合超400项服务 [5] - 月之暗面的Kimi K2.5模型能够即时创建并协调上百个专项Agent并行工作,实现从“单一智能体”到“智能体集群”演进 [6] 商业化前景与挑战 - Step3.5Flash的应用场景对用户有吸引力,未来能与电商等App融合,从而用AI增加电商获客量,有可能实现商业化落地 [3] - 模型在技术上已能在128GB RAM的设备上流畅运行,但现实挑战在于如何让淘宝、京东、美团等平台对Agent开放深层数据权限 [4] - 专家倡议互联网巨头提供标准商业API接口、MCP接口,让Agent能真正站在个人用户角度提供更好的贴身服务 [4] - Step3.5Flash接入类似“豆包手机”这样的深度定制化终端在技术上并非难题,最大的挑战来自“生态主权” [3] - 如果阶跃星辰继续采用开源战略,或许能抢夺AI新硬件市场的“安卓地位” [7]
连续三日净流入超亿元,科创人工智能ETF华夏(589010)低位盘整
每日经济新闻· 2026-02-05 11:37
科创人工智能ETF华夏(589010)市场表现 - 该ETF开盘下探后低位盘整,最新价报1.510元,较开盘价下跌2.202% [1] - 其跟踪的30只成分股中27只下跌,芯原股份跌超6%,凌云光、云天励飞、天准科技跌幅居前,石头科技、新点软件、恒玄科技上涨形成支撑 [1] - 该ETF成交额达4128万元,换手率1.65%,成交活跃度维持高位,且连续三日资金净流入超亿元,显示资金低位布局意愿强烈 [1] 人工智能行业动态与趋势 - 开源语言模型“OpenScholar”诞生,其文献综述能力超越商用大语言模型,引文准确率与人类专家相近,实验中GPT4o引文幻觉出现率达78%至90% [1] - 通用及垂直领域Agent渗透加速、融资活跃,相关企业已推出办公场景产品,未来将向多智能体协同、执行边界突破、大厂与独立厂商共存三大趋势演进 [2] - 持续看好Agent对AI产业链的带动作用 [2] 科创人工智能ETF华夏(589010)产品特征 - 该ETF紧密跟踪上证科创板人工智能指数,覆盖全产业链优质企业 [2] - 该指数成分股兼具高研发投入与政策红利支持 [2] - 该ETF具备20%涨跌幅与中小盘弹性,有助于捕捉AI产业“奇点时刻” [2]
中金:如何看待国内Chatbot“大战”?
新浪财经· 2026-02-05 07:58
国内Chatbot竞争格局核心观点 - 基于豆包独特的“始于EQ,兼容IQ”产品定位及其在用户规模、粘性、留存率等全方位领先的数据,国内Chatbot竞争格局或已初定,其他应用难以显著缩小与豆包的规模差距 [1][7][50] 主要参与者春节竞争策略 - **字节跳动(豆包)**:2025年12月24日,豆包DAU突破1亿,成为国内首个达成此数据的独立AI应用;2025年12月29日,官宣旗下火山引擎成为2026年总台春晚独家AI云合作伙伴,豆包将同步上线春晚互动玩法 [4][54] - **腾讯(元宝)**:2026年1月26日公布“社交+红包”春节组合拳,上线“元宝派”社交功能,并于2月1日启动“上元宝,分10亿”现金红包活动,旨在通过社交裂变获取增长 [6][55] - **阿里巴巴(千问)**:2025年12月初成立“千问C端事业群”;2026年1月15日全面接入淘宝、支付宝等生态应用,上线超400项“AI办事”功能;2026年2月2日宣布启动投入高达30亿元人民币的“春节请客计划”,并于2月3日宣布独家冠名四家省级卫视春晚 [4][6][54][56] 豆包的产品定位与差异化优势 - **定位“始于EQ,兼容IQ”**:将大模型的理性智能能力(如编程、逻辑)类比为IQ,感性陪伴、鼓励等维度定义为EQ;豆包从产品定义、模型能力等维度更强调“情绪和EQ”,这成为其核心差异化优势 [1][8][57] - **产品设计体现EQ优先**:豆包是主流Chatbot中唯一有拟人化形象(默认音色和形象“桃子”)的产品;其设计核心借鉴Character.ai,强调AI应更“拟人化”和“有人味”,与ChatGPT等偏向效率工具的产品形成差异 [9][58] - **多模态与语音能力领先**:豆包在多模态,特别是语音端到端模型维度领先,其豆包语音1.5版本(2025年1月)的聊天拟人化程度已超越GPT-4o;在可使用音色、方言数量(如支持4种方言交流,听懂18种方言)等多维度显著领先于元宝和千问 [15][16][62][63] - **IQ能力保持第一梯队**:尽管强调EQ,但豆包在模型基础能力、多模态、长文本处理等IQ(功能性)维度仍处于国内第一梯队,不弱于主要竞争对手 [19][20][65][66] 用户数据验证产品定位成功 - **用户规模领先**:2025年12月,豆包DAU突破1亿,且属于字节历史上投流相对克制的产品 [2][22][50][70] - **用户粘性断档式领先**:2025年12月,豆包DAU/MAU超过30%,且仍在持续提升,显著领先其他竞品约15%的水平;新用户30日留存率也明显领先 [2][22][50][70] - **使用行为验证定位**:豆包用户使用峰值出现在晚上休息时间,而DeepSeek等效率工具类应用峰值在白天工作时间,印证了豆包“始于EQ,兼容IQ”的定位更偏向生活陪伴 [22][70] 竞争壁垒与追赶难度 - **追赶涉及主客观多重因素**:主观上,竞品(千问强调“办事”、元宝侧重“社交”)可能因战略认知、路径依赖或对“情感化”优先级认同不足,并未显著模仿豆包定位 [29][75];客观上,豆包的“高情商”是模型、产品、工程化、大数据等多项优化的综合结果,竞品需系统性追赶,难以实现单点突破 [2][29][51][75] - **数据飞轮可能扩大优势**:若豆包基于现有用户规模优势进入数据成长飞轮,龙头与追赶者的差距可能进一步加大 [29][75] - **公司方法论构成底层优势**:字节跳动在AI助手领域投入更坚决、容错空间大、探索激进,其基于用户数据AB测试的产品方法论,使豆包定位源于真实用户反馈而非预设;相比之下,部分竞品呈现“前期探索保守,后期营销激进”的战略矛盾 [30][69][76] 海外市场拓展(Dola) - **产品与定位**:Dola是豆包的海外版本,界面和功能相似,同样配备丰富的官方智能体和拟人化音色选择;其图像生成功能获得用户好评 [36][82] - **用户增长**:2025年底,Dola的DAU已突破1000万,MAU合计达到5593万人,成为与Grok、Character.ai量级相当的第二梯队海外AI应用 [38][84] - **市场策略**:采取“新兴市场优先”策略,聚焦印尼、墨西哥等AI助手渗透率低、移动互联网高速增长的地区,避开与OpenAI、Google在北美正面对抗;2025年10月以来,曾在印尼、马来西亚、墨西哥和英国等地位列谷歌应用商店免费下载榜前20名,墨西哥MAU已达829万人,英国MAU突破100万人 [41][87] 短期营销活动对格局的影响 - **红包营销属短期扰动**:春节期间的现金红包(如元宝10亿元、千问30亿元)和社交裂变有助于拉新获客,但长期竞争格局取决于产品核心竞争力及其决定的用户留存率 [7][31][56][79] - **豆包下载表现稳固**:尽管2025年11-12月千问、元宝在买量市场曝光显著高于豆包,但豆包在绝大部分时间内处于iOS免费下载榜第一名;元宝借助春节红包活动在近期排名实现暂时超越 [31][79] - **公司战略资源聚焦**:2026年1月29日,字节跳动CEO将公司年度关键词定为“勇攀高峰”,并明确短期内的重点就是做好豆包/Dola助手应用,意味着公司资源将向该业务高强度集中 [6][31][55][79]
中金:如何看待国内Chatbot“大战”?
中金点睛· 2026-02-05 07:52
国内Chatbot竞争格局核心观点 - 国内Chatbot竞争格局或已初定,基于豆包独特的“始于EQ,兼容IQ”产品定位及其在用户规模、粘性、留存率等数据上的全方位领先,其他应用或很难显著缩小与豆包的规模差距[3][12][13] 主要参与者春节竞争策略 - **字节跳动(豆包)**:2025年12月豆包DAU突破1亿,成为国内首个达成此数据的独立AI应用,并官宣火山引擎成为2026年总台春晚独家AI云合作伙伴,豆包将同步上线春晚互动玩法[8][9] - **腾讯(元宝)**:采用“社交+红包”春节组合拳,上线“元宝派”社交功能,并于2026年2月1日启动“分10亿”现金红包活动,旨在通过社交裂变获取增长[9][10] - **阿里巴巴(千问)**:2025年12月初成立“千问C端事业群”,2026年1月全面接入淘宝、支付宝等生态应用,上线超400项“AI办事”功能,并于2月启动投入高达30亿元人民币的“春节请客计划”,并独家冠名四家省级卫视春晚[8][9][10] 豆包的产品定位与竞争优势 - **独特定位**:豆包定位为“始于EQ,兼容IQ”,即更强调大模型的感性陪伴、鼓励等高情商(EQ)能力,同时兼容理性智能(IQ),这与其他更聚焦IQ的竞品形成核心差异化[3][14][15] - **产品体现**:豆包是主流Chatbot中唯一拥有拟人化形象(默认“桃子”)的产品,在实时语音、方言声线、音色定制等拟人化互动方面投入深入,其多模态能力特别是语音端到端模型早在2025年1月推出的豆包语音1.5版本中,聊天拟人化程度就超越了GPT-4o[16][22][23] - **用户数据验证**:豆包DAU于2025年12月突破1亿,DAU/MAU超过30%且持续提升,显著领先其他竞品约15%的水平,新用户30日留存率也明显领先,其用户使用峰值在晚上休息时间,区别于效率工具型应用的工作日峰值[4][30] - **综合能力不弱**:“始于EQ”不等于舍弃IQ,豆包在模型基础能力、多模态、长文本处理等IQ维度仍处于国内第一梯队,不弱于主要竞争对手[25][26] 竞争壁垒与追赶难度 - **系统性壁垒**:豆包的高情商是模型、产品、工程化、大数据等多项优化的综合结果,竞品追赶需系统性追赶,难以实现单点突破[4][36][37] - **战略与路径依赖**:竞品如千问强调“办事”的Agent能力,元宝侧重“社交”,可能因对自身生态优势的路径依赖或对“智能”的传统定义,并未全力跟进情感化路线[36] - **数据飞轮效应**:豆包凭借用户规模优势可能进入数据成长飞轮,进一步拉大与竞争者的差距[37] 海外市场拓展 - **豆包海外版Dola**:DAU在2025年底已突破1000万,MAU合计达到5593万人,采取“新兴市场优先”策略,聚焦印尼、墨西哥等市场,并已向英国等发达市场渗透[39][43][46] - **产品策略**:Dola界面和功能与豆包相似,强调免费、轻量、强实用性,其图像生成功能获得用户好评[43] 短期营销与长期格局 - **短期扰动有限**:春节红包等营销活动有助于拉新,但长期竞争格局取决于产品核心竞争力与用户留存,数据显示即便竞品买量曝光更高,豆包在绝大部分时间仍处于iOS下载榜第一名[39] - **公司战略聚焦**:字节跳动将2026年公司年度关键词定为“勇攀高峰”,短期内的山峰就是做好豆包/Dola助手应用,意味着公司资源将向AI助手业务高强度集中[9][39]
印奇挂帅一周抛“端侧王牌” 阶跃星辰Step 3.5 Flash演示电商“跨平台比价” 能否撬动AI终端革命?
每日经济新闻· 2026-02-05 00:05
阶跃星辰发布Step 3.5 Flash模型 - 公司正式发布面向Agent场景的开源基座模型Step 3.5 Flash [1] - 模型采用1960亿参数的稀疏MoE架构,具备256K上下文处理能力 [1] - 模型在单请求代码类任务中推理速度最高可达350 TPS [1][5] - 此次发布距离公司完成50亿元B+轮融资及宣布由印奇出任董事长仅一周 [1] 模型技术特点与性能 - Step 3.5 Flash在数学与推理、编码、智能Agent等基准测试中表现均排在前列 [1][4] - 350 TPS的生成速度显著高于主流大中型模型(20-80 TPS)和轻量级模型(80-150 TPS),能有效解决“打字机效应”并实现低于100ms的首字延迟 [5] - 模型通过稀疏MoE与MTP-3等技术,在降低激活参数的同时实现高速推理 [11] - 模型标志着国产模型竞争从“参数崇拜”转向“智能密度”,即从“更大”转变为“更聪明” [4] 模型应用场景与演示 - 模型可快速计算复杂数学题并输出正确答案,并可基于文字提示词进行智能体编程并输出可视化结果 [5] - 在官方演示中,模型作为“云端大脑”成功拆解了跨电商平台比价任务,识别出拼多多为最低价平台并提供购买指南 [6] - 该演示展现了模型对复杂长链条任务的拆解能力,能够理解“比价”背后的逻辑(搜价格、算优惠、比库存) [6] - 经济学家盘和林认为,此类应用场景对用户有吸引力,未来能与电商等App融合以增加获客量,有可能实现商业化落地 [6] 公司战略与行业定位 - 公司重心正快速向手机、PC及智能座舱等终端场景倾斜,印奇挂帅彰显出“模硬一体”的战略突破方向 [11] - 公司已与OPPO、吉利等合作探索终端侧Agent应用,例如OPPO已基于Step系列模型推出“一键问屏”等功能 [11] - 新模型的发布是公司不再单纯“卷”万亿参数闭源大模型的明确信号,转而专注于“能跑在端侧的顶级智力” [12] - 分析认为,如果公司继续采用开源战略,或许能抢夺AI新硬件市场的“安卓地位” [12] 行业竞争格局与发展趋势 - 智能体能力已成为国内大模型头部公司竞相角逐的核心,行业正进行新一轮密集上新 [1][8] - 阿里巴巴发布旗舰推理模型Qwen3-Max-Thinking,宣称其在Agent能力基准测试中刷新了SOTA纪录,并强调“模型+生态”闭环,已将千问App全面接入淘宝、支付宝、高德等业务 [8][9] - 月之暗面开源了万亿参数的多模态模型Kimi K2.5,其核心突破在于能够即时创建并协调上百个专项Agent并行工作,实现从“单一智能体”到“智能体集群”的演进 [8][10] - 围绕AI如何“落地办事”的规模化应用“巷战”已然打响,各公司展现出不同的战略路径 [1][9] Agent生态面临的挑战 - 技术专家田丰指出,让模型接入深度定制化终端在技术上并非难题,最大挑战来自于“生态主权” [7] - 现实挑战在于如何让淘宝、京东、美团等大型平台对Agent开放深层数据权限,而不仅是简单的网页爬取,这涉及商业利益链的重新分配 [7] - 田丰倡议互联网巨头能够提供标准商业API接口、MCP接口,让Agent能真正站在个人用户角度提供更好的贴身服务 [7]
国产头部云厂的进展与变化
2026-02-04 10:27
纪要涉及的行业或公司 * 本次电话会议主要讨论**阿里巴巴集团旗下的阿里云**业务[1] * 行业涉及**云计算**与**人工智能(AI)**,特别是**AI Agent**领域[1][37] 核心观点与论据:关于云服务涨价 * **涨价原因**:核心原因是几乎所有相关**硬件厂商**的部件价格出现**大幅提升**,同时客户对**AI**等新需求不断上升[2] * **涨价计划**: * **首批产品**:计划对**弹性服务器**中的**训练类**、**内存类机型**及**云主机**进行价格调整,后续可能根据情况调整**存储**产品[2] * **涨价幅度**:训练类或内存类机型价格预计上调**10%甚至以上**,对于级别较低或长尾客户,上调幅度可能更高[2] * **执行节奏**:预计在**4月初(4月1日左右)** 公布官网价格调整,此前会完成与绝大部分中大型客户(KA客户)的沟通[7][13] * **影响范围**:如果首批涨价成功,预计能影响整体收入的**20%左右**[21] * **客户策略**: * 主要针对**新签合同**,老客户大概率保持原价但不延展[16] * 目标是借此机会推动更多**PaaS产品**进入整体解决方案,向客户推广**全栈型**方案,通过方案绑定来提升客户价值[6][7] * 客户反馈呈现分化:**中大型客户**在方案优化和折扣调整后可能接受;**长尾客户**选择不多[8][9] * **行业背景**: * 海外云厂商也在涨价,但针对的产品不同(如AWS针对ML训练实例,谷歌针对CDN和网络),均是基于**需求增长**和**成本上升**对**紧缺资源**进行试探性调整[3][4][5] * 国内市场竞争激烈,但若硬件成本普涨,云厂商普遍采取**减少折扣**或**收紧折扣率**是必然趋势[7] * **成本与传导**: * 存储等硬件成本约占云计算总成本的**20%~25%**[27] * 硬件涨价传导至云厂商存在周期,主力产品通过**长期协议(LTA)** 采购,平均传导周期约为**6个月**[28][29] * **财务影响**: * 预计涨价及需求增长将带来利润率改善,但幅度有限,可能是**低单位数**(如2%-3%)的改善,因公司仍处于持续投入期[30] * 海外业务利润率**优于国内**,海外同样规格的ECS实例价格比国内高约**15%**,且海外业务增速较快,对整体利润率有正向贡献[68][76][77] 核心观点与论据:关于AI Agent布局 * **整体策略**:构建**Agent Infra**(基础设施),提供低成本开发与运行Agent的平台(如AgentScope),并在**C端**和**B端**同时推进应用[40] * **C端产品**: * **千问APP**:聚焦生活相关场景,已于1月15日上线,并计划投入**30亿**进行补贴[41][70] * **Coder Work**:一款类似Cursor的、面向**PC办公场景**的AI编程产品,目前处于邀测,将面向全部用户[42][45][49] * **B端/企业端产品**: * **百炼平台**:面向企业客户的大模型开发平台[43] * **钉钉**:预计将在企业端,特别是**SMB(中小型企业)** 市场,结合AI做更多动作[43][44] * **模型与竞争**: * 竞争的核心差异在于**模型能力**与**单Token成本**[53] * 在办公Agent产品层面,各家技术架构(本地沙盒+存储+大模型)差异不大,最终用户体验取决于**大模型能力**(如意图识别、工作流规划)[55][59] * **对算力需求的影响**: * Agent的普及将增加对**CPU**的需求,因为需要CPU承担更多的逻辑控制、API调用和沙箱管理任务[60][61] * 对CPU的要求可能集中在**核心数量多**、**单核性能高**(如3GHz以上)并支持超线程技术的型号上[62] 其他重要内容:业务运营与展望 * **业绩展望**: * **全年营收目标**:共识约为**1900亿**(货币单位未明确,应为人民币)[63] * **近期增速**:上个季度(Q4)预计能保持**30%多**的增速,本季度(Q1)需求端和资源上架情况显示能保持健康增长[63] * **客户需求**: * 头部客户年度采购额计划有提升,例如有的**大客户**计划提升**15%** 左右,部分客户因AI应用增加预算[65][66] * **Token消耗**: * 目前日均为**23万至25万**左右[69] * 结构上,**外部客户**通过百炼和API调用占比**六成多**;**内部使用**(含千问)占比约**35%**,其中**淘天**和**AliExpress**占比最高,**千问**目前第二,且其占比在2月6日活动后可能大幅提升[69][70][71] * **内部结算**:阿里集团内部子公司与阿里云采用标准结算,内部客户折扣率比外部大客户**稍低**(例如外部5折,内部可能4-4.5折)[72] * **国内外市场差异**: * **利润率差异原因**:国内**IaaS**(基础资源)占比仍较高,大客户使用PaaS积极性相对较低;同时,类似Office 365的**SaaS订阅收入**模式在国内较难实现[78][79] * **价格水平**:国内同类云产品(如ECS)按官网标价计算,约为海外(如AWS EC2)的**60%-80%**(即6-8折)[81][82] * **竞争态势**:国内小客户对**价格极度敏感**,导致过往价格战激烈;近期价格竞争主要体现在**Token价格持续下降**,以及小客户对资源价格的关注[83]
李想朋友圈: Agent会十倍、百倍放大人与人的差距
理想TOP2· 2026-02-04 09:44
对AI生产力发展的观察 - 公司创始人认为AI智能体(Agent)的实际效果并非缩小而是会十倍、百倍地放大人与人的能力差距[1] - 当前人类消费需求和可用时间的增长速度暂时远落后于生产力增长 导致一段时间内生产力增长更多表现为内卷和通缩[1] 对现象级AI产品的观察 - 2025年全年最具突破性的三个现象级AI产品为Claude Code 豆包手机和Manus[3] - 2026年仅第一个月就出现了三个现象级AI产品 分别为OpenClaw MoltBook和Chrome Gemini[3]
刚刚,真正好用的Windows版「Cowork」上线了
机器之心· 2026-02-04 09:04
产品发布与核心定位 - 昆仑天工正式发布全新的Agent产品——天工Skywork桌面版,并旗帜鲜明地将Windows平台作为首发阵地,旨在为全球用户提供开箱即用的「Cowork平替」[1][4] - 该产品原生支持Windows系统,无需繁琐迁移或适配,可对海量本地历史文件和复杂项目场景进行自动化处理,打通了个人Agent进入真实办公场景的「最后一公里」[5] - 在全球竞品如Claude Cowork、OpenAI Codex等优先适配macOS的生态失衡背景下,Skywork桌面版打响了针对「Windows生产力人群」的抢位战[4][11] 产品功能与性能特点 - **多模型支持**:与Claude Cowork仅支持自家模型不同,Skywork增加了对谷歌Gemini系列模型的支持,用户可自由选择Gemini 3 Pro、Claude Opus 4.5、Claude Sonnet 4.5等模型,也可启用智能路由「auto」模式自动匹配最佳模型[7] - **全文件格式处理**:产品能跨文件、跨格式直接读取并理解图片、视频、表格、Word、Excel、PDF、PPT等全类型文件,进行归类整理或生成新内容[8] - **多任务与本地执行**:能同时响应并执行多项复杂任务,且所有处理在本地环境完成,无需上传云端,消除了用户对数据泄露的担忧[9] - **内置技能库**:内置了100+个经过精选的、真正有用的Skills技能包,操作灵活,覆盖Office三件套生成、网页生成以及图像与视频生成[9] - **创作场景优势**:在图像与视频生成的创作场景中,相较于Claude Cowork,在语义遵循、表现力、专业性等多方面均更胜一筹[9] - **价格优势**:用户只需支付19.99美元的Basic会员费,即可解锁完整的产品体验[10] 实测应用案例 - **PPT自动生成**:用户只需提供Word文档和视频素材文件夹,并告知制作PPT的需求,Skywork能自行分析需求、寻找素材并生成可供修改的PPT初稿,过程中还会与用户互动选择风格[13][14][15] - **复杂文件整理**:在测试中,Skywork成功在不删除任何原始文件的基础上,将文件夹内所有内容整理成清晰的目录结构,并生成报告;任务共整理了194个文件,发现了4个重复文件,并生成了包含学术、研究、商业、语言学习、工作文档等分类的新文件夹结构[17][18][20] - **图文报告生成**:根据需求,Skywork能自动搜索网络信息,规划撰写路径,并生成一份图文并茂的「下一代AI推理算力基础设施提案」意向报告[21][22][23][24] - **SEO网页生成**:能够根据文档和图片,精准提取核心语义、优化视觉素材,并自主编写符合SEO逻辑的代码,生成信息齐全、布局合理的精美网页[25][26][27] - **智能体能力进化**:实测表明,此类智能体助手已不再是简单的对话执行工具,在获得更高系统操作权限后,其自主性得到史诗级强化,可在极少人为参与下高效完成复杂工作[28] 行业趋势与竞争格局 - **发展阶段**:2025年被普遍认为是Agent落地元年,而2026年正见证新一轮爆发;行业观点认为,2025年是编程智能体元年,而2026年将是个人助理智能体元年[30][31] - **竞争态势**:年初Agent赛道竞争白热化,国外有Anthropic发布Cowork、OpenClaw,国内有阿里上线千问APP任务助理和桌面端QoderWork,其他大模型独角兽也陆续推出桌面智能体应用[30] - **行业影响**:Agent正在以前所未有的速度与深度重构数字世界的底层逻辑,通过连接本地操作系统,实现跨文件管理、跨应用操作和复杂任务并行执行,有望将人类从繁琐任务中解脱,驱动走向以Agent为主导的超级个体时代[31][34] - **竞争关键**:随着Agent底层模型和执行框架被开源社区大量解构,赛道几乎不存在「技术秘密」,主流厂商均有能力自研,因此竞争胜负手转向了场景垂直与生态适配[34] - **公司优势**:昆仑天工早在2025年5月即发布了「AI版Office」——天工超级智能体(Skywork网页版),积累了丰富的办公场景效率优化经验和庞大的AI办公用户基础;其桌面版依托全球最大的生产力平台Windows,并灵活支持多模态与逻辑推理模型,在办公场景效率优化及与其他应用场景的联动中构筑护城河[35] - **市场展望**:在Agent竞争中,可能不会出现「赢家通吃」的局面,谁能更快建立起无法替代的相对优势,谁就可能成为最后的赢家[33][34][36]